Python 提取图片中的文字:英文与中文

作者:有好多问题2024.01.08 04:09浏览量:12

简介:本文将介绍如何使用 Python 从图片中提取英文和中文文字。我们将使用 OCR(光学字符识别)技术来实现这一目标。我们将使用两个流行的 OCR 库:Tesseract 和 PaddleOCR。首先,确保你已经安装了这两个库。如果还没有安装,可以使用以下命令进行安装:

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用

立即体验

要使用 Python 从图片中提取英文和中文文字,你可以使用 OCR(光学字符识别)技术。OCR 是一种将图片中的文字转换为可编辑的文本格式的技术。在 Python 中,有两个流行的 OCR 库可供选择:Tesseract 和 PaddleOCR。这两个库都支持多种语言,包括英文和中文。
首先,确保你已经安装了这两个库。如果还没有安装,可以使用以下命令进行安装:

  1. pip install pytesseract
  2. pip install paddlepaddle
  3. pip install paddleocr

安装完成后,你可以使用以下代码来提取图片中的英文和中文文字:

  1. # 导入所需的库
  2. import pytesseract
  3. from PIL import Image
  4. from paddleocr import PaddleOCR, draw_ocr
  5. # 初始化 OCR 引擎
  6. ocr = PaddleOCR()
  7. # 读取图片文件
  8. image = Image.open('example.jpg')
  9. # 使用 OCR 引擎提取文字
  10. result = ocr.ocr(image)
  11. # 打印提取的文字
  12. for line in result:
  13. line_text = ' '.join([word_info[-1] for word_info in line])
  14. print(line_text)

在这个例子中,我们使用了 PaddleOCR 库来提取文字。首先,我们导入了所需的库,包括 pytesseract、PIL 和 PaddleOCR。然后,我们初始化了一个 PaddleOCR 对象。接下来,我们使用 PIL 库中的 Image.open() 方法读取图片文件。然后,我们调用 ocr.ocr() 方法来提取文字,并将结果存储在 result 变量中。最后,我们遍历 result 中的每一行,并打印出每一行中的文字。
需要注意的是,这个例子仅仅是一个简单的演示,实际应用中可能需要进行更多的错误处理和优化。另外,如果你需要提取其他语言的文字,你可能需要使用其他支持该语言的 OCR 库。

article bottom image

相关文章推荐

发表评论