Python 提取图片中的文字:英文与中文
2024.01.08 04:09浏览量:12简介:本文将介绍如何使用 Python 从图片中提取英文和中文文字。我们将使用 OCR(光学字符识别)技术来实现这一目标。我们将使用两个流行的 OCR 库:Tesseract 和 PaddleOCR。首先,确保你已经安装了这两个库。如果还没有安装,可以使用以下命令进行安装:
千帆应用开发平台“智能体Pro”全新上线 限时免费体验
面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用
要使用 Python 从图片中提取英文和中文文字,你可以使用 OCR(光学字符识别)技术。OCR 是一种将图片中的文字转换为可编辑的文本格式的技术。在 Python 中,有两个流行的 OCR 库可供选择:Tesseract 和 PaddleOCR。这两个库都支持多种语言,包括英文和中文。
首先,确保你已经安装了这两个库。如果还没有安装,可以使用以下命令进行安装:
pip install pytesseract
pip install paddlepaddle
pip install paddleocr
安装完成后,你可以使用以下代码来提取图片中的英文和中文文字:
# 导入所需的库
import pytesseract
from PIL import Image
from paddleocr import PaddleOCR, draw_ocr
# 初始化 OCR 引擎
ocr = PaddleOCR()
# 读取图片文件
image = Image.open('example.jpg')
# 使用 OCR 引擎提取文字
result = ocr.ocr(image)
# 打印提取的文字
for line in result:
line_text = ' '.join([word_info[-1] for word_info in line])
print(line_text)
在这个例子中,我们使用了 PaddleOCR 库来提取文字。首先,我们导入了所需的库,包括 pytesseract、PIL 和 PaddleOCR。然后,我们初始化了一个 PaddleOCR 对象。接下来,我们使用 PIL 库中的 Image.open() 方法读取图片文件。然后,我们调用 ocr.ocr() 方法来提取文字,并将结果存储在 result 变量中。最后,我们遍历 result 中的每一行,并打印出每一行中的文字。
需要注意的是,这个例子仅仅是一个简单的演示,实际应用中可能需要进行更多的错误处理和优化。另外,如果你需要提取其他语言的文字,你可能需要使用其他支持该语言的 OCR 库。

发表评论
登录后可评论,请前往 登录 或 注册