使用 PaddleOCR 进行图片文字识别的 Python 安装和示例

作者：渣渣辉2024.01.08 14:02浏览量：11

简介：介绍如何使用 PaddleOCR，一个基于 PaddlePaddle 的开源光学字符识别（OCR）工具，通过 Python 进行图片文字识别。

在 Python 中使用 PaddleOCR 进行图片文字识别需要经过几个步骤。首先，确保你已经安装了 Python 和 PaddlePaddle。然后，按照以下步骤进行操作：

安装 PaddleOCR
你可以使用 pip 命令来安装 PaddleOCR：
```
pip install paddlepaddle paddleocr
```
这将同时安装 PaddlePaddle 和 PaddleOCR。
导入必要的库
在你的 Python 脚本中，你需要导入 paddleocr 库。可以使用以下代码：
```
import paddleocr
```
加载模型
PaddleOCR 提供多种 OCR 模型，可以根据需要进行选择。你可以使用以下代码加载预训练模型：
```
ocr = paddleocr.StaticModel(use_gpu=False)  # 默认模型是 EAST
```
如果你想使用其他模型，可以指定模型名称，例如：
```
ocr = paddleocr.StaticModel(use_gpu=False, model_name='db_crnn')  # 使用 CRNN 模型
```

读取图片并进行识别
接下来，你可以使用以下代码读取图片并进行文字识别：

image_path = 'path/to/your/image.jpg'  # 替换为你的图片路径
result = ocr.ocr(image_path)

这将返回一个包含识别结果的列表，每个结果都是一个包含文本、置信度和边界框信息的元组。例如：

[  [  ('这是', 0.9997638892660214), ('第一行文字', 0.9999455473645574), ('第二行文字', 0.9998779385775016)],  [  ('这是', 0.9997638892660214), ('另一行', 0.9998779385775016), ('文字', 0.9998779385775016)]]

你可以根据需要进行进一步处理，例如提取文本、绘制边界框等。

可视化识别结果（可选）
如果你想可视化识别结果，可以使用 matplotlib 库将原始图片和带有边界框的识别结果进行可视化。以下是一个简单的示例：
python import matplotlib.pyplot as plt from PIL import Image import numpy as np image = Image.open(image_path).convert('RGB') # 打开图片并转换为 RGB 格式 plt.imshow(np.array(image)) # 将图片显示在 matplotlib 画布上 for line in result: # 遍历每一行识别结果 for text, score in line: # 遍历每个字符和置信度分数 text_box = [text[1] + text[3] / 2, text[2] - text[4] / 2, text[1] + text[3] / 2, text[2] + text[4] / 2] # 计算字符边界框的坐标 plt.gca().add_patch(plt.Rectangle((text_box[0], text_box[1]), text_box[2] - text_box[0], text_box[3] - text_box[1], fill=False, color='b', linewidth=2)) # 在图片上绘制边界框 plt.gca().text(text_box[0], text_box[1], f'{text} {score:.2f}', fontsize=12, color='black') # 在边界框内添加文本和置信度分数 plt.show() # 显示可视化结果这将显示带有边界框和置信度分数的识别结果。你可以根据需要进行调整和改进。希望这些信息能帮助你开始使用 PaddleOCR 进行图片文字识别。如果你有任何问题或需要进一步的帮助，请随时提问。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

使用 PaddleOCR 进行图片文字识别的 Python 安装和示例

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者