使用 PaddleOCR 进行图片文字识别的 Python 安装与使用教程

作者：有好多问题2024.01.08 12:01浏览量：63

简介：本文将指导你如何安装和使用 PaddleOCR，一个基于 PaddlePaddle 的开源 OCR（光学字符识别）工具，通过 Python 进行图片文字识别。

首先，你需要安装 PaddleOCR。你可以通过 pip 命令来安装：

pip install paddlepaddle paddleocr

安装完成后，你可以开始使用 PaddleOCR 进行图片文字识别。以下是一个简单的 Python 代码示例：

from paddleocr import PaddleOCR, draw_ocr
# 初始化 OCR 模型
ocr = PaddleOCR()
# 读取图片文件
image_path = 'your_image.jpg'
result = ocr.ocr(image_path, use_gpu=False)
# 打印识别结果
for line in result:
line_text = ' '.join([word_info[-1] for word_info in line])
print(line_text)

在上面的代码中，我们首先从 paddleocr 包中导入了 PaddleOCR 和 draw_ocr。然后，我们初始化了一个 PaddleOCR 对象。接下来，我们指定了要识别的图片路径，并使用 ocr 方法进行文字识别。最后，我们遍历识别结果并打印出每行的文字信息。
如果你想将识别结果可视化，可以使用 draw_ocr 方法：
```python
from paddleocr import PaddleOCR, draw_ocr, get_text_from_image
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
from matplotlib import pyplot as plt

初始化 OCR 模型

ocr = PaddleOCR()

读取图片文件并识别文字

image = cv2.imread(‘your_image.jpg’)
result = ocr.ocr(image, use_gpu=False)

将识别结果可视化并保存为图片文件

image = draw_ocr(image, result, font_path=’/path/to/font’) # font_path 指定字体路径，例如 ‘/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf’
image = Image.fromarray(np.uint8(image)) # 将 numpy array 转换为 PIL Image 对象
draw = ImageDraw.Draw(image) # 创建一个绘图对象用于绘制文本框等图形元素
font = ImageFont.truetype(‘/path/to/font’, 30) # 指定字体和大小，例如 ‘/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf’，30 表示字体大小为 30 点
draw.text((10,10), ‘Hello World!’, font=font, fill=(255,255,255)) # 在图像上绘制文本框和文本内容，这里在 (10,10) 位置绘制了 ‘Hello World!’ 文本框和文本内容，填充颜色为白色
image.save(‘output.jpg’) # 将可视化的结果保存为图片文件，这里是保存为 output.jpg 文件

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

使用 PaddleOCR 进行图片文字识别的 Python 安装与使用教程

初始化 OCR 模型

读取图片文件并识别文字

将识别结果可视化并保存为图片文件

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者