使用 PaddleOCR 进行图片文字识别的 Python 安装与使用教程
2024.01.08 12:01浏览量:63简介:本文将指导你如何安装和使用 PaddleOCR,一个基于 PaddlePaddle 的开源 OCR(光学字符识别)工具,通过 Python 进行图片文字识别。
首先,你需要安装 PaddleOCR。你可以通过 pip 命令来安装:
pip install paddlepaddle paddleocr
安装完成后,你可以开始使用 PaddleOCR 进行图片文字识别。以下是一个简单的 Python 代码示例:
from paddleocr import PaddleOCR, draw_ocr# 初始化 OCR 模型ocr = PaddleOCR()# 读取图片文件image_path = 'your_image.jpg'result = ocr.ocr(image_path, use_gpu=False)# 打印识别结果for line in result:line_text = ' '.join([word_info[-1] for word_info in line])print(line_text)
在上面的代码中,我们首先从 paddleocr 包中导入了 PaddleOCR 和 draw_ocr。然后,我们初始化了一个 PaddleOCR 对象。接下来,我们指定了要识别的图片路径,并使用 ocr 方法进行文字识别。最后,我们遍历识别结果并打印出每行的文字信息。
如果你想将识别结果可视化,可以使用 draw_ocr 方法:
```python
from paddleocr import PaddleOCR, draw_ocr, get_text_from_image
import cv2
import numpy as np
from PIL import Image, ImageDraw, ImageFont
from matplotlib import pyplot as plt
初始化 OCR 模型
ocr = PaddleOCR()
读取图片文件并识别文字
image = cv2.imread(‘your_image.jpg’)
result = ocr.ocr(image, use_gpu=False)
将识别结果可视化并保存为图片文件
image = draw_ocr(image, result, font_path=’/path/to/font’) # font_path 指定字体路径,例如 ‘/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf’
image = Image.fromarray(np.uint8(image)) # 将 numpy array 转换为 PIL Image 对象
draw = ImageDraw.Draw(image) # 创建一个绘图对象用于绘制文本框等图形元素
font = ImageFont.truetype(‘/path/to/font’, 30) # 指定字体和大小,例如 ‘/usr/share/fonts/truetype/dejavu/DejaVuSans-Bold.ttf’,30 表示字体大小为 30 点
draw.text((10,10), ‘Hello World!’, font=font, fill=(255,255,255)) # 在图像上绘制文本框和文本内容,这里在 (10,10) 位置绘制了 ‘Hello World!’ 文本框和文本内容,填充颜色为白色
image.save(‘output.jpg’) # 将可视化的结果保存为图片文件,这里是保存为 output.jpg 文件

发表评论
登录后可评论,请前往 登录 或 注册