Python图片识别文字开源库EasyOCR使用教程
2024.01.08 03:48浏览量:22简介:本文将介绍如何使用Python图片识别文字开源库EasyOCR进行文字识别。我们将通过安装、基本使用和高级应用三个部分来详细介绍EasyOCR的使用方法。
千帆应用开发平台“智能体Pro”全新上线 限时免费体验
面向慢思考场景,支持低代码配置的方式创建“智能体Pro”应用
立即体验
一、EasyOCR的安装
EasyOCR是一个基于Python的图片文字识别库,可以通过命令行或Python代码调用。要安装EasyOCR,首先确保你的Python环境已经安装了PIL库。如果尚未安装,可以通过以下命令进行安装:
对于Python 2.x:
pip install pillow
对于Python 3.x:
pip3 install pillow
接下来,通过以下命令安装EasyOCR:
pip install easyocr
二、EasyOCR的基本使用
- 通过命令行进行文字识别
安装完EasyOCR后,可以通过命令行工具来进行文字识别。打开终端或命令提示符,进入图片所在目录,然后运行以下命令:
easyocr input_image.jpg output_text.txt
其中,input_image.jpg是要识别的图片文件名,output_text.txt是识别结果输出文件名。运行命令后,EasyOCR将自动完成文字识别,并将结果输出到指定的文本文件中。 - 通过Python代码进行文字识别
除了命令行工具外,EasyOCR还提供了Python API供开发者使用。以下是一个简单的示例代码:
from easyocr import Reader
reader = Reader([‘en’, ‘ch_sim’]) # 初始化识别器,支持英文和简体中文
with open(‘input_image.jpg’, ‘rb’) as f: # 读取图片文件
result = reader.readtext(f)
print(‘识别的文字:’)
for line in result:
print(line[1]) # 输出每行的识别结果,每个结果为一个字符串列表,每个字符串表示一行文字。
三、EasyOCR的高级应用 - 多语言支持
EasyOCR支持多种语言,包括英文、中文、德文、法文等。在初始化识别器时,可以通过传递语言代码列表来指定需要支持的语言。例如,以下代码将初始化一个支持英文和简体中文的识别器:
from easyocr import Reader
reader = Reader([‘en’, ‘ch_sim’]) - 调整识别精度和速度
EasyOCR提供了多种识别精度和速度的配置选项。可以通过调整参数来平衡识别精度和速度。例如,以下代码将初始化一个支持英文的识别器,并设置使用较低精度的模型进行快速识别:
from easyocr import Reader, RecognitionConfig, RecognitionSession,
GPUConfig, Decoder, FullModeParams, ReadFile, DecodeMode,
RecognitionResult, RecognitionResultData, RecognitionResultText,
RecognitionResultLine, RecognitionResultWord,
RecognitionResultChar,
RecognitionResultRect,
RecognitionResultPage, RecognitionConfigDefault,
freadline,
i2a = Reader([‘en’], [‘0’]) # 这里添加一个配置参数 ‘0’
rconfig = RecognitionConfig(decoder=Decoder.TENSOR_NET,\n gpu_config=GPUConfig(use_gpu=True),\n params=FullModeParams(mode=DecodeMode.FULL))# 指定识别模式为FullMode
session = RecognitionSession(i2a, rconfig)
pdf = read_file(pdf_path)
pdf = session.recognize(pdf)
pdf.save(pdf_output)

发表评论
登录后可评论,请前往 登录 或 注册