使用Python进行批量图片和PDF的OCR识别与重命名

作者：谁偷走了我的奶酪2024.01.08 03:31浏览量：5

简介：介绍如何使用Python进行批量图片和PDF的OCR识别，以及如何将识别的文字用于重命名图片。

千帆应用开发平台“智能体Pro”全新上线限时免费体验

面向慢思考场景，支持低代码配置的方式创建“智能体Pro”应用

要实现批量图片和PDF的OCR识别，并将识别的文字用于重命名图片，我们可以使用Python结合一些强大的库来完成。这里是一个大致的步骤指南：
步骤1：安装必要的库
首先，你需要安装一些Python库，包括但不限于pytesseract（用于OCR识别）、pdf2image（用于从PDF提取图像）和Pillow（用于处理图像）。你可以使用pip来安装这些库：

pip install pytesseract pdf2image Pillow

步骤2：批量OCR识别
接下来，你需要一个循环来处理所有的图片或PDF文件。对于图片文件，你可以使用pytesseract.image_to_string方法直接从图像中提取文本。对于PDF文件，你可能需要先将它们转换为图像，然后再进行OCR识别。
这里是一个简单的例子，展示如何从一组图片中提取文本：

import pytesseract
from PIL import Image
import os
# 更改到你的图片文件夹路径
img_folder = 'path_to_your_image_folder'
output_folder = 'path_to_output_folder'
# 遍历文件夹中的所有图片文件
for filename in os.listdir(img_folder):
if filename.endswith('.jpg') or filename.endswith('.png'):  # 确保只处理图片文件
img = Image.open(os.path.join(img_folder, filename))
text = pytesseract.image_to_string(img)
# 这里你可以将识别的文本保存到文件或其他地方
print(f'Extracted text from {filename}: {text}
')

对于PDF文件，你可以使用pdf2image将它们转换为图片，然后像上面那样处理。转换PDF文件的代码如下：

from pdf2image import convert_from_path
import os
# 更改到你的PDF文件夹路径
pdf_folder = 'path_to_your_pdf_folder'
output_folder = 'path_to_output_folder'
# 遍历文件夹中的所有PDF文件
for filename in os.listdir(pdf_folder):
if filename.endswith('.pdf'):  # 确保只处理PDF文件
images = convert_from_path(os.path.join(pdf_folder, filename))
for i, img in enumerate(images):  # 对转换后的每个图像进行处理
text = pytesseract.image_to_string(img)
# 这里你可以将识别的文本保存到文件或其他地方，比如：重命名图像文件
new_filename = f'{filename[:-4]}_{i}_{text}.png’  # 示例：将识别的文本添加到文件名中
img.save(os.path.join(output_folder, new_filename))

请注意，上述代码仅作为示例，你可能需要根据实际需求进行调整。例如，你可能需要调整OCR识别的参数或对提取的文本进行进一步处理。此外，对于PDF文件，你可能还需要处理多页的情况。

发表评论

开发者关注产品榜

最热文章

关于作者

谁偷走了我的奶酪

1631871被阅读数
20被赞数
11被收藏数

开发者热搜

使用Python进行批量图片和PDF的OCR识别与重命名

千帆应用开发平台“智能体Pro”全新上线限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

谁偷走了我的奶酪

使用Python进行批量图片和PDF的OCR识别与重命名

千帆应用开发平台“智能体Pro”全新上线 限时免费体验

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

千帆大模型服务与开发平台ModelBuilder

千帆大模型应用开发平台AppBuilder

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者

谁偷走了我的奶酪

千帆应用开发平台“智能体Pro”全新上线限时免费体验