博客 python使用easyocr识别文字,准确率超高!

python使用easyocr识别文字,准确率超高!

   数栈君   发表于 2024-12-25 14:20  974  0

一、文档

https://www.jaided.ai/easyocr/documentation/

二、使用

1、安装

pip install easyocr

2、使用

import easyocr

# 创建EasyOCR Reader
reader = easyocr.Reader(['ch_sim', 'en'])

# 打开图像
image = 'F:/111.png'

# 使用EasyOCR进行文本提取
results = reader.readtext(image)

# 输出提取的中文文本
for (bbox, text, prob) in results:
print(text)

3、下载模型

运行过程中会自动下载模型,如果你的网络很慢,或者链接中断,可以手动下载这些模型,模型地址:
https://www.jaided.ai/easyocr/modelhub/

下载检测模型:CRAFT,然后下载 zh_sim_g2(中文语言) 和 english_g2(英文语言)即可,如果你有其它语言需要识别也可下载其它语言。解压后的.pth文件放入/home/user/.EasyOCR/model目录下。

4、配合pyautogui识别屏幕的文字

python操作windows桌面实现鼠标、键盘操作,python之pyautogui库文档详解
import easyocr
import pyautogui

# 创建EasyOCR Reader
reader = easyocr.Reader(['ch_sim', 'en'])

# 打开图像
# 指定要截取的区域
left = 365
top = 303
width = 553
height = 47

# 截取指定区域的屏幕截图
screenshot = pyautogui.screenshot(region=(left, top, width, height))

# 转换为字节数组
image_bytes = screenshot.tobytes()
screenshot.save("F:/222.png")
image = 'F:/222.png'

# 使用EasyOCR进行文本提取
results = reader.readtext(image)

# 输出提取的中文文本
for (bbox, text, prob) in results:
print(text)

————————————————

本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!

《数据资产管理白皮书》下载地址:https://www.dtstack.com/resources/1073/?src=bbs

《行业指标体系白皮书》下载地址:https://www.dtstack.com/resources/1057/?src=bbs

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001/?src=bbs

《数栈V6.0产品白皮书》下载地址:https://www.dtstack.com/resources/1004/?src=bbs

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群