Python中如何实现文字识别功能
发表于:2025-01-24 作者:千家信息网编辑
千家信息网最后更新 2025年01月24日,这期内容当中小编将会给大家带来有关Python中如何实现文字识别功能,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。环境和配置要求整体是用Python实现,所需要使用
千家信息网最后更新 2025年01月24日Python中如何实现文字识别功能
这期内容当中小编将会给大家带来有关Python中如何实现文字识别功能,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
环境和配置要求
整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller
指令安装。
百度接口
打开https://cloud.baidu.com/,
如未注册请先注册,然后登录点击管理控制台,点击左侧产品服务→人工智能→文字识别,点击创建应用,输入应用名称如Baidu_OCR,选择用途如学习办公,最后进行简单应用描述,即可点击立即创建。
会出现应用列表,包括AppID、API Key、Secret Key等信息,这些稍后会用到。
具体实现步骤
整个程序的大致思路是,在用截图软件获得截图之后,交给百度接口识别,并返回结果,当然,也可以是本地图片识别,我用的是QQ自带截图软件,快捷键CTRL+ALT+A
用来打开截图,在选中所截区域后,按Enter键即可保存到粘贴板中,也可用其他截图软件。
①获取截图
keyboard类库是用来监听键盘动作的,所以在有快捷键按下之后,便会有相应动作。并用PIL中的ImageGrab来获取到剪切板中的图片并生成本地图片文件。
#1.截图
keyboard.wait('ctrl+alt+a')
print('开始截图')
keyboard.wait('enter')
print('保存截图')
time.sleep(0.1)
#2.保存图片
image = ImageGrab.grabclipboard()
image.save('img.png')
②调用Baidu aip识别并打印文字
先用注册时生成的应用的AppID、API Key、Secret Key初始化应用,再读取保存到的图片并打印识别的文字。
with open('img.png', 'rb') as fp:
image = fp.read()
text_list = client.basicAccurate(image)['words_result']
for text in text_list:
print(text['words'])
运行结果如图所示:
上述就是小编为大家分享的Python中如何实现文字识别功能了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
截图
应用
文字
图片
软件
功能
内容
动作
快捷键
接口
步骤
结果
分析
生成
中小
产品服务
人工
人工智能
内容丰富
区域
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
软件开发感应车辆是否进入
软件开发属不属于高企收入
深空之眼有什么服务器
干软件开发的人很忙吗
极限编程软件开发阶段策略
数据库代码建表
网络安全盈利股
易鲸捷数据库两个日期算月份函数
学习计算机与网络技术
temp数据库收缩报错
服务器安全基线表格
微信第三方软件开发
湛江报价软件开发
服务器如何限制电脑登录
网络技术开发方案报价表
不是常见的分布式数据库技术
怎么进服务器我的世界网易
网络技术与应用工程
citespace英文数据库
将电脑配置为tcp服务器
湖南通讯软件开发创意
机房服务器管理规定
宁波网络技术开发报价
浙江省互联网新科技
远程mysql数据库
手机号码怎么保障网络安全
oem服务器没核显怎么配命令
怎样学软件开发编程
mysql数据库技术考试
北京交大网络技术