Python如何实现OCR识别
发表于:2025-01-19 作者:千家信息网编辑
千家信息网最后更新 2025年01月19日,这篇文章主要讲解了"Python如何实现OCR识别",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Python如何实现OCR识别"吧!Python实现O
千家信息网最后更新 2025年01月19日Python如何实现OCR识别
这篇文章主要讲解了"Python如何实现OCR识别",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"Python如何实现OCR识别"吧!
Python实现OCR识别:pytesseract
Python常用pytesseract进行图片上的文字识别,即OCR识别,完整的代码比较简单,只要下面一行即可,但是实际使用时环境配置上容易出错。
from PIL import Imageimport pytesseract text = pytesseract.image_to_string(Image.open("/Users/alice/Documents/Develop/PythonCode/textinphoto.PNG"))print(text)
因此使用前,需要先安装pillow和pytesseract依赖包。
然而运行时仍然报错,raise TesseractNotFoundError()
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it"s not in your path
原因是因为未安装tesseract,然后使用pip3 install tesseract之后仍然提示错误,如图:
alicedembp:~ alice$ pip3 install tesseractRequirement already satisfied: tesseract in /Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages (0.1.3)alicedembp:~ alice$ tesseract-bash: tesseract: command not found
无法使用,往上找了很多教程,说是要使用brew安装,于是得以解决,步骤为:
先安装brew
alicedembp:~ alice$ ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
再使用brew安装leptonica
alicedembp:~ alice$ brew install leptonica
使用brew安装tesseract
alicedembp:~ alice$ brew install tesseract
安装成功,通过命令行tesseract -v的方式查看是否成功,出现版本号则为安装成功
alicedembp:~ alice$ tesseractUsage: tesseract --help | --help-extra | --version tesseract --list-langs tesseract imagename outputbase [options...] [configfile...] OCR options: -l LANG[+LANG] Specify language(s) used for OCR.NOTE: These options must occur before any configfile. Single options: --help Show this help message. --help-extra Show extra help for advanced users. --version Show version information. --list-langs List available languages for tesseract engine. alicedembp:~ alice$ tesseract -vtesseract 4.0.0 leptonica-1.78.0 libgif 5.1.4 : libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.1 Found AVX2 Found AVX Found SSE
接下来就可以直接使用了,使用如下代码:
alicedembp:~ alice$ tesseract /Users/alice/Documents/Develop/PythonCode/textinphoto.png /Users/alice/Documents/Develop/PythonCode/output.txt
打开textinphoto.PNG的图片,将文字输出到output.txt,图片如下
运行成功,产生output.txt文档,里面的文本为图片中识别出的文字。
感谢各位的阅读,以上就是"Python如何实现OCR识别"的内容了,经过本文的学习后,相信大家对Python如何实现OCR识别这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!
成功
图片
文字
学习
代码
内容
运行
接下来
一行
原因
命令
实际
就是
常用
思路
情况
教程
文本
文档
文章
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
湖南智能软件开发市场报价
国家网络安全应急条例
广东crm软件开发商
网页数据库源码
包河区企业网络技术服务收费
数据库怎么添加实体
中国电信通信网络技术研究院
当下的网络安全形势
掌途网络技术有限公司官网
迅雷代理服务器要花钱吗
dns服务器如何设置的
软件开发工作好找不
数据库字典组
网络安全防火工作总结
有关党的网络安全主题
问道下载服务器列表
发票勾选认证平台的数据库
服务器硬件保修时间表
农安手机软件开发
数据库字段类型包括通用吗
瀚德网络技术有限公司怎么样
属于网络安全措施
sql清除表中重复数据库
手机网络安全如何检查
惠普塔式服务器维修站点
长春阳光网络技术有限公司
大华存储服务器怎样安装系统
数据库的安全性 完整性
怎么搭建服务器集群
联想服务器c盘分多大