千家信息网

CentOS 7中怎么部署 tesseract-ocr

发表于:2024-09-30 作者:千家信息网编辑
千家信息网最后更新 2024年09月30日,CentOS 7中怎么部署 tesseract-ocr,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。官方地址 githu
千家信息网最后更新 2024年09月30日CentOS 7中怎么部署 tesseract-ocr

CentOS 7中怎么部署 tesseract-ocr,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

官方地址 github

yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/

若提示 yum-config-manager: command not found 执行以下语句

yum -y install yum-utils

之后继续执行

sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_keyyum updateyum install tesseractyum install tesseract-langpack-deu

语言包新增

官方有专门的语言包目录 语言包

cd /usr/share/tesseract/4/tessdata# 若没有wget 就 yum install wgetwget https://raw.githubusercontent.com/tesseract-ocr/tessdata/master/chi_sim.traineddata

执行命令

# tesseract {图片路径} {输出文件,默认后缀.txt} -l {指定语言包,chi_sim为简体中文}tesseract 1.jpg txt -l chi_sim

控制台打印

Tesseract Open Source OCR Engine v4.1.0 with LeptonicaWarning: Invalid resolution 0 dpi. Using 70 instead.Estimating resolution as 534

输出文件

[root@localhost ~]# ls1.jpg  anaconda-ks.cfg  txt.txt# 上面 txt.txt 就是输出的文件

输出文件内容

注:带花括号的为我认为替换掉内容,实际是有内容输出

《 账 单 详 情露 A(esot 〉-1,500.00交 易 成 功付 款 方 式 余 额 >转 账 备 注 转 账对 方 账 户 {户名} {手机号}创 建 时 间 2019-10-10 16:08订 单 号 _{单号第一行}889701账 单 分 类 转 账 充 值 >标 签 和 备 注 添 加 >查 看 往 来 记 录 >申 请 电 子 回 单 >

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。

0