pycorrector怎么安装使用
发表于:2024-11-23 作者:千家信息网编辑
千家信息网最后更新 2024年11月23日,本文小编为大家详细介绍"pycorrector怎么安装使用",内容详细,步骤清晰,细节处理妥当,希望这篇"pycorrector怎么安装使用"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来
千家信息网最后更新 2024年11月23日pycorrector怎么安装使用
安装
使用例子
本文小编为大家详细介绍"pycorrector怎么安装使用",内容详细,步骤清晰,细节处理妥当,希望这篇"pycorrector怎么安装使用"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。
pycorrector 主要解决以下的中文输入场景。
谐音字词,如 配副眼睛-配副眼镜。
混淆音字词,如 流浪织女-牛郎织女。
字词顺序颠倒,如 伍迪艾伦-艾伦伍迪。
字词补全,如 爱有天意-假如爱有天意。
形似字错误,如 高梁-高粱。
中文拼音全拼,如 xingfu-幸福。
中文拼音缩写,如 sz-深圳。
语法错误,如 想象难以-难以想象。
可以使用 pip 安装。
pip install pycorrector
也可以下载源码后手动安装。
git clone https://github.com/shibing624/pycorrector.gitcd pycorrectorpython setup.py install
依赖库kenlm安装。
pip install https://github.com/kpu/kenlm/archive/master.zip
其他依赖库包安装。
pip install -r requirements.txt
1.文本纠错
import pycorrectorcorrected_sent, detail = pycorrector.correct('少先队员因该为老人让坐')print(corrected_sent, detail)
output:少先队员应该为老人让座 [[('因该', '应该', 4, 6)], [('坐', '座', 10, 11)]]
规则方法默认会从路径~/.pycorrector/datasets/zh_giga.no_cna_cmn.prune01244.klm加载kenlm语言模型文件,如果检测没有该文件,则程序会自动联网下载。当然也可以手动下载模型文件(2.8G)并放置于该位置。
2.错误检测
import pycorrectoridx_errors = pycorrector.detect('少先队员因该为老人让坐')print(idx_errors)
output:[['因该', 4, 6, 'word'], ['坐', 10, 11, 'char']]
返回类型是list, [error_word, begin_pos, end_pos, error_type],pos索引位置以0开始。
读到这里,这篇"pycorrector怎么安装使用"文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注行业资讯频道。
少先队
少先队员
文件
文章
老人
错误
中文
位置
内容
拼音
模型
爱有天意
织女
伍迪
艾伦
检测
妥当
牛郎织女
难以想象
例子
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全漏洞管理平台
服务器需要很好的显卡么
网络安全等级保障制度
武侠q传 服务器
恢复代理服务器
没有网络安全的企业
计算机网络技术发展探析
惠普服务器内存256m
有哪些数据库可免费查阅
cbm是 数据库
计算机网络技术与应用专业好吗
方舟手机版进服务器的教程
互联网科技有限公司的英文
桓台制造业软件开发
服务器网络设备维护需要多少钱
庞国莉 数据库
成都软件开发
负载均衡数据库如何配置
守望先锋怎么老是掉服务器
时序性数据库怎么设置
全国网络安全知识竞赛半决赛
cad跟软件开发
应天软件开发有限公司
网络安全etf指数基金
udp服务器失败
北京百度在线网络技术
tcp服务器搭建
网络安全设备的更替时间
手机软件开发公司简介
服务器电源指示灯不亮风扇不转