怎么用Elasticsearch打造知识库检索系统
发表于:2024-11-30 作者:千家信息网编辑
千家信息网最后更新 2024年11月30日,本篇文章给大家分享的是有关怎么用Elasticsearch打造知识库检索系统,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。1、pdf、O
千家信息网最后更新 2024年11月30日怎么用Elasticsearch打造知识库检索系统
本篇文章给大家分享的是有关怎么用Elasticsearch打造知识库检索系统,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
1、pdf、Office类的文档如何被ES索引?
更确切的说,pdf、Office类文档(word,ppt,excel等)如何导入ES中。
如图所示:
问题转嫁为:如何将Office类文档、PDF文档导入ES建立索引,并提供全文检索服务?
2、Elasticsearch支持的最大待检索字段的长度是多大?
ES5.X版本以后,keyword支持的最大长度为32766个UTF-8字符,text对字符长度没有限制。
设置ignore_above后,超过给定长度后的数据将不被索引,无法通过term精确匹配检索返回结果。
参考:http://t.cn/RYlEMgn
参考6.0官网解读:http://t.cn/RYlELoV
参考luncene7.1API: http://t.cn/RYWvuGl
3、Office&pdf文档存入Elastisearch注意问题清单
少废话,直接上图。
4、解析实战代码
从功能和性能角度考量,建立知识库的建议如下:
1)知识库的核心是数据导入ES,导入ES的核心是各种类型文档的解析;
2)提前设定Mapping,定义好字段分词、不分词的策略;
3)对于大于1MB一个字段的存储,建议使用fvh高亮方式,在Mapping中一并设置。
以上就是怎么用Elasticsearch打造知识库检索系统,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
知识
文档
检索
知识库
长度
字段
索引
参考
系统
最大
字符
建议
数据
更多
核心
篇文章
问题
支持
实用
精确
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
胶州定制软件开发
哪些数据库属于考试类数据库
电商服务器安全架构
一体机服务器安全证书已过期
税控盘属于单击版还是服务器版
乡镇网络安全宣传部
维护校园网络安全建议
定义软件开发流程的核心
化学药物毒性数据库
企业服务器登录超时
网络安全宣传专题教育
网络安全知识例子
PICC软件开发中心北京
lol哪个服务器最惨
软件开发招标问答
网络技术与信息媒体
汕尾数据链软件开发市价
完美世界网络技术
服务商网络安全考试
2018网络安全各领域融资
安卓服务器发送网络请求
2020服务器级别笔记本推荐
分布式系统数据库
公务员网络技术岗位
服务器可以用笔记本读取吗
软件开发团队如何积分
软件开发专业好就业么
泉州聊天软件开发文档
网络安全校园日江苏
宝德网络安全梅振书