千家信息网

solr自动聚类怎么实现

发表于:2025-01-25 作者:千家信息网编辑
千家信息网最后更新 2025年01月25日,这篇文章主要讲解了"solr自动聚类怎么实现",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"solr自动聚类怎么实现"吧!Solr 使用Carrot2完
千家信息网最后更新 2025年01月25日solr自动聚类怎么实现

这篇文章主要讲解了"solr自动聚类怎么实现",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"solr自动聚类怎么实现"吧!

Solr 使用Carrot2完成了聚类功能,能够把检索到的内容自动分类, Carrot2聚类示例:

要想Solr支持聚类功能,首选要把Solr发行包的中的dist/ solr-clustering-4.2.0.jar, 复制到\solr\contrib\analysis-extras\lib下.然后打开solrconfig.xml进行添加配置:

enable="${solr.clustering.enabled:true}"

class="solr.clustering.ClusteringComponent" >

default

org.carrot2.clustering.lingo.LingoClusteringAlgorithm

30

0.70

0

org.carrot2.clustering.lingo.SimpleLabelAssigner

1.5

8

8


HIGH

org.carrot2.matrix.factorization.NonnegativeMatrixFactorizationEDFactory

37500

2.0

0.9

org.carrot2.text.vsm.TfTermWeighting

CHINESE_SIMPLIFIED

org.carrot2.text.clustering.MultilingualClustering.LanguageAggregationStrategy.FLATTEN_MAJOR_LANGUAGE

true

true

true

true

true

true

true

0.65

false

2

true

1

1

clustering/carrot2

id



配好了聚类组件后,下面配置requestHandler:

startup="lazy"

enable="${solr.clustering.enabled:true}"

class="solr.SearchHandler">

explicit

true

default

true

category_s

content

path

true

clustering



有两个参数要注意carrot.title,carrot.snippet是聚类的比较计算字段,这两个参数必须是stored="true".carrot.title的权重要高于carrot.snippet,如果只有一个做计算的字段carrot.snippet可以去掉(是去掉不是值为空).设完了用下面的URL就可以查询了

http://localhost:8080/skyCore/clustering?q=*%3A*&wt=xml&indent=true

感谢各位的阅读,以上就是"solr自动聚类怎么实现"的内容了,经过本文的学习后,相信大家对solr自动聚类怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

内容 学习 两个 功能 参数 字段 配置 只有 完了 就是 思路 情况 文章 更多 权重 知识 知识点 示例 篇文章 组件 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 命令行登陆mongodb数据库 斯托克顿数据库 益阳市发展良好网络安全吗 成都工行软件开发中心地址 服务器启动但是显示器没有显示 达梦数据库打开实例 node数据库 提高效率的数据库管理方式 阿里云服务器有哪些安全 含财务预测的数据库 浪潮服务器无法连接管理口 教育行业网络安全培训 交警加强网络安全培训 修改数据库参数 中国移动网络技术岗是干嘛的 网络安全龙头股票成都 初次学网络安全遇到的问题 网络安全教育内容大学 敏捷软件开发适合什么项目 原神能实名认证两个服务器吗 mc火影忍者服务器推荐 网络安全专业有必要开设吗 网络技术对于一个国家的作用 超算服务器维修多少钱一台 北京字跳网络技术有限公司什么样 汉中软件开发培训 秒针嘀嗒网络技术有限公司 蜂来了互联网科技有限公司 合肥的互联网科技公司 access数据库是一个独立的
0