千家信息网

solr自动聚类怎么实现

发表于:2024-11-18 作者:千家信息网编辑
千家信息网最后更新 2024年11月18日,这篇文章主要讲解了"solr自动聚类怎么实现",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"solr自动聚类怎么实现"吧!Solr 使用Carrot2完
千家信息网最后更新 2024年11月18日solr自动聚类怎么实现

这篇文章主要讲解了"solr自动聚类怎么实现",文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习"solr自动聚类怎么实现"吧!

Solr 使用Carrot2完成了聚类功能,能够把检索到的内容自动分类, Carrot2聚类示例:

要想Solr支持聚类功能,首选要把Solr发行包的中的dist/ solr-clustering-4.2.0.jar, 复制到\solr\contrib\analysis-extras\lib下.然后打开solrconfig.xml进行添加配置:

enable="${solr.clustering.enabled:true}"

class="solr.clustering.ClusteringComponent" >

default

org.carrot2.clustering.lingo.LingoClusteringAlgorithm

30

0.70

0

org.carrot2.clustering.lingo.SimpleLabelAssigner

1.5

8

8


HIGH

org.carrot2.matrix.factorization.NonnegativeMatrixFactorizationEDFactory

37500

2.0

0.9

org.carrot2.text.vsm.TfTermWeighting

CHINESE_SIMPLIFIED

org.carrot2.text.clustering.MultilingualClustering.LanguageAggregationStrategy.FLATTEN_MAJOR_LANGUAGE

true

true

true

true

true

true

true

0.65

false

2

true

1

1

clustering/carrot2

id



配好了聚类组件后,下面配置requestHandler:

startup="lazy"

enable="${solr.clustering.enabled:true}"

class="solr.SearchHandler">

explicit

true

default

true

category_s

content

path

true

clustering



有两个参数要注意carrot.title,carrot.snippet是聚类的比较计算字段,这两个参数必须是stored="true".carrot.title的权重要高于carrot.snippet,如果只有一个做计算的字段carrot.snippet可以去掉(是去掉不是值为空).设完了用下面的URL就可以查询了

http://localhost:8080/skyCore/clustering?q=*%3A*&wt=xml&indent=true

感谢各位的阅读,以上就是"solr自动聚类怎么实现"的内容了,经过本文的学习后,相信大家对solr自动聚类怎么实现这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是,小编将为大家推送更多相关知识点的文章,欢迎关注!

0