千家信息网

wordmesh特性有哪些

发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,这篇文章主要介绍"wordmesh特性有哪些",在日常操作中,相信很多人在wordmesh特性有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"wordmesh特性有
千家信息网最后更新 2024年11月22日wordmesh特性有哪些

这篇文章主要介绍"wordmesh特性有哪些",在日常操作中,相信很多人在wordmesh特性有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"wordmesh特性有哪些"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

词云图相当于数据分析第一步-描述性统计。它能让我们更方便的从文本中抽取关键词,更好的把握文本的整体信息。

wordmesh使用spacy包里预装的语言模型来构建文本特征、基于图的算法来提取关键字、多维缩放以将这些关键字放在画布上等。

wordmesh特性:
  • 关键词抽取:除了基于词频的抽取方式,wordmesh还支持基于textrank、sgrank和bestcoverage的抽取方法。

  • 词语聚类:可以基于语义相似性、共线性和其他属性,在画布上绘制词语

  • 关键词过滤: 抽取的关键词可以基于该词语pos-tag或者命名实体过滤

  • 字体颜色和字体大小:字体的大小和颜色可以基于词频、pos-tag(情感极性)等进行设置。

例子

这是力导向(force-directed)算法的可视化。 这些单词是使用《international law》教科书中的textrank提取的,并根据它们的共现频率在画布上组合在一起。 颜色表示单词的pos标签。

这个是史蒂夫乔布斯在斯坦福的毕业典礼演讲。关键字使用textrank提取,并根据其textrank得分进行聚类。字体颜色和字体大小也是textrank得分的函数。

这是来自相同的文本,不过这里是基于关键字的共现频率进行了聚类。 相同聚类词语使用相同的标准来指定颜色。从单词的位置可以看出这一点。 你可以看到像'hungry'和'foolish'这样的词汇被组合在一起,因为它们在文本中彼此接近,作为着名引语"Stay hungry. Stay foolish"的一部分。

这是特朗普与希拉里克林顿之间2016年美国总统辩论中使用的所有形容词。 单词根据其含义进行聚类,字体大小表示使用频率,颜色对应于使用它们的候选者。

到此,关于"wordmesh特性有哪些"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

0