Python中Tf-idf怎么用
发表于:2024-11-14 作者:千家信息网编辑
千家信息网最后更新 2024年11月14日,这篇文章主要介绍了Python中Tf-idf怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。说明1、TF-IDF是如果词或词组出现
千家信息网最后更新 2024年11月14日Python中Tf-idf怎么用
这篇文章主要介绍了Python中Tf-idf怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
说明
1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。
2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。
实例
def tfidf_demo(): """ 用tfidf的方法进行文本特征提取 :return: """ # 1.将中文文本进行分词 data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。", "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。", "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"] data_new = [] for sent in data: data_new.append(cut_word(sent)) # print(data_new) # 2.实例化一个转换器类 transfer = TfidfVectorizer(stop_words=["一种", '因为']) # 3.调用fit_transform data_final = transfer.fit_transform(data_new) print("data_new:\n", data_final.toarray()) print("特征名字:\n", transfer.get_feature_names()) return None
感谢你能够认真阅读完这篇文章,希望小编分享的"Python中Tf-idf怎么用"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
篇文章
事物
文本
特征
残酷
实例
文件
文章
美好
重要
价值
兴趣
取决于
同时
名字
含义
大部分
宇宙
方式
方法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
云服务软件开发应用
计算机网络技术在就业方面
网络安全阀
软件开发发不了论文
天津网络安全宣传周开幕
服务器有静电
泰捷软件开发公司
网络安全专业转行
数据库报表设计方法
微信用的数据库有哪些
微信突然数据库修复
vue使用sqlite数据库
azure sql数据库
信息与网络安全的概念
存储数据到数据库中
深圳新一代网络技术开发动态
华东师范大学网络安全考研专业
网络安全教育教案网虫
充值完服务器关闭的小说
BL计算机网络技术
中国网络安全法律法规有什么
网络安全方面有哪些职位
网络安全事件处理情况反馈
没有网络安全就没有 广大
呼伦贝尔网络安全检测
云服务器的弊端
优网互联网科技有限公司
谈谈对数据库管理系统的理解
金蝶怎么录初始数据库
计算机网络技术路由表更新