Python中Tf-idf怎么用
发表于:2024-11-18 作者:千家信息网编辑
千家信息网最后更新 2024年11月18日,这篇文章主要介绍了Python中Tf-idf怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。说明1、TF-IDF是如果词或词组出现
千家信息网最后更新 2024年11月18日Python中Tf-idf怎么用
这篇文章主要介绍了Python中Tf-idf怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
说明
1、TF-IDF是如果词或词组出现在文章中的概率较高,而在其他文章中很少出现,那么它就被认为具有很好的类别区分能力,适合进行分类。
2、提取文本特征,用来评估字词对文件集或某个语料库中文件的重要性。
实例
def tfidf_demo(): """ 用tfidf的方法进行文本特征提取 :return: """ # 1.将中文文本进行分词 data = ["一种还是一种今天很残酷,明天更残酷,后天很美好,但绝对大部分是死在明天晚上,所以每个人不要放弃今天。", "我们看到的从很远星系来的光是在几百万年之前发出的,这样当我们看到宇宙时,我们是在看它的过去。", "如果只用一种方式了解某样事物,你就不会真正了解它。了解事物真正含义的秘密取决于如何将其与我们所了解的事物相联系。"] data_new = [] for sent in data: data_new.append(cut_word(sent)) # print(data_new) # 2.实例化一个转换器类 transfer = TfidfVectorizer(stop_words=["一种", '因为']) # 3.调用fit_transform data_final = transfer.fit_transform(data_new) print("data_new:\n", data_final.toarray()) print("特征名字:\n", transfer.get_feature_names()) return None
感谢你能够认真阅读完这篇文章,希望小编分享的"Python中Tf-idf怎么用"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
篇文章
事物
文本
特征
残酷
实例
文件
文章
美好
重要
价值
兴趣
取决于
同时
名字
含义
大部分
宇宙
方式
方法
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
太原局域网存储服务器
山东加工软件开发包括哪些
广东网络安全保卫部门电话
黄岛区手机软件开发服务公司
网络技术对大众传播的作用
讯飞输入法关闭网络安全吗
软件开发使用多大的笔记本
mysql数据库起源
奉贤区品质数据库活动简介
江苏网络安全公司名单
关于网络安全画一年级
网络安全论文1500字大学生
中国联通集团网络技术研究院
服务器发布代码不生效
上海数据链网络技术供应
计算机网络安全明白纸
数据库怎样设置只允许密码登录
网络安全和信息化考核机制
漯河软件开发税务筹划解决方案
韶关自主可控软件开发销售厂
关于数据库的职位
软件开发需求分析模板文档
现代网络技术文化自信
网络安全 政府事业部总经理
数据库单例事务和线程安全
黑客入侵网络安全罪
图文类文章数据库设计
摩尔庄园的登录服务器有什么区别
中国云计算服务器中心
超图不动产登记数据库