Python词频统计的方法有哪些
发表于:2024-11-17 作者:千家信息网编辑
千家信息网最后更新 2024年11月17日,这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。统计文件里每个单词的个数思路:分别统计文档中的单词,与出现
千家信息网最后更新 2024年11月17日Python词频统计的方法有哪些
这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
统计文件里每个单词的个数
思路:
分别统计文档中的单词,与出现的次数
用两个列表将其保存起来,最后再用zip()函数连接输出**
想法成立开始实践
方法一:
# 导入文件with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据 # print(i.replace("\n","").split(" "))setWords = list(set(words)) # 集合自动去重num = [] # 统计一个单词出现的次数for k in setWords: count = 0 for j in words: if k == j: count = count + 1 num.append(count)print(num)print(setWords)# 输出for x, y in zip(setWords, num): # 将两个列表用zip结合 print(x + ":" + str(y))、
效果图:
方法二:
此方法用来字典,较前一个相对简洁一点
# 导入with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # print(i.replace("\n","").split(" "))# setWords=list(set(words)) #可以不用这个print(words)print("-" * 40)# print(setWords)diccount = dict()for i in words: if (i not in diccount): diccount[i] = 1 # 第一遍字典为空 赋值相当于 i=1,i为words里的单词 # print(diccount) else: diccount[i] = diccount[i] + 1 # 等不在里面的全部遍历一遍赋值就都在里面了,我们再来记数print(diccount)
效果图:
统计的文档
关于"Python词频统计的方法有哪些"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
统计
方法
单词
篇文章
词频
两个
字典
效果
效果图
文件
文档
更多
次数
处理
输出
不错
实用
简洁
不用
个数
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
汽车软件开发需要多少钱
obs服务器和串流密码
国安委网络安全有什么商机
sql游戏管理系统数据库设计
自学c语言 软件开发
原油分析交易软件开发
中国网络安全HCIE
泰州进口网络技术
当代科技是互联网吗
网络安全法的义务
快递100用什么软件开发的
九台区网络技术服务欢迎来电
数据库表多对多
台州软件开发设计
威海银行服务器存储招标
sql server 数据库备份
北京市健康宝数据库是哪家的
代表建议建立入学DNA数据库
从备份文件中还原出数据库
软件开发企业财务部经理薪资待遇
数据库web 服务器集成部署
国家电网论文数据库在那里
网络安全 防范诈骗小常识
走数据库信号线
表单跟数据库校验
数据库导入imp
猎杀对决欧洲服务器
火影忍者类手游新服务器
平谷区信息网络技术推广系统
数据库设计是三大范式