Python词频统计的方法有哪些
发表于:2024-11-17 作者:千家信息网编辑
千家信息网最后更新 2024年11月17日,这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。统计文件里每个单词的个数思路:分别统计文档中的单词,与出现
千家信息网最后更新 2024年11月17日Python词频统计的方法有哪些
这篇文章将为大家详细讲解有关Python词频统计的方法有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
统计文件里每个单词的个数
思路:
分别统计文档中的单词,与出现的次数
用两个列表将其保存起来,最后再用zip()函数连接输出**
想法成立开始实践
方法一:
# 导入文件with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # 用空字符来代替换行 words +是为了不被覆盖无+将只有最后一条数据 # print(i.replace("\n","").split(" "))setWords = list(set(words)) # 集合自动去重num = [] # 统计一个单词出现的次数for k in setWords: count = 0 for j in words: if k == j: count = count + 1 num.append(count)print(num)print(setWords)# 输出for x, y in zip(setWords, num): # 将两个列表用zip结合 print(x + ":" + str(y))、
效果图:
方法二:
此方法用来字典,较前一个相对简洁一点
# 导入with open("passage.txt", 'r') as file: dates = file.readlines()# 处理words = []for i in dates: words += i.replace("\n", "").split(" ") # print(i.replace("\n","").split(" "))# setWords=list(set(words)) #可以不用这个print(words)print("-" * 40)# print(setWords)diccount = dict()for i in words: if (i not in diccount): diccount[i] = 1 # 第一遍字典为空 赋值相当于 i=1,i为words里的单词 # print(diccount) else: diccount[i] = diccount[i] + 1 # 等不在里面的全部遍历一遍赋值就都在里面了,我们再来记数print(diccount)
效果图:
统计的文档
关于"Python词频统计的方法有哪些"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
统计
方法
单词
篇文章
词频
两个
字典
效果
效果图
文件
文档
更多
次数
处理
输出
不错
实用
简洁
不用
个数
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
上海小佘互联网科技有限公司
服务器多个tomcat
服务器开机时间怎么调
如何搭建云服务器渲染
软件开发培训演讲
软件开发自定义函数
好天气预报软件开发
惠州网络安全哪家好
文旅局网络安全自查报告
maven配置代理服务器
组织部网络安全报告
医院住院管理系统数据库性能需求
网络安全53号令
收录标准的数据库是
专业攻击服务器
木兰软件开发系统
加强信息网络安全防护的措施办法
彭山区地籍数据库项目招标结果
江苏网络时间服务器安装虚拟主机
掌上林甸网络安全小卫士投票
Excel建立共享数据库
网络安全五点主张秉持
数据库连接错误12557
h3c服务器管理口装系统
战地连不上ea服务器
来源数据库是什么
济南应用软件开发收费多少
江阴所有的软件开发公司
配置内网服务器
牟平西关海德软件开发招聘