Python怎么统计西游记用字的数量
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,本篇内容主要讲解"Python怎么统计西游记用字的数量",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python怎么统计西游记用字的数量"吧!一、数据xy
千家信息网最后更新 2025年01月23日Python怎么统计西游记用字的数量
本篇内容主要讲解"Python怎么统计西游记用字的数量",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python怎么统计西游记用字的数量"吧!
一、数据
xyj.txt,《西游记》的文本,2.2MB
致敬吴承恩大师,4020行(段)
二、目标
统计《西游记》中:
1. 共出现了多少个不同的汉字;
2. 每个汉字出现了多少次;
3. 出现得最频繁的汉字有哪些。
三、涉及内容:
1. 读文件;
2. 字典的使用;
3. 字典的排序;
4. 写文件
四、效果
五、源代码
# coding:utf8import sysreload(sys)sys.setdefaultencoding("utf8")fr = open('xyj.txt', 'r')characters = []stat = {}for line in fr: # 去掉每一行两边的空白 line = line.strip() # 如果为空行则跳过该轮循环 if len(line) == 0: continue # 将文本转为unicode,便于处理汉字 line = unicode(line) # 遍历该行的每一个字 for x in xrange(0, len(line)): # 去掉标点符号和空白符 if line[x] in [' ','', '\t', '\n', '。', ',', '(', ')', '(', ')', ':', '□', '?', '!', '《', '》', '、', ';', '"', '"', '……']: continue # 尚未记录在characters中 if not line[x] in characters: characters.append(line[x]) # 尚未记录在stat中 if not stat.has_key(line[x]): stat[line[x]] = 0 # 汉字出现次数加1 stat[line[x]] += 1print len(characters)print len(stat)# lambda生成一个临时函数# d表示字典的每一对键值对,d[0]为key,d[1]为value# reverse为True表示降序排序stat = sorted(stat.items(), key=lambda d:d[1], reverse=True)fw = open('result.csv', 'w')for item in stat: # 进行字符串拼接之前,需要将int转为str fw.write(item[0] + ',' + str(item[1]) + '\n')fr.close()fw.close()
到此,相信大家对"Python怎么统计西游记用字的数量"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!
西游
西游记
汉字
统计
数量
用字
内容
字典
尚未
文件
文本
空白
学习
排序
不同
实用
更深
频繁
一行
兴趣
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
服务器bmc管理口什么样子
怎么看服务器管理器
删除数据库描述错误
捷达网络技术有限公司
使命召唤暴雪服务器中断
普陀区手机软件开发流程
服务器添加环回网卡
微雨宝贝服务器下载电脑版
阿里云数据库报告
北京宏岳荣华网络技术
网络安全审计公告
web服务器代理器
书籍搜索软件开发
哪些网络安全公司和警察有合作
肆悦软件开发有限公司
桂林软件开发公司
云服务器试用3天
阿里云盘 服务器
如何在dbms上建立数据库
软件开发能做美工吗
数据库采用什么数据模型
计算机网络技术导图高清
服务器无法安装三合一客户端
阿里云服务器配置参数
微盟服务器
数据库系统绪论笔记
浪潮ps服务器如何数据备份
腾讯云开发服务器有多大
wps 随机提取一行数据库
你的网络安全是