怎么用python读取utf-8编码格式的文本文件
发表于:2025-01-18 作者:千家信息网编辑
千家信息网最后更新 2025年01月18日,本篇内容介绍了"怎么用python读取utf-8编码格式的文本文件"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能
千家信息网最后更新 2025年01月18日怎么用python读取utf-8编码格式的文本文件
本篇内容介绍了"怎么用python读取utf-8编码格式的文本文件"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
# 读取utf-8编码格式的文本文件 # 这里Python解释器读取的是utf-8编码的字节流,然后再按指定的编码方式解释这些字节流# 这样就比较好理解乱码的原因#coding=utf-8 # When Python reads the encoding it tries to interpret the file as utf-8 # 告诉Python解释器编译时采用哪种编码方式# 如未设置编码方式,且解释器可识别文件(如utf-8编码格式的文件有的(与编辑器有关)带有BOM,可供解释器识别)编码方式则采用文件编码方式,反之采用终端默认编码方式import sys# reload(sys)# 指定终端默认编码方式# sys.setdefaultencoding('utf8')# 获取终端默认编码方式# sys.getdefaultencoding()import codecsdef ConvertCN(s): if s[:3] == codecs.BOM_UTF8: s = s[3:] # 若系统默认编码方式为acsii且未修改默认编码方式 # s.encode('gbk'):s(文件编码格式)--(.decode('ascii'))-->unicode--(.encode('gbk'))-->s(gbk编码格式) (这个过程由终端完成,未指定编码方式时将采用终端默认编码方式) # 兼容关系:ASCII --> ISO-8859-1 --> UNICODE(UTF-8,UTF-16,UTF-32) --> UCS(UCS2[与UNICODE兼容],UCS4), ASCII --> GB2312 --> GBK --> GB18030 # 因utf-8向下兼容ascii ascii不向上兼容utf-8,对此处s(utf-8编码格式)进行ascii解码成unicode时可能发生错误 return s.decode('utf-8')def PrintFile(filename): f = file(filename,'r') for f_line in f.readlines(): print ConvertCN(f_line) f.close() if __name__ == "__main__": PrintFile('OperCodingFile.txt') # Python输出的是字节流 打印由终端处理 # print 在终端显示如何是由终端决定的 """ 它大致讲解下python中的print原理: When Python executes a print statement, it simply passes the output to the operating system (using fwrite() or something like it), and some other program is responsible for actually displaying that output on the screen. For example, on Windows, it might be the Windows console subsystem that displays the result. Or if you're using Windows and running Python on a Unix box somewhere else, your Windows SSH client is actually responsible for displaying the data. If you are running Python in an xterm on Unix, then xterm and your X server handle the display. To print data reliably, you must know the encoding that this display program expects. 简单地说,python中的print直接把字符串传递给操作系统,所以你需要把str解码成与操作系统一致的格式。 Windows使用CP936(几乎与gbk相同),所以这里可以使用gbk。 """ print ConvertCN("\n****** 按任意键退出!*******") sys.stdin.readline()
"怎么用python读取utf-8编码格式的文本文件"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
编码
方式
格式
utf-8
终端
文件
解释
解释器
文本
系统
操作系统
内容
更多
知识
过程
有关
输出
实用
相同
一致
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全防疫体系建设
暗黑2 主机和pc服务器
网络安全知识的画
软件开发企业成本结转方法
网络安全策略可视化管理软件
从事软件开发有哪些工作岗位
数据库 测试工具
软件开发项目预算依据
长春网络安全宣传周一汽
计算机软件开发有哪些公司
软件开发曲靖
数据库的dump文件删除
sql数据库文件附加不上
服务器主机能用什么打印机
了解网络安全展会照片
福建数据中心服务器多少钱
大数据库管理师报名条件
深圳亿客传媒网络技术有限公司
网络安全手抄报图片 三年级
放心的软件开发商
系统集成里需要有软件开发吗
初中学历可以学网络安全
软件开发深度提高书籍
青云服务器
微数网络技术有限公司
软件开发优秀项目经理申请书
北研院网络技术与规划部
ebsco数据库 南大
数据挖掘网络安全问题
维护网络安全大力发展数字经济