python怎么实现单机处理大文件
发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,本篇内容介绍了"python怎么实现单机处理大文件"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!下面
千家信息网最后更新 2025年01月23日python怎么实现单机处理大文件
本篇内容介绍了"python怎么实现单机处理大文件"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
下面的讨论基于的假定:可以单独处理一行数据,行间数据相关性为零。
方法一:
仅使用 Python 内置模板,逐行读取到内存。
使用 yield,好处是解耦读取操作和处理操作:
def python_read(filename):
with open(filename,'r',encoding='utf-8') as f:
while True:
line = f.readline()
if not line:
return
yield line
以上每次读取一行,逐行迭代,逐行处理数据
if __name__ == '__main__':
g = python_read('./data/movies.dat')
for c in g:
print(c)
# process c
方法二:
方法一有缺点,逐行读入,频繁的 IO 操作拖累处理效率。是否有一次 IO ,读取多行的方法?
pandas
包 read_csv
函数,参数有 38 个之多,功能非常强大。
关于单机处理大文件,read_csv
的 chunksize
参数能做到,它被设置为 5
, 意味着一次读取 5 行。
def pandas_read(filename,sep=',',chunksize=5):
reader = pd.read_csv(filename,sep,chunksize=chunksize)
while True:
try:
yield reader.get_chunk()
except StopIteration:
print('---Done---')
break
使用如同方法一:
if __name__ == '__main__':
g = pandas_read('./data/movies.dat',sep="::")
for c in g:
print(c)
# process c
"python怎么实现单机处理大文件"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
处理
方法
单机
文件
数据
一行
内容
参数
更多
知识
实用
强大
频繁
学有所成
接下来
内存
函数
功能
困境
好处
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
北京专业软件开发哪家便宜
新数据库恢复rman全备
少先队组织信息数据库系统使用手册1
服务器安全策略目的
grc网络安全风险管理
网络安全的认识哲学
网络打印机服务器第三方软件
网络安全企业的渠道模式
数据库表 语句怎么写
其它游戏用什么服务器
aql数据库密码忘了
删除数据库的操作步骤
炫彩互联网科技
江苏进口软件开发项目信息
it网络安全工程师岗位
cf连接服务器失败怎么搞
服务器和桌面电脑哪个好用
大连软件开发业
网络技术对电脑的影响
sql删除数据库用户
a哥装服务器
软件开发项目小组成员的要求
anki 自建服务器
服务器处于离线状态
网络安全外防内控
深圳服务器系统运维咨询
互联网安徽荟商信息科技有限公司
网络安全员培训 考核制度
新一代无线通信及网络技术论文
数据库数据结构化