Pandas数据分析之如何批量拆分/合并Excel
发表于:2025-01-18 作者:千家信息网编辑
千家信息网最后更新 2025年01月18日,这篇文章给大家分享的是有关Pandas数据分析之如何批量拆分/合并Excel的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一、假造数据work_dir="./datas"s
千家信息网最后更新 2025年01月18日Pandas数据分析之如何批量拆分/合并Excel
这篇文章给大家分享的是有关Pandas数据分析之如何批量拆分/合并Excel的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
一、假造数据
work_dir="./datas"splits_dir=f"{work_dir}/splits"import osif not os.path.exists(splits_dir): os.mkdir(splits_dir)#0.读取源Excel到Pandasimport pandas as pddf_source=pd.read_excel(f"{work_dir}/1.xlsx")df_source.head()df_source.indexdf_source.shapetotal_row_count=df_source.shape[0]total_row_count
二、程序演示
1、将一个大Excel等份拆成多个Excel
使用df.iloc方法,将一个大的dataframe,拆分成多个小的dataframe
将使用dataframe.to_excel保存每个小的Excel
#1.计算拆分后的每个excel的行数#这个大excel,会拆分给这几个人user_names=['xiao_shuai',"xiao_wang","xiao_ming","xiao_lei","xiao_bo","xiao_hong"]#每个人的人数数目split_size=total_row_count//len(user_names)if total_row_count%len(user_names)!=0: split_size+=1split_size#拆分成多个dataframedf_subs=[]for idx,user_name in enumerate(user_names): #iloc的开始索引 begin=idx*split_size #iloc的结束索引 end=begin+split_size #实现df按照iloc拆分 df_sub=df_source.iloc[begin:end] #将每个子df存入到列表 df_subs.append((idx,user_name,df_sub))#3. 将每个dataframe存入到excelfor idx,user_name,df_sub in df_subs: file_name=f"{splits_dir}/articles_{idx}_{user_name}.xlsx" df_sub.to_excel(file_name,index=False)
2、合并多个小Excel到一个大Excel
遍历文件夹,得到要合并的Excel文件列表
分别读取到dataframe,给每个df添加一列用于标记来源
使用pd.concat进行df批量合并
将合并后的dataframe输出到excel
#1.遍历文件夹,得到要合并的Excel名称列表import osexcel_names=[]for excel_name in os.listdir(splits_dir): excel_names.append(excel_name)excel_names#2分别读取到dataframedf_list=[]for excel_name in excel_names: #读取每个excel到df excel_path=f"{splits_dir}/{excel_name}" df_split=pd.read_excel(excel_path) #得到username username=excel_name.replace("articles_","").replace(".xlsx","")[2:] print(excel_name,username) #给每个df添加1列,即用户名字 df_split["username"]=username df_list.append(df_split)#3.使用pd.concat进行合并df_merged=pd.concat(df_list)df_merged.shapedf_merged.head()df_merged["username"].value_counts()#4.将合并后的dataframe输出到exceldf_merged.to_excel(f"{work_dir}/result_merged.xlsx",index=False)
感谢各位的阅读!关于"Pandas数据分析之如何批量拆分/合并Excel"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
多个
数据
文件
数据分析
分析
内容
文件夹
更多
篇文章
索引
输出
不错
实用
个人
个子
人数
名字
名称
数目
文章
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
建站之星数据库表结构
华为软件开发云项目天津
招股说明书在说明数据库
黄河奔腾服务器
白云app软件开发价格表
软件开发确定工期
数据库更新后字段里的内容不见了
全球恐怖数据库
软件开发的生存期
数据库文本大小怎么设置
江苏服务器防火墙直供
国产网络安全法
网络安全大学怎么学
软件开发企业税收优惠
中山大学网络安全学院简介
雨果网络技术
网络安全认识与防范
大彭镇东风小学网络安全教育
人工智能网络安全专业研究生
全国网络安全积极发展
go 语言 服务器
服务器文件共享安全吗
sql数据库连接软件免费完整版
蓝牙的网络安全模式有哪几种
软件开发的生存期
西安邮电网络安全学院
战地5选什么服务器加速
曲靖东服务器
手机私有服务器备份app
淮北市网络安全学费