千家信息网

Python秒处理多张Excel表的方法

发表于:2025-01-23 作者:千家信息网编辑
千家信息网最后更新 2025年01月23日,本篇内容主要讲解"Python秒处理多张Excel表的方法",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python秒处理多张Excel表的方法"吧!背景
千家信息网最后更新 2025年01月23日Python秒处理多张Excel表的方法

本篇内容主要讲解"Python秒处理多张Excel表的方法",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python秒处理多张Excel表的方法"吧!

背景

小明就职于一家户外运动专营公司,他们公司旗下有好多个品牌,并且涉及到很多细分的行业。小明在这家公司任数据分析师,平时都是通过 Excel 来做数据分析的。今天老板丢给他一个任务:下班前筛选出集团公司旗下最近一年销售额前五名的品牌以及销售额。

对于 Excel 大佬来说,这不就是分分钟的事吗?小明并没有放在眼里,直到市场部的同事将原始的数据文件发给他,他才意识到事情并没有那么简单

这并不是想象中的排序取前五就行了。这总共有90个文件,按常规的思路来看,他要么将所有文件的内容复制到一张表中进行分类汇总,要么将每张表格进行分类汇总,然后再最最终结果进行分类汇总。

想想这工作量,再想想截止时间,小明挠了挠头,感觉到要渐渐头秃。

思路分析

这种体力活,写程序解决是最轻松的啦。小明这时候想到了他的程序员好朋友小段,于是他把这个问题抛给了小段。

小段缕了下他那所剩无几的头发,说:so easy,只需要找潘大师即可。

小明说:你搞不定吗?还要找其他人!

小段苦笑说:不不不,潘大师是 Python 里面一个处理数据的库,叫 Pandas ,俗称 潘大师。

小明说:我不管什么大师不大师,就说需要多久搞定。

小段说:给我几分钟写程序,再跑几秒钟就好了!

小明发过去了膜拜大佬的表情。

小段略微思考了下,整理了一下程序思路:

  • 计算每张表每一行的销售额,用"访客数 转化率 客单价"就行。

  • 将每张表格根据品牌汇总销售额。

  • 将所有表格的结果汇总成一张总表

  • 在总表中根据品牌汇总销售额并排序

编码

第零步,读取 Excel :

import pandas as pddf = pd.read_excel("./tables/" + name)

第一步,计算每张表格内的销售额:

df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

第二步,将每张表格根据品牌汇总销售额:

df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

第三步,将所有表格的结果汇总成一张总表:

result = pd.DataFrame()result = pd.concat([result, df_sum])

第四步,在总表中根据品牌汇总销售额并排序:

final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending=False)

最后,我们来看看完整的程序:

import pandas as pdimport osresult = pd.DataFrame()for name in os.listdir("./tables"):    try:        df = pd.read_excel("./tables/" + name)        df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']        df_sum = df.groupby('品牌')['销售额'].sum().reset_index()        result = pd.concat([result, df_sum])    except:        print(name)        passfinal = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending=False)pd.set_option('display.float_format', lambda x: '%.2f' % x)print(final.head())

最后的结果是这样的:

       品牌           销售额15   品牌-5 1078060923.628   品牌-17 1064495314.964   品牌-13 1038560274.213   品牌-12 1026115153.0013   品牌-3 1006908609.07

可以看到最终的前五已经出来了,整个程序运行起来还是很快的。

到此,相信大家对"Python秒处理多张Excel表的方法"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

销售额 销售 品牌 小明 程序 表格 大师 方法 处理 公司 数据 结果 多张 内容 单价 思路 文件 转化率 访客 分析 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 怎样用idea连接数据库 军人网络安全警示案例 宁夏hp服务器维修维保多少钱 软件开发款项付款比例 服务器安全狗4.2增强版 电脑版1.12服务器 计算机网络技术基础卷子免费下载 随着互联网科技的发展翻译 国外高匿代理服务器 初始化数据库失败越狱 ibm服务器的管理口 宁波计算机网络技术管理系统 换料设计与安全分析服务器 网络技术及教育教学资源整合 最新电驴服务器 如何做好社会安全和网络安全 达内的运维安全与网络安全 数据库题内关键词索引 关于网络安全问题的作文 了解基本的网络安全防范策略 首届中国网络安全日宣传周 上海徐汇商城软件开发多少钱 软件开发管理基础知识手册 mssql重构数据库 微商和网络技术公司的对比 外文国际期刊论文数据库 网络安全法 股票 软件开发 项目经理绩效考核 想学软件开发应该从哪里开始 数据库安全性理解
0