千家信息网

python数据分析之怎么用pandas搞定Excel表格

发表于:2025-02-21 作者:千家信息网编辑
千家信息网最后更新 2025年02月21日,本篇内容主要讲解"python数据分析之怎么用pandas搞定Excel表格",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"python数据分析之怎么用pa
千家信息网最后更新 2025年02月21日python数据分析之怎么用pandas搞定Excel表格

本篇内容主要讲解"python数据分析之怎么用pandas搞定Excel表格",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"python数据分析之怎么用pandas搞定Excel表格"吧!

(一)读取其他文件

接下来我们读取三类文件csvtsvtxt文件,值得注意的是读取这三类文件时使用的都是同一个方法,即pd.read_csv(file),在读取时为excel表时需注意分隔符,使用参数sep=''来分隔。接下来我们一起看看在excel和pandas种如何操作的吧!

1.excel读取其他文件

从excel中导入外部数据

1.1 导入csv文件

导入csv文件时,分隔符选择逗号即可。

1.2 导入tsv文件

导入tsv文件,分隔符选择tab键

1.3 导入txt文本文件

导入txt文件时,注意文本里是以什么符号分隔的,自定义分隔符。

2.pandas读取其他文件

在pandas中为无论是读取csv文件还是tsv文件亦或者txt文件,都是用read_csv()的方法读取,另外加上sep()参数来分隔。

2.1 读取csv文件

import pandas as pd# 导入csv文件test1 = pd.read_csv('./excel/test12.csv',index_col="ID")df1 = pd.DataFrame(test1)print(df1)

2.2 读取tsv文件

tab键用\t来表示

import pandas as pd# 导入tsv文件test3 = pd.read_csv("./excel/test11.tsv",sep='\t')df3 = pd.DataFrame(test3)print(df3)

2.3 读取txt文件

import pandas as pd# 导入txt文件test2 = pd.read_csv("./excel/test13.txt",sep='|')df2 = pd.DataFrame(test2)print(df2)

结果:

(二)数据透视表

在excel中存在多种数据,且分为很多类型,这时使用数据透视表就会很方便也很直观的为我们分析出各种我们想要的数据了。
实例:将下列数据绘制成一个透视表,并绘制出按总类分每年的销售额!

1.在excel中制作透视表

需要按照年份来分,则我们需要将date列拆分,把年份拆分出来。随后在数据栏下选择数据透视表,选择区域即可。

随后将各部分数据拖动到各区域即可。

结果:

这样就在excel中完成了数据透视表的制作。

那么在pandas中要怎么实现这一效果呢?

2.在pandas中绘制透视表

绘制透视表的函数为:df.pivot_lable(index,columns,values),最后将数据求和即可。

import pandas as pdimport numpy as nppd.options.display.max_columns =999test = pd.read_excel('./excel/test14.xlsx')df = pd.DataFrame(test)# 将年份取出并新建一个列名为年份的列df['year'] = pd.DatetimeIndex(df['Date']).year# 绘制透视表table = df.pivot_table(index='总类',columns='year',values='销售额',aggfunc=np.sum)df1 = pd.DataFrame(table)df1['总计'] = df1[[2011,2012,2013,2014]].sum(axis=1)print(df1)

结果:

除此之外还可以利用groupby函数来绘制数据表。这里将总类和年份分组求销售总额和销售数量。

import pandas as pdimport numpy as nppd.options.display.max_columns =999test = pd.read_excel('./excel/test14.xlsx')df = pd.DataFrame(test)# 将年份取出并新建一个列名为年份的列df['year'] = pd.DatetimeIndex(df['Date']).year# groupby方法group = df.groupby(['总类','year'])s= group['销售额'].sum()c = group['ID'].count()table = pd.DataFrame({'sum':s,'total':c})print(table)

结果:

到此,相信大家对"python数据分析之怎么用pandas搞定Excel表格"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

文件 数据 年份 销售 分析 分隔符 方法 结果 选择 数据分析 表格 销售额 接下来 内容 函数 参数 文本 制作 学习 实用 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 斯拓互联网络科技有限公司官网 万方数据库技术技巧 小红书的数据库营销ppt wps表格自动排序数据库 数据库中on只能出现一次 天创息壤互助软件开发 电大网络技术 网络安全性检测 网络技术书本推荐 数据库开发难点总结 速达财务软件怎么导出数据库 中文四大数据库检索功能特点 网络技术服务中心面试题 少儿软件开发培训一对一如何收费 阿里云 重启数据库 我的世界1.6.5版本怎么创建服务器 b s模式数据库 政务APP软件开发代运营 河北大规模软件开发价位 分布式数据库安全性检测 计算机网络技术的就业怎么样 网络技术挑战赛广西赛区 网络安全监察专业能报考公务员吗 数据库的优化有哪些 禁告本服务器在美国 联想dl380g5服务器怎么用 网络安全追究则责任 北京易诚互动网络技术有限公 网络安全风险评估的三个要素是指 aws服务器在中国运行要注册公司吗
0