Python中如何Pandas代码助数据从业人员开启新征程
发表于:2024-10-18 作者:千家信息网编辑
千家信息网最后更新 2024年10月18日,这期内容当中小编将会给大家带来有关Python中如何Pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。摘要Pandas 是基于N
千家信息网最后更新 2024年10月18日Python中如何Pandas代码助数据从业人员开启新征程
这期内容当中小编将会给大家带来有关Python中如何Pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
摘要
Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。不少利用Python做数据分析的朋友应该对Pandas不陌生,这里给大家总结了20个常用的Pandas代码帮助大家更快速的理解数据。
我这里将这20个Pandas代码分成三类:
基本数据信息
基本数据处理
操作Data frames
基本数据信息
1、基本读写数据集(CSV、Execl)
# csv# 读pd.DataFrame.from_csv("csv_file") pd.read_csv("csv_file")# 写df.to_csv("data.csv", sep=",", index=False) # 逗号分隔,没有下标# execlpd.read_excel("excel_file")df.to_execl("data.xlsx",sheet_name='a')
2、基本数据集特征
df.info()
3、基本数据统计
df.describe()
4、将data frames输出到一张表里(tabulate模块)
from tabulate import tabulateprint(tabulate(print_table, headers=headers))# print_table 为包含列表的列表# headers 为表头所包含的字段
5、列出所有的字段
df.columns
6、得到前后n行
df.head(n) #前n行df.tail(n) #后n行
7、通过特征、位置定位数据
df.loc[feature_name]#选择"size"列的第一行df.loc([0], ['size'])df.iloc[n] # 位置
基本数据处理
8、去除缺失值
df.dropna(axis=0, how='any')
9、替换缺失值
df.replace(to_replace=None, value=None)# 将"to_replace"中的值替换为"value"
10、检查缺失值
pd.isnull(object)# 检测缺失值(数值数组中的NaN,对象数组中的None/NaN)
11、删除一个字段
df.drop('feature_variable_name', axis=1)# 轴对于行是0,对于列是1
12、将对象类型转换为数值
pd.to_numeric(df["feature_name"], errors='coerce')# 将对象类型转换为numeric以便能够执行计算(如果它们是字符串)
13、将Dataframe转换为numpy数组
df.as_matrix()
操作Data frames
14、将函数应用于dataframe
# 这个将把数据的"height"列中的所有值乘以21、df["height"].apply(lambda height: 2 * height)2、def multiply(x): return x * 2df["height"].apply(multiply)
15、从命名一列
# 这里,将把数据的第三列重命名为"size"df.rename(columns = {df.columns[2]:'size'}, inplace=True)
16、获取某列的唯一项
# 这里将得到列"name"的唯一条目df["name"].unique()
17、多级访问
# 在这里,将从数据中获取列的选择,"name"和"size"new_df = df[["name", "size"]]
18、数据的一些统计量df.sum()
df.min()df.max()df.idxmin()df.idxmax() #返回最大值索引df.mean()df.median()df.corr() # 不同列之间的相关系数df["size"].median
19、 数据排序
df.sort_values(ascending = False)
20、布尔索引
df[df["size"] == 5] #布尔型索引
上述就是小编为大家分享的Python中如何Pandas代码助数据从业人员开启新征程了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
数据
代码
缺失
分析
字段
对象
数组
索引
人员
征程
启新
位置
信息
内容
工具
布尔
数值
数据分析
数据处理
特征
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
domain邮件服务器
手机软件开发开发历程
操作系统更新数据库
百信 服务器排名
2019网络安全日主题
有经验的服务器维护
服务器可以分成几个虚拟主机
教育部网络安全技术专家
数据库系统安全技术
网络安全公司怎么找员工
动作游戏服务器一般用什么通讯
济南政府网络安全工程师
R类数据库
软件开发支援系统程序
初中生网络安全知识有奖竞赛总结
分布式数据库技术内容
福建java软件开发工资待遇
合盛网络技术公司招聘
高清壁纸软件开发
南京市公安局网络安全遴选
文成标准刀片服务器专业服务
服务器安全orc是什么
服务器出错 刷新
数据库显示隐形游标
鲸志愿数据库
mysql数据库性能查询
网络安全保卫调研文章
寒假护苗网络安全课程
光谷软件开发大学
打赢网络安全预防战