Python中如何Pandas代码助数据从业人员开启新征程
发表于:2025-01-18 作者:千家信息网编辑
千家信息网最后更新 2025年01月18日,这期内容当中小编将会给大家带来有关Python中如何Pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。摘要Pandas 是基于N
千家信息网最后更新 2025年01月18日Python中如何Pandas代码助数据从业人员开启新征程
这期内容当中小编将会给大家带来有关Python中如何Pandas代码助数据从业人员开启新征程,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
摘要
Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。不少利用Python做数据分析的朋友应该对Pandas不陌生,这里给大家总结了20个常用的Pandas代码帮助大家更快速的理解数据。
我这里将这20个Pandas代码分成三类:
基本数据信息
基本数据处理
操作Data frames
基本数据信息
1、基本读写数据集(CSV、Execl)
# csv# 读pd.DataFrame.from_csv("csv_file") pd.read_csv("csv_file")# 写df.to_csv("data.csv", sep=",", index=False) # 逗号分隔,没有下标# execlpd.read_excel("excel_file")df.to_execl("data.xlsx",sheet_name='a')
2、基本数据集特征
df.info()
3、基本数据统计
df.describe()
4、将data frames输出到一张表里(tabulate模块)
from tabulate import tabulateprint(tabulate(print_table, headers=headers))# print_table 为包含列表的列表# headers 为表头所包含的字段
5、列出所有的字段
df.columns
6、得到前后n行
df.head(n) #前n行df.tail(n) #后n行
7、通过特征、位置定位数据
df.loc[feature_name]#选择"size"列的第一行df.loc([0], ['size'])df.iloc[n] # 位置
基本数据处理
8、去除缺失值
df.dropna(axis=0, how='any')
9、替换缺失值
df.replace(to_replace=None, value=None)# 将"to_replace"中的值替换为"value"
10、检查缺失值
pd.isnull(object)# 检测缺失值(数值数组中的NaN,对象数组中的None/NaN)
11、删除一个字段
df.drop('feature_variable_name', axis=1)# 轴对于行是0,对于列是1
12、将对象类型转换为数值
pd.to_numeric(df["feature_name"], errors='coerce')# 将对象类型转换为numeric以便能够执行计算(如果它们是字符串)
13、将Dataframe转换为numpy数组
df.as_matrix()
操作Data frames
14、将函数应用于dataframe
# 这个将把数据的"height"列中的所有值乘以21、df["height"].apply(lambda height: 2 * height)2、def multiply(x): return x * 2df["height"].apply(multiply)
15、从命名一列
# 这里,将把数据的第三列重命名为"size"df.rename(columns = {df.columns[2]:'size'}, inplace=True)
16、获取某列的唯一项
# 这里将得到列"name"的唯一条目df["name"].unique()
17、多级访问
# 在这里,将从数据中获取列的选择,"name"和"size"new_df = df[["name", "size"]]
18、数据的一些统计量df.sum()
df.min()df.max()df.idxmin()df.idxmax() #返回最大值索引df.mean()df.median()df.corr() # 不同列之间的相关系数df["size"].median
19、 数据排序
df.sort_values(ascending = False)
20、布尔索引
df[df["size"] == 5] #布尔型索引
上述就是小编为大家分享的Python中如何Pandas代码助数据从业人员开启新征程了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
数据
代码
缺失
分析
字段
对象
数组
索引
人员
征程
启新
位置
信息
内容
工具
布尔
数值
数据分析
数据处理
特征
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
计算机网络技术类是什么
数据库的隔离机制在哪里设置
甘薯箐安互联网科技有限公司
互联网软件开发 的课程
争做网络安全小卫士
缅甸imap服务器填什么
数据库视图方式
宁波企业软件开发定做价格
嘉定区网络技术咨询值得推荐
二月份网络安全学习内容
部队网络安全怎么防
驻马店网络安全
nigxn服务器爆数据库地址
检察院网络安全管理办法
南充孤恒互联网科技有限公司
腾讯课堂的服务器地址
数据库安全性方面
数据库表为什么允许为空
网络安全的一些做法
最新软件开发技术
马鞍山机架式服务器价格
网络安全类厂商对比
上海曼龙软件开发有限公司
动易数据库表关系
辽宁数据软件开发过程检测中心
互联网科技公司全套账务
nosql数据库比较
数据库安全性方面
学生网络安全教育的重要性
股票实时数据库技术