导航：首页 > 互联网科技 >

python数据处理的方法

发表于：2025-01-23 作者：千家信息网编辑

千家信息网最后更新 2025年01月23日，本篇内容主要讲解"python数据处理的方法"，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习"python数据处理的方法"吧!df.query 过滤数据0.2

千家信息网最后更新 2025年01月23日python数据处理的方法

本篇内容主要讲解"python数据处理的方法"，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习"python数据处理的方法"吧!

df.query 过滤数据

0.25 版本开始支持 query 方法，可读性上又获得大幅提升，类似 sql 查询数据的写法，更加人性化。

下面举例说明，过滤数据常用三种方法。

df = pd.DataFrame({'A':np.random.randint(1,20,(8,)),
                   'B':np.random.randint(1,20,(8,)),
                   'C':np.random.randint(1,20,(8,))})
df

过滤条件：A列值大于其平均值，且 B列值大于 5 的行

方法 1

df[ (df['A'] > df["A"].mean()) & (df['B'] > 5)]

注意，& 前后必须要各自加一对 ()

方法 2

cr1 = df['A'] > df["A"].mean()
cr2 = df['B'] > 5
df[cr1 & cr2]

方法 3

mean = df["A"].mean()
df.query("A > @mean & B > 5")

query 是今天重点提到的，使用语法规则见上，变量前添加 @。这种语法的可读性大家觉得怎么样？

顺便提一下，如果列的名称中间有空格，有一个特别的语法，使用一对 `` 符号来标记列名：

df = pd.DataFrame({'First Name':['Jack','Mary','Mike']})
df.query('`First Name` == \'Jack\'')

以上三种方法得到结果都为：

快速找出最多的分类

首先读入数据：

df = pd.read_csv("IMDB-Movie-Data.csv")
df

1000 行数据，genre 取值的频次统计如下：

vc = df["genre"].value_counts()
vc

打印结果：

Action,Adventure,Sci-Fi       50
Drama                         48
Comedy,Drama,Romance          35
Comedy                        32
Drama,Romance                 31
                              ..
Adventure,Comedy,Fantasy       1
Biography,History,Thriller     1
Action,Horror                  1
Mystery,Thriller,Western       1
Animation,Fantasy              1
Name: genre, Length: 207, dtype: int64

筛选出 top3 的 index:

top_genre = vc[0:3].index
print(top_genre)

打印结果：

Index(['Action,Adventure,Sci-Fi', 'Drama', 'Comedy,Drama,Romance'], dtype='object')

使用得到的 top3 的 index ，结合 isin,选择出相应的 df

df_top = df[df["genre"].isin(top_genre)]
df_top

结果：

到此，相信大家对"python数据处理的方法"有了更深的了解，不妨来实际操作一番吧！这里是网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

很赞哦！

方法数据结果数据处理处理语法内容可读性学习查询实用更深人性兴趣写法变量名称实用性实际常用数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全数据库一般连接怎么运算符数据库的控制技术数据库表代码在哪里看高并发环境下服务器该如何优化怎样加强网络安全数据库oracle学习解释网络安全中机密性 ssh如何登陆服务器南宁青秀区软件开发多少钱软件开发以对象视频解码器服务器软件开发能学会吗 php 数据库读取账户管理数据库设计南通app软件开发报价油管外评中国数据库变化服务器安全工作谁负责多线程和数据库计科专业考研网络安全互联网科技微信公众号排名我们面临的网络安全怎么解决崇明区推广网络技术有哪些谷歌云哪里的服务器快自主研发的国产数据库系统技术软件开发查询类账户管理数据库设计网络安全沙箱网络安全动态感知学数据库用什么笔记本电脑企业网络安全电话

千家信息网

千家信息网

python数据处理的方法

df.query 过滤数据

快速找出最多的分类

JavaScript如何实现跨域共享

模拟计算机是什么意思

相关文章