千家信息网

Pandas中怎么分组再取N项

发表于:2024-11-30 作者:千家信息网编辑
千家信息网最后更新 2024年11月30日,本篇内容介绍了"Pandas中怎么分组再取N项"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在 pa
千家信息网最后更新 2024年11月30日Pandas中怎么分组再取N项

本篇内容介绍了"Pandas中怎么分组再取N项"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

在 pandas 中,DataFrame 是我们经常用到的工具。有时候,我们可能会需要对数据按某个字段进行分组,然后每个组取N项。例如:

现在,我想每个职位任取三个用户。

相信有同学会使用 for 循环,依次循环每一行,每个职位选3个,存入一个临时的列表里面。循环完成以后再转成一个新的 DataFrame。但这个方式显然不够智能。

那么,我们有没有什么办法能够不使用循环就做到这一步呢?也许有同学想到了使用 groupby。我们来看看效果。

看起来仅仅是统计了每个职位的数量。那么,如何才能保留所有字段呢?

实际上我们可以把.size()改成.head(3):

看起来这里的.head(3)似乎没有什么作用。这个时候,我们思考一下 Python 里面,如果要使用itertools.groupby,官方文档里面有这样一段话:

Generally, the iterable needs to already be sorted on the same key function.

如下图所示:

这段话告诉我们,要使用itertools.groupby,我们需要提前对被分组的字段进行排序。

那么,我们试一试在如果提前对 DataFrame 进行排序,然后再 groupby 会怎么样:

成功了。每个职位都取了3个。

可能大家发现最左边的索引是乱序,看起来不好看。那么我们还可以重设一下索引:

"Pandas中怎么分组再取N项"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

分组 职位 循环 字段 内容 同学 实际 更多 知识 索引 排序 实用 成功 学有所成 接下来 一行 三个 不够 不好 作用 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 腾讯云怎么管理自己的服务器 免费服务器硬件资源管理 数据库数据格式 服务器网络布线哪家服务好 需要重启才能安装数据库 杭州淘正网络技术 关于网络安全的简单的小报 vue手机软件开发教程 广东软件开发工程公司 连接数据库生成报表打印 北京银赫网络技术有限公司 互联网科技创新的基本要素 杭州专业软件开发怎么样 磊科路由器无法连接服务器 红萌网络安全工作室 钉钉 数据库 服务器怎么禁封ip 南航网络技术与应用实践 饥荒联机版不用服务器会很卡吗 陕西省计算机网络技术专升本学校 jdbc连接数据库建表 epic官网服务器怎么样 多线程保障数据库数据完整 高斯数据库替代什么 方舟怎样选择不会清档的服务器 互联网科技峰会主题 数据库研究采用什么技术 税务 网络安全保障 共和国网络安全法施行的时间是 诚毅科技软件开发有限公司面试
0