python重复值如何处理
发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,本文小编为大家详细介绍"python重复值如何处理",内容详细,步骤清晰,细节处理妥当,希望这篇"python重复值如何处理"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。今
千家信息网最后更新 2024年11月11日python重复值如何处理
本文小编为大家详细介绍"python重复值如何处理",内容详细,步骤清晰,细节处理妥当,希望这篇"python重复值如何处理"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。
今天,先处理重复值,首先创建一个包含重复值的DataFrame,如下:
import pandas as pddata = pd.DataFrame([[1,2],[1,2],[3,4]],columns = ['a','b'])print(data)
我们将其打印出来,结果如下:
可以看出来第一第二行是重复的,这里的数据量比较少,可以直接肉眼观察,但如果数据量多的时候,我们就需要用到diplicated()函数来查询了,我们用它来查查上面data的重复值。
data[data.duplicated()]
我们可以看出,它把索引为1的行打印了出来,如果有3行一样的呢?我们下面来试试!
import pandas as pddata = pd.DataFrame([[1,2],[1,2],[1,2],[3,4]],columns = ['a','b'])data[data.duplicated()]
其结果如下:
可以看出,重复项出了第一个出现的数据外,都会显示出来。
如果想统计出一共有多少行重复了,我们就可以用到sum()函数,代码如下:
data.duplicated().sum()
很多情况下,我们都需要删除掉重复的数据,这时候我们就可以用到drop_duplicated()函数,我们将data的重复行删除掉试试!
data.drop_duplicated()
刚执行代码时发生了错误,原来是duplicates而不是duplicated!
但是要注意,用drop_duplicates()删除重复项并不会影响data的结构,如果你要把data结构改掉就要重新赋值。如果要用来删除某列的重复值的话,直接在括号内加上列名即可。
如下:
读到这里,这篇"python重复值如何处理"文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注行业资讯频道。
数据
函数
文章
代码
内容
结构
结果
处理
妥当
思路
情况
括号
新知
时候
更多
步骤
知识
知识点
篇文章
索引
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库冗余的技术保证安全
阿里云服务器安全怎么样
维修网络技术是干什么工作的
先进的数据库灾备方案
局域网怎么保证网络安全
学网络安全哪个网站好
数据库如何计算主属性
淄博网站制作服务器优化
我的世界服务器租
软件开发公司加班吗
悦跑圈服务器崩了
网络安全学完工资能拿多少
南通崇州区网络安全产业园
正规服务器安全加固系统
1搜索近年来的网络安全事故
南通通信网络技术报价
互联网科技感宣传册
网络技术服务 6
ipad邮箱服务器不可用
阿里云邮箱接收服务器
软件开发公司的几大因素
洋葱网络技术有限公司
云服务器写进目录里的东西删不掉
怎么配置网站云服务器
数据库大对象的返回方式
北极服务器
西城手机软件开发工
服务器对服务器sftp
数据库技术学院奖
软件开发培训交钱吗