python中duplicated和drop_duplicates()有什么区别及怎么用
发表于:2024-12-01 作者:千家信息网编辑
千家信息网最后更新 2024年12月01日,这篇文章主要介绍了python中duplicated和drop_duplicates()有什么区别及怎么用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python中du
千家信息网最后更新 2024年12月01日python中duplicated和drop_duplicates()有什么区别及怎么用
这篇文章主要介绍了python中duplicated和drop_duplicates()有什么区别及怎么用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python中duplicated和drop_duplicates()有什么区别及怎么用文章都会有所收获,下面我们一起来看看吧。
前言
在算face_track_id map有感:
开始验证
data={'state':[1,1,2,2,1,2,2,2],'pop':['a','b','c','d','b','c','d','d']}frame=pd.DataFrame(data) frame
frame.shape$ (8,2)
# 说明duplicated()是对整行进行查重,return 重复了的数据,且只现实n-1条重复的数据(n是重复的次数)frame[frame.duplicated() == True]
一开始还很疑惑,明明(1,b)只出现了1次,哪里duplicate了。其实,人家return的结果是去掉已经出现过一次的行数据了。所以看起来有点confuse,感觉(1,b)并没有重复,但其实人家的函数很简洁呢,返回了重复值而且不冗余。
# 说明drop_duplicates()函数是将所有重复的数据都去掉了,且默认保留重复数据的第一条。# 比如(2,d)出现了3次,在duplicated()中显示了2次,在drop_dupicates()后保留了一个frame.drop_duplicates().shape$ (4,2)
# 留下了完全唯一的数据行frame.drop_duplicates()
补充:python的pandas重复值处理(duplicated()和drop_duplicates())
一、生成重复记录数据
import numpy as npimport pandas as pd #生成重复数据df=pd.DataFrame(np.ones([5,2]),columns=['col1','col2'])df['col3']=['a','b','a','c','d']df['col4']=[3,2,3,2,2]df=df.reindex(columns=['col3','col4','col1','col2']) #将新增的一列排在第一列df
二、判断重复记录(行)
#判断重复数据isDplicated=df.duplicated() #判断重复数据记录isDplicated
三、删除重复值
#删除重复值new_df1=df.drop_duplicates() #删除数据记录中所有列值相同的记录new_df2=df.drop_duplicates(['col3']) #删除数据记录中col3列值相同的记录new_df3=df.drop_duplicates(['col4']) #删除数据记录中col4列值相同的记录new_df4=df.drop_duplicates(['col3','col4']) #删除数据记录中(col3和col4)列值相同的记录new_df1new_df2new_df3new_df4
关于"python中duplicated和drop_duplicates()有什么区别及怎么用"这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对"python中duplicated和drop_duplicates()有什么区别及怎么用"知识都有一定的了解,大家如果还想学习更多知识,欢迎关注行业资讯频道。
数据
相同
知识
内容
函数
篇文章
生成
简洁
价值
冗余
前言
感觉
操作简单
文章
易懂
更多
次数
现实
看吧
结果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
多模块软件开发的层次
服务器租赁服务
大连 软件开发公司
软件开发如何付款
七日杀稳定服务器
从阿里云服务器下载软件
蜗牛移动网络技术有限公司
如何提高webrtc服务器
怎么把代码传到服务器
网络安全宣传报道
闵行区智能化软件开发品牌
传奇云服务器租用多少钱
互联网新型科技类犯罪
关于网络安全应该注意哪些
培养网络安全从事人员的素养
欧美企业专利数据库建设
旅游软件开发常见问题
ios软件开发干嘛的
sql怎么将表导入数据库
腾讯云服务器那么好吗
校园网络安全内容怎么写
逻辑结构图数据库
sql展示表里所有数据库
广东pdu服务器电源价格怎么样
网络安全年度个人工作总结
云服务器独立ip如何实现
自然资源网络安全领导小组
渗透测试和网络安全的区别
数据库sql位运算查询条件
星际公民网格化服务器