导航：首页 > 互联网科技 >

数据清洗常用的2个小trick分别是什么

发表于：2024-11-23 作者：千家信息网编辑

千家信息网最后更新 2024年11月23日，今天就跟大家聊聊有关数据清洗常用的2个小trick分别是什么，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。Pandas 巧用 str.spli

千家信息网最后更新 2024年11月23日数据清洗常用的2个小trick分别是什么

今天就跟大家聊聊有关数据清洗常用的2个小trick分别是什么，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

Pandas 巧用 `str.split` 和 `str.cat`

因为以上两个方法，直接按列操作，所以省掉一层 for 循环，下面直接看例子。

df = pd.DataFrame({'names':["Geordi La Forge", "Deanna Troi", "Jack"],'IDs':[1,2,3]})
df

列分割

对 names 列，按照第一个空格分割为两列：

df["first_name"] = df["names"].str.split(n = 1).str[0]
df["last_name"] = df["names"].str.split(n = 1).str[1]
df

结果如下：

列合并方法 1

分割列搞定，接下来再合并回去，使用 cat 方法：

df["names_copy"] = df["first_name"].str.cat(df["last_name"], sep = " ")
df

合并两列得到一个新列 names_copy 搞定！

列合并方法 2

还有别的合并方法吗，直接使用 + 连接字符串：

df["names_copy2"] = df["first_name"] + " "+ df["last_name"]
df

效果是一样的：

Pandas 多条件筛选可读性较好的写法

有特征上百个，根据多个特征筛选 DataFrame 时，如果这么做，可读性不太友好：

df[(df["continent"] == "Europe") & (df["beer_servings"] > 150) & (df["wine_servings"] > 50) & (df["spirit_servings"] < 60)]

连续多个筛选条件写到一行里。

更好可读性的写法

cr1 = df["continent"] == "Europe"
cr2 = df["beer_servings"] > 150
cr3 = df["wine_servings"] > 50
cr4 = df["spirit_servings"] < 60

df[cr1 & cr2 & cr3 & cr4]

看完上述内容，你们对数据清洗常用的2个小trick分别是什么有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注行业资讯频道，感谢大家的支持。

很赞哦！

方法内容可读性常用数据清洗写法多个条件特征接下来一行两个例子字符字符串效果更多知识空格数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全网络技术原理ppt 云服务器算力哪来的软件开发代做图片常见软件开发模型案例分析裕客互联网科技公司官兵如何做好网络安全工作 plc与sql数据库黄山安徽联想服务器代理商常用数据库访问中间件堡垒机需要加代理服务器吗苏州梦想奇迹互联网科技杀手6tm无法连接服务器云服务器网站申请注册在数据库上部署模块空间数据库点查询春季高考网络技术大学有哪些 hyperv服务器怎么管理数据库安全上机试题数据库用数据库语言创建用户管理麻将app系统服务器华北+棋牌游戏软件开发西安软件开发行业招聘信息全球降雨量数据库苹果怎么隐藏数据库数据库技术与应用小结测试安徽语音网络技术分类产品介绍青少年网络安全宣传连环画香港sap软件开发公司密使下载软件开发贵阳医疗软件开发工程师

千家信息网

千家信息网

数据清洗常用的2个小trick分别是什么

Pandas 巧用 `str.split` 和 `str.cat`

列分割

列合并方法 1

列合并方法 2

Pandas 多条件筛选可读性较好的写法

更好可读性的写法

olap和oltp有哪些区别

Google Sitelinks指的是什么

相关文章

数据清洗常用的2个小trick分别是什么

Pandas 巧用 str.split 和 str.cat

列分割

列合并方法 1

列合并方法 2

Pandas 多条件筛选可读性较好的写法

更好可读性的写法

olap和oltp有哪些区别

Google Sitelinks指的是什么

相关文章

Pandas 巧用 `str.split` 和 `str.cat`