R语言中根据数据框的顺序进行筛选的示例分析
发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,本篇文章给大家分享的是有关R语言中根据数据框的顺序进行筛选的示例分析,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。目的这里有两个数据框,
千家信息网最后更新 2025年02月03日R语言中根据数据框的顺序进行筛选的示例分析错误的方法:用
结论:
本篇文章给大家分享的是有关R语言中根据数据框的顺序进行筛选的示例分析,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
目的
这里有两个数据框,两者有相同的列(ID),这里想把第一个数据框,按照第二个数据框的ID列进行提取,顺序和第二个数据框一致。
数据框1
> tt = data.frame(id = 1:10,y = rnorm(10))
> tt
id y
1 1 0.7264999
2 2 -1.3817018
3 3 -0.8626703
4 4 2.0663756
5 5 0.1997253
6 6 0.5968497
7 7 -0.8836847
8 8 2.2224643
9 9 -1.5825250
10 10 -0.1530456
数据框2
> id = data.frame(id = c(2,1,5,4,3))
> id
id
1 2
2 1
3 5
4 4
5 3
错误的方法:用%in%
进行提取,会自动排序
> # 使用 %in% 进行匹配时,会自动排序,不是id的顺序
> tt[tt$id %in% id$id,]
id y
1 1 0.7264999
2 2 -1.3817018
3 3 -0.8626703
4 4 2.0663756
5 5 0.1997253
> id
id
1 2
2 1
3 5
4 4
5 3
可以看到,匹配后的顺序为1,2,3,4,5
,而不是原来的2,1,5,4,3
正确的方法:用match记录位置,然后根据位置提取
> # 使用match可以达到目的
> loc = match(id$id,tt$id)
> loc
[1] 2 1 5 4 3
> tt[loc,]
id y
2 2 -1.3817018
1 1 0.7264999
5 5 0.1997253
4 4 2.0663756
3 3 -0.8626703
结论:match
真香
「完整代码:」
# 模拟两个数据框
tt = data.frame(id = 1:10,y = rnorm(10))
tt
id = data.frame(id = c(2,1,5,4,3))
id
# 使用 %in% 进行匹配时,会自动排序,不是id的顺序
tt[tt$id %in% id$id,]
id
# 使用match可以达到目的
loc = match(id$id,tt$id)
loc
tt[loc,]
我的翻车记录
本来我是有两个系谱文件,第一个系谱文件比较多,但是有错误。第二个系谱文件是第一个系谱文件的子集,它的系谱是正确的。我想将第一个系谱文件错误的系谱矫正一下。
「我的思路:」
1,用%in%
将第一个系谱的ID,根据第二个系谱的ID提取出来,然后用第二个系谱的Sire和Dam把第一个系谱相应的IID的Sire和Dam替换掉。如果第二个系谱本身是排序的,那么这样操作是没问题的。
「潜在的bug」
如果第二个系谱不是按顺序排的,那么上面的操作就会有错误。比如类似(2,1,4,3,5),在匹配后的顺序是(1,2,3,4,5),你用(1,2,3,4,5)的父母本,替换为(2,1,5,3,5)的父母本,肯定是错误的。
以上就是R语言中根据数据框的顺序进行筛选的示例分析,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。
系谱
数据
顺序
文件
错误
排序
两个
目的
示例
语言
分析
位置
方法
更多
父母
知识
篇文章
实用
相同
一致
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
学校重视宣传网络安全教育
数据库原理大数据专业书
软件开发较好
雀魂 服务器配置文件错误
delp数据库怎么添加
软件开发行业认证的证书
软件开发原码论坛
河南帕拉斯网络技术有限公司
舟山服务器机柜采购
网络安全42项风险
维修网络安全责任书
凌华服务器串口
华东师范大学有网络安全吗
头显的软件开发基于unite
全国互联网高科技公司排名
网络安全中电科
企业软件开发标准流程
广州未来集市网络技术
gp数据库授IP地址
计算机网络技术帧或分组
deform生成数据库
我的世界最大的小游戏服务器
苏州APP软件开发招聘网
萨尔服务器
深圳比较实在的软件开发培训
我们应该怎样维护国家网络安全
查看金蝶数据库总量
动易 数据库 标签表
旗天科技赋能互联网加油
网络安全攻击途径