R语言指定列取交集后合并多个数据集的简便方法是怎样的
发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。之前录制过一期视频介绍过
千家信息网最后更新 2025年02月05日R语言指定列取交集后合并多个数据集的简便方法是怎样的
今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
之前录制过一期视频介绍过这个内容,他的基本需求就是:他有5份数据集,每一份数据集都是每行是一个基因,每列是一个样本,值是对应这个基因的表达量。他想将5个数据集中的共有基因找出来,然后5个数据集按共有的基因合并。
我的思路是
先把5份数据的基因名取交集 用基因名给每份数据做行名 根据取交集的结果来提取数据 最后合并数据集
那期内容有人留言了简便方法,很短的代码就实现了这个目的。我将代码记录在这篇推文里
因为5份数据集以csv格式存储,首先就是获得存储路径下所有的csv格式文件的文件名,用到的命令是
files<-dir(path = "example_data/merge_data/",
full.names = T,
pattern = ".csv")
用到的函数是dir()
path
参数是数据文件存储的路径
full.names
参数如果设置为TRUE,则返回文件的完整路径,如果设置的为FALSE则只返回文件名。
相对路径和绝对路径是很重要的概念,这个一定要搞明白
pattern
参数指定文件的后缀名
需要借助tidyverse
这个包,用到的是map()
函数
library(tidyverse)
df<-map(files,read.csv)
class(df)
df
是一个列表,5份数据分别以数据框的格式存储在其中
直接一行命令搞定
df1<-reduce(df,inner_join)
df1就是我们想要的结果
达成这个目的最终总共才用到了4行代码,太方便了。
之前和一位同学讨论的时候他也提到了tidyverse整理数据,但是自己平时用到的数据格式还算整齐,基本上用数据框的一些基本操作就可以达到目的了。也就没有学tidyverse这个包的内容,看来得抽时间好好学习一下了。
看完上述内容,你们对R语言指定列取交集后合并多个数据集的简便方法是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
数据
内容
基因
文件
路径
交集
格式
存储
简便
方法
代码
参数
就是
目的
多个
语言
函数
命令
文件名
结果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
杭州淘啊网络技术
常州运行智慧医院软件开发
残疾人软件开发工程师
lua服务器热更新管理
阿里巴巴算数据库电费
网络安全和信息化 百度
杨浦区网络营销软件开发哪个好
数据库 结构
数据库连一会自动断开
上海鸿索网络技术有限公司
怎样把数据库放到服务器上来访问
四川精品网络技术有限公司
考勤服务器
谷歌手机服务器怎么删除
微兆网络技术有限公司怎么样
焦作民宿软件开发
关系数据库的dto
csharp 数据库
易讯天空网络技术有限公司
邹平瓷砖软件开发价格
vlan能保证网络安全吗
软件开发零基础学习
北京互联网科技学院
深圳吉屋网络技术招聘
网吧怎么进入后台服务器
lua服务器热更新管理
枣庄手机软件开发
网络安全信息的定义
python快速读取数据库
国产服务器排行