R语言指定列取交集后合并多个数据集的简便方法是怎样的
发表于:2024-11-27 作者:千家信息网编辑
千家信息网最后更新 2024年11月27日,今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。之前录制过一期视频介绍过
千家信息网最后更新 2024年11月27日R语言指定列取交集后合并多个数据集的简便方法是怎样的
今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
之前录制过一期视频介绍过这个内容,他的基本需求就是:他有5份数据集,每一份数据集都是每行是一个基因,每列是一个样本,值是对应这个基因的表达量。他想将5个数据集中的共有基因找出来,然后5个数据集按共有的基因合并。
我的思路是
先把5份数据的基因名取交集 用基因名给每份数据做行名 根据取交集的结果来提取数据 最后合并数据集
那期内容有人留言了简便方法,很短的代码就实现了这个目的。我将代码记录在这篇推文里
因为5份数据集以csv格式存储,首先就是获得存储路径下所有的csv格式文件的文件名,用到的命令是
files<-dir(path = "example_data/merge_data/",
full.names = T,
pattern = ".csv")
用到的函数是dir()
path
参数是数据文件存储的路径
full.names
参数如果设置为TRUE,则返回文件的完整路径,如果设置的为FALSE则只返回文件名。
相对路径和绝对路径是很重要的概念,这个一定要搞明白
pattern
参数指定文件的后缀名
需要借助tidyverse
这个包,用到的是map()
函数
library(tidyverse)
df<-map(files,read.csv)
class(df)
df
是一个列表,5份数据分别以数据框的格式存储在其中
直接一行命令搞定
df1<-reduce(df,inner_join)
df1就是我们想要的结果
达成这个目的最终总共才用到了4行代码,太方便了。
之前和一位同学讨论的时候他也提到了tidyverse整理数据,但是自己平时用到的数据格式还算整齐,基本上用数据框的一些基本操作就可以达到目的了。也就没有学tidyverse这个包的内容,看来得抽时间好好学习一下了。
看完上述内容,你们对R语言指定列取交集后合并多个数据集的简便方法是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
数据
内容
基因
文件
路径
交集
格式
存储
简便
方法
代码
参数
就是
目的
多个
语言
函数
命令
文件名
结果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
scum进服务器很久
云真网络技术服务
如何在阿里云上面建数据库
网络安全培训学校有哪些
客户和服务器通讯
t6数据库密码
软件开发数学要多少分
四川邮箱外贸软件开发公司
dell霄龙服务器销售厂家电话
数据库管理系统第四版
app软件开发实训报告书
小学网络安全通讯报道
奉贤区标准网络技术服务有哪些
数据库调用工具有哪些
高陵区网络安全周
大数据与数据库的差别
服务器主板供电电路图
pda软件开发方案
cs连接官方服务器失败指令
智能物流网络技术
甘肃戴尔服务器维修哪家好
服务器登陆界面如何重启
招商网络安全系统
张家港有学软件开发
软件开发流程管理会计师
杭州服务器回收近期行情
数据库中聚集是什么
武汉仟渔网络技术
自适应网络安全防护
武道大会服务器