R语言指定列取交集后合并多个数据集的简便方法是怎样的
发表于:2025-02-19 作者:千家信息网编辑
千家信息网最后更新 2025年02月19日,今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。之前录制过一期视频介绍过
千家信息网最后更新 2025年02月19日R语言指定列取交集后合并多个数据集的简便方法是怎样的
今天就跟大家聊聊有关R语言指定列取交集后合并多个数据集的简便方法是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
之前录制过一期视频介绍过这个内容,他的基本需求就是:他有5份数据集,每一份数据集都是每行是一个基因,每列是一个样本,值是对应这个基因的表达量。他想将5个数据集中的共有基因找出来,然后5个数据集按共有的基因合并。
我的思路是
先把5份数据的基因名取交集 用基因名给每份数据做行名 根据取交集的结果来提取数据 最后合并数据集
那期内容有人留言了简便方法,很短的代码就实现了这个目的。我将代码记录在这篇推文里
因为5份数据集以csv格式存储,首先就是获得存储路径下所有的csv格式文件的文件名,用到的命令是
files<-dir(path = "example_data/merge_data/",
full.names = T,
pattern = ".csv")
用到的函数是dir()
path
参数是数据文件存储的路径
full.names
参数如果设置为TRUE,则返回文件的完整路径,如果设置的为FALSE则只返回文件名。
相对路径和绝对路径是很重要的概念,这个一定要搞明白
pattern
参数指定文件的后缀名
需要借助tidyverse
这个包,用到的是map()
函数
library(tidyverse)
df<-map(files,read.csv)
class(df)
df
是一个列表,5份数据分别以数据框的格式存储在其中
直接一行命令搞定
df1<-reduce(df,inner_join)
df1就是我们想要的结果
达成这个目的最终总共才用到了4行代码,太方便了。
之前和一位同学讨论的时候他也提到了tidyverse整理数据,但是自己平时用到的数据格式还算整齐,基本上用数据框的一些基本操作就可以达到目的了。也就没有学tidyverse这个包的内容,看来得抽时间好好学习一下了。
看完上述内容,你们对R语言指定列取交集后合并多个数据集的简便方法是怎样的有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
数据
内容
基因
文件
路径
交集
格式
存储
简便
方法
代码
参数
就是
目的
多个
语言
函数
命令
文件名
结果
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
eclipse写入数据库代码
芜湖树袋熊网络技术有限公司
mbse工具软件开发
潜水考证软件开发
pd数据库做学校管理系统
重庆专业软件开发
常熟高品质服务器应用范围
判断dns系统是一个数据库吗
网络安全常见的病毒及特征
求生之路2重新连接服务器指令
数据库怎么创造管理员
c 创建数据库mvc实例化
服务器公测什么意思
泰州个人软件开发诚信合作
雅安网络技术产品介绍
千金市骨翻译软件开发
江苏企业软件开发服务优化
游戏软件开发扶持政策国务院
在售最强服务器cpu
淘宝上的服务器内存哪里来的
数据库应用在超市论文
数据库实操步骤
网页随机读取数据库
xilinx用什么软件开发
暑假青少年网络安全
数据库导入osm
网吧管理依据网络安全法处罚
网络技术在职研究生
计算机网络技术应用类的题目
网络安全检查讲话稿