TCGA数据下载的示例分析
发表于:2025-02-06 作者:千家信息网编辑
千家信息网最后更新 2025年02月06日,这篇文章主要介绍了TCGA数据下载的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。TCGAbiolinks 下载 TCGA 数
千家信息网最后更新 2025年02月06日TCGA数据下载的示例分析
这篇文章主要介绍了TCGA数据下载的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
TCGAbiolinks 下载 TCGA 数据
下载TCGA数据的方式有很多,大致可以分成3类:
1. 采用GDC 工具去下载: 这个其实挺麻烦的,下载后的数据还要合并,不同的数据合并方式还不一样,需要些不少的代码。
2. 从Broad 研究所的Firehose 去下载整理好的数据,但是这个数据都比较陈旧。
3. 采用R包去下载: 目前一些R包,能对GDC的工具和API进行了很好的封装,简化了操作过程,而且当GDC进行了升级时,R包也会及时更新,所以这种方式下载数据是一个比较理想的方式。
# 加载需要的包library(SummarizedExperiment)library(TCGAbiolinks)############################################################ GDC: https://portal.gdc.cancer.gov/############################################################ 设置环境参数work_dir <- "/Users/zhangqiuxue/Lab/TCGA/TCGAbiolinks" # 设置程序参数project <- "TCGA-STAD"data_category <- "Transcriptome Profiling"data_type <- "Gene Expression Quantification"workflow_type <- "HTSeq - Counts"legacy <- FALSE# 设置工作目录setwd(work_dir)# 下载基因表达量,count数格式的结果DataDirectory <- paste0(work_dir,"/GDC/",gsub("-","_",projects))FileNameData <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".rda")# 查询可以下载的数据query <- GDCquery(project = project, data.category = data_category, data.type = data_type, workflow.type = workflow_type, legacy = legacy)# 该癌症总样品数量samplesDown <- getResults(query,cols=c("cases"))cat("Total sample to down:", length(samplesDown))# TP 样品数量dataSmTP <- TCGAquery_SampleTypes(barcode = samplesDown, typesample = "TP")cat("Total TP samples to down:", length(dataSmTP))# NT 样本数量dataSmNT <- TCGAquery_SampleTypes(barcode = samplesDown,typesample = "NT")cat("Total NT samples to down:", length(dataSmNT))# 下载数据, 数据比较大,耐心等待GDCdownload(query = query, directory = DataDirectory)# 保存结果,方便后面使用data <- GDCprepare(query = query, save = TRUE, directory = DataDirectory, save.filename = FileNameData)# 表达量提取,保存到文件data_expr <- assay(data)dim(data_expr)gene_expr_file <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".txt")write.table(data_expr, file = gene_expr_file, sep="\t", row.names =T, quote = F)
除了下载数据,TCGAbiolinks 还集成了差异分析,生存分析等功能
感谢你能够认真阅读完这篇文章,希望小编分享的"TCGA数据下载的示例分析"这篇文章对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,更多相关知识等着你来学习!
数据
分析
方式
篇文章
数量
示例
参数
工具
样品
结果
不同
陈旧
耐心
代码
价值
兴趣
功能
同时
基因
差异
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
上海大型软件开发厂家现货
香港联交所网络安全的系统性风险
拓普网络技术
服务器端口的双向开通是什么意思
软件开发专业英语词汇
检查网络安全
厦门集美专业软件开发
新浪互联网信息科技有限公司
网络安全九不准制度
网络安全法通过初审
上海晟龙仓网络技术有限公司
服务器连接异常无法启动
如何查找多张表格内数据库
多种形式积极宣传网络安全
小学生网络技术委员会
淄川销售软件开发
四川网络安全教育机构
中小学生网络安全教育案例
网络安全与信息化大赛答案
查网址服务器安全性租期时间
数据库建立冗余字段的原则
唐山仓库管理系统软件开发
抚州企业服务器哪家公司好
网络安全类校园小品
冰上丝绸之路数据库
网络安全战略纲要
数据库的升序
兰德数据库
铁路网络安全维护工作的内容
监控数据库服务器用途