千家信息网

如何采用TCGAbiolinks 去下载TCGA临床数据

发表于:2025-02-07 作者:千家信息网编辑
千家信息网最后更新 2025年02月07日,小编给大家分享一下如何采用TCGAbiolinks 去下载TCGA临床数据,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!采
千家信息网最后更新 2025年02月07日如何采用TCGAbiolinks 去下载TCGA临床数据

小编给大家分享一下如何采用TCGAbiolinks 去下载TCGA临床数据,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

采用TCGAbiolinks 去下载TCGA临床数据,并对数据进行整合

下载和处理TCGA的临床信息非常的麻烦,不同的癌症,格式还不一样,处理起来不容易。

采用TCGAbiolinks 包去下载和处理临床信息就非常的方便。

那么我们以下载胃癌病人的临床数据的为例,看看如何下载数据。

#  加载需要的包library(SummarizedExperiment)library(TCGAbiolinks)############################################################ GDC: https://portal.gdc.cancer.gov/############################################################ 设置程序参数work_dir <- "/Users/zhangqiuxue/Documents/Train/TCGA/lab/Download_Data/Clinical" # 设置需要下载癌症对应的project 和数据类型project <- "TCGA-STAD"data_category <- "Clinical"data_type <- "Clinical Supplement"legacy <- FALSE# 设置工作目录setwd(work_dir)# 下载临床数据的结果DataDirectory <- paste0(work_dir,"/GDC/",gsub("-","_",project))# 查询可以下载的数据query <- GDCquery(project = project,                  data.category = data_category,                  data.type = data_type,                   legacy = legacy)# 该癌症总样品数量samplesDown <- getResults(query,cols=c("cases"))cat("Total Clinical sample to down:", length(samplesDown))# 下载数据GDCdownload(query = query,            directory = DataDirectory,files.per.chunk=6, method='client')# 用专门的函数去整合下载好的数据clinical <- GDCprepare_clinic(query, clinical.info = "patient",directory = DataDirectory)# 将数据保存到文件,方便后面的进一步分析clinical_file <- paste0(DataDirectory, "_","clinical",".txt")write.csv(clinical, file = clinical_file, row.names = F, quote = F)

以上是"如何采用TCGAbiolinks 去下载TCGA临床数据"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

0