千家信息网

如何使用GDC API查看和下载TCGA的数据

发表于:2025-02-24 作者:千家信息网编辑
千家信息网最后更新 2025年02月24日,这篇文章主要介绍"如何使用GDC API查看和下载TCGA的数据",在日常操作中,相信很多人在如何使用GDC API查看和下载TCGA的数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法
千家信息网最后更新 2025年02月24日如何使用GDC API查看和下载TCGA的数据

这篇文章主要介绍"如何使用GDC API查看和下载TCGA的数据",在日常操作中,相信很多人在如何使用GDC API查看和下载TCGA的数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"如何使用GDC API查看和下载TCGA的数据"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

API是应用程序编程接口,很多的网站都有对应的API,方便程序抓取数据,比如NCBI, EBI, KEGG等等,GDC也有对应的API, 可以方便的查询和下载TCGA的数据,API的网址如下

https://gdc.cancer.gov/developers/gdc-application-programming-interface-api

API都有一个base url, 通过base url加上内置的指令,可以实现特定数据集的访问和下载,GDC API的base url如下

https://api.gdc.cancer.gov/
https://api.gdc.cancer.gov/legacy/

第一种访问和操作GDC harmonized database, 第二种访问和操作GDC legacy archive。endpoint是内置的指令,支持的指令如下所示

从功能上可以划分为查询,下载,提交数据三大块,常用的的功能包括查询和下载

1. 查询

通过JSON这种格式进行数据交换,以files为例,以其对应的uuid为例进行查询的用法如下

curl https://api.gdc.cancer.gov/files/5891556e-0b86-42bd-aa0e-a319471dc574

返回的数据如下

这种格式就是JSON, 可以和网站上的查询结果比较一下,链接如下

https://portal.gdc.cancer.gov/files/5891556e-0b86-42bd-aa0e-a319471dc574

可以看到API返回的信息中包含了网页上提供的基本信息。在实际使用中,更多的是按照某种条件进行检索,相关的参数很多,这里就不展开了。

2. 下载

通过download指定,可以根据文件的uuid进行下载,有GET和POST两种方式。GET适用于同时下载几个文件,POST适用于大批量下载。

以GET方式下载的用法如下

curl --remote-name --remote-header-name 'https://api.gdc.cancer.gov/data/5891556e-0b86-42bd-aa0e-a319471dc574'

如果有多个文件的uuid,用逗号连接,示意如下

curl --remote-name --remote-header-name 'https://api.gdc.cancer.gov/data/e3228020-1c54-4521-9182-1ea14c5dc0f7,18e1e38e-0f0a-4a0e-918f-08e6201ea140'

以POST方式下载需要主要准备一个文件,记录要下载文件的uuid编号,该文件可以有两种格式,第一种示意如下

ids=556e5e3f-0ab9-4b6c-aa62-c42f6a6cf20c&ids=e0de63e2-02f3-4309-9b24-69f4c24e85fc

假设该文件名称为uuids, 下载的命令为

curl --remote-name --remote-header-name --request POST 'https://api.gdc.cancer.gov/data' --data @uuids

第二种示意如下

采用该文件进行下载的命令如下

curl --remote-name  \
--remote-header-name \
--request POST \
--header 'Content-Type: application/json' \
--data @uuids \
'https://api.gdc.cancer.gov/data'

以上只是GDC API的基本用法,更多用法请参考官方文档,链接如下

https://docs.gdc.cancer.gov/API/Users_Guide/Getting_Started/

通过熟练使用API,可以实现程序自动化的下载TCGA数据,有很多TCGA数据下载的R包,就是通过调用API来实现对应的功能。

到此,关于"如何使用GDC API查看和下载TCGA的数据"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

数据 文件 查询 更多 学习 功能 指令 方式 格式 程序 网站 信息 命令 就是 链接 帮助 实用 熟练 接下来 三大 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全手抄报黑白画 网络安全进课堂主题班会课件 智能电网信息工程与网络安全 列举一个具体的数据库名 点歌机无数据库怎么刷机 网络技术部社团 软件开发公司维护系统多少钱 在数据库技术中实体联系模型 学历不限的软件开发招聘 访问元iis数据库失败 微信开发 数据库 内蒙网络安全攻防 日常生活中数据库的例子 软件开发外包平台有什么技术构成 网络安全技术相关内容 网络安全的绘画作品 一等奖 企业管理软件开发用什么编程 2018网络安全法知识竞赛 新服务器ip地址换成旧的 去技校学网络技术专业 信息网络安全管理制度ppt 数据库还原时候介质验证失败 在数据库技术中实体联系模型 软件开发的需求文档要 灌南有口碑的网络技术创新服务 景德镇物理服务器费用多少 宿州网络安全考试scse认证 行车记录数据库怎么存放 软件开发就是编程 湖南教育考试院高考录取数据库
0