千家信息网

R语言的ssGSEA.r怎么使用

发表于:2025-01-18 作者:千家信息网编辑
千家信息网最后更新 2025年01月18日,本文小编为大家详细介绍"R语言的ssGSEA.r怎么使用",内容详细,步骤清晰,细节处理妥当,希望这篇"R语言的ssGSEA.r怎么使用"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习
千家信息网最后更新 2025年01月18日R语言的ssGSEA.r怎么使用

本文小编为大家详细介绍"R语言的ssGSEA.r怎么使用",内容详细,步骤清晰,细节处理妥当,希望这篇"R语言的ssGSEA.r怎么使用"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

ssGSEA.r 单样本基因集富集分析

使用方法:

$Rscript ../scripts/ssGSEA.r -husage: ../scripts/ssGSEA.r [-h] -i expset -g geneset [-o outdir] [-p prefix]ssGSEA免疫侵润分析optional arguments:  -h, --help            show this help message and exit  -i expset, --expset expset                        input gene expression set matrix from RNA-seq data csv                        format [required]  -g geneset, --geneset geneset                        input gene set database [required]  -o outdir, --outdir outdir                        output file directory [default cwd]  -p prefix, --prefix prefix                        output file name prefix [default demo]

参数说明:

-i 基因表达量 , 建议用TPM标准化之后的数据:

IDTCGA-D7-A74A-01A-11R-A32D-31TCGA-BR-7704-01A-11R-2055-13TCGA-VQ-A91N-01A-11R-A414-31TCGA-CD-A4MH-01A-11R-A251-31
NUP5018.6550531.5923228.2338228.76485
CXCR464.85805125.12356.3524469.98976
NT5E111.481869.858779.3738225.05824
EFNA38.24785742.0330843.4643226.66024
STC14.78111121.3632740.8107719.51568
ZBTB7A95.51678103.4768158.3024126.2677
CLDN91.1874562.4761380.3660817.347344

-g 基因集 两列数据,第一列细胞类型,第二列为基因

CellTypeSymbol
B cellsMS4A1
B cellsTCL1A
B cellsMS4A1
B cellsTCL1A
B cellsHLA-DOB
B cellsPNOC
B cellsKIAA0125
B cellsCD19
B cellsCR2
B cellsIGHG1
B cellsFCRL2
B cellsBLK
B cellsIGHG1
B cellsCOCH
B cellsOSBPL10
B cellsIGHA1
B cellsTNFRSF17
B cellsABCB4
B cellsBLNK

结果说明:

得到每一个样本的不同基因集中的NES值:

NES值:用最大值与最小值间的绝对差对ssGSEA分数进行标准化。

cell_typeTCGA-B7-A5TK-01A-12R-A36D-31TCGA-BR-7959-01A-11R-2343-13TCGA-IN-8462-01A-11R-2343-13TCGA-BR-A4CR-01A-11R-A24K-31
aDC0.6121305110.4527214220.4340650.352635
B cells0.4233227750.4088700640.4266120.413857
Blood vessels0.681023490.7754385720.6894330.577667
CD8 T cells0.6756153850.6500732420.6291210.566048
Cytotoxic cells0.6210561510.4252174420.4116170.3128
DC0.6198389250.4850555790.4891010.266905
Eosinophils0.5027849490.5149385570.4695410.488051
iDC0.5316197560.498437210.5309310.390699
Lymph vessels0.7108427690.7213230720.6583910.500574

方法说明:

单样本基因集富集分析(single sample gene set enrichment analysis, ssGSEA),是GSEA方法的扩展,主要是针对单个样本无法做GSEA而设计。文章2009年发表于nature,题目为Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1。

首先对给定样本的基因表达值进行秩次标准化,然后利用经验累积分布函数计算富集分数(ES)。设给定基因集为G,包含基因数为NG,给定单个样本为S,表达谱包含基因数为N,N个基因按它们绝对表达值从高到低确定秩次。i 从1赋值到N,依此计算PGw和PNG。

读到这里,这篇"R语言的ssGSEA.r怎么使用"文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注行业资讯频道。

0