千家信息网

R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析

发表于:2024-11-22 作者:千家信息网编辑
千家信息网最后更新 2024年11月22日,本文小编为大家详细介绍"R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析",内容详细,步骤清晰,细节处理妥当,希望这篇"R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析"文章能帮助大家
千家信息网最后更新 2024年11月22日R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析

本文小编为大家详细介绍"R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析",内容详细,步骤清晰,细节处理妥当,希望这篇"R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析"文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

使用Mfuzz进行转录组基因表达模式聚类分析

Mfuzz是用来进行不同时间点转录组数据表达模式聚类分析的R包,使用起来非常方便,直接输入不同样本归一化后的counts或者FPKM及TPM值就可进行聚类。输入文件的格式很简单:

行为基因,列为样本,保存为制表符分隔的txt文件。

## 安装R包if (!requireNamespace("BiocManager", quietly = TRUE))    install.packages("BiocManager")BiocManager::install("Mfuzz")## 加载R包library("Mfuzz")## 导入基因表达量gene <- read.table("input.txt",header = T,row.names=1,sep="\t")## 转换格式gene_tpm <- data.matrix(gene)eset <- new("ExpressionSet",exprs = gene_tpm)## 过滤缺失超过25%的基因gene.r <- filter.NA(eset, thres=0.25)

由于输入的表达量中不允许有缺失值NA出现,所以我们要填补缺失值。

## mean填补缺失gene.f <- fill.NA(gene.r,mode="mean")## knn/wknn方法表现更好,但是计算起来比较复杂gene.f <- fill.NA(gene.r,mode="knn")gene.f <- fill.NA(gene.r,mode="wknn")## 过滤标准差为0的基因tmp <- filter.std(gene.f,min.std=0)## 标准化gene.s <- standardise(tmp)

聚类时,我们需要输入两个参数,c和m。c是我们期望的聚类个数,由自己定义。m由mestimate计算得到。

## 聚类个数c <- 6## 计算最佳的m值m <- mestimate(gene.s)## 聚类cl <- mfuzz(gene.s, c = c, m = m)## 查看每类基因数目cl$size## 查看每类基因IDcl$cluster[cl$cluster == 1]## 输出基因IDwrite.table(cl$cluster,"output.txt",quote=F,row.names=T,col.names=F,sep="\t")## 绘制折线图mfuzz.plot(gene.s,cl,mfrow=c(2,3),new.window= FALSE)

读到这里,这篇"R语言中如何使用Mfuzz进行转录组基因表达模式聚类分析"文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注行业资讯频道。

0