千家信息网

怎么使用ballgown进行转录本水平的差异分析

发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这期内容当中小编将会给大家带来有关怎么使用ballgown进行转录本水平的差异分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。常见的转录组差异分析有两种策略,一种
千家信息网最后更新 2025年02月01日怎么使用ballgown进行转录本水平的差异分析

这期内容当中小编将会给大家带来有关怎么使用ballgown进行转录本水平的差异分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

常见的转录组差异分析有两种策略,一种是基于raw count的定量方式,比如DESeq2, edgeR等;另外一种是基于FPKM/RPKM的定量方式,比如cuffdiff等。

在之前的文章中,我们也提到过基于FPKM值的pipeline由tophat+cufflinks+cuffdiff 升级更新为hisat + stringTie + ballgown。ballgown这个R包也是针对FPKM值的表达量进行差异分析,有两种方式可以得到转录本水平的FPKM值。

1. stringTie

为了方便下游的ballgown分析,在stringTie软件中直接添加-b参数就可以生成ballgown的输入文件,基本用法如下

stringtie -p 10 \-G hg19.gtf \-o output.gtf  \-b ballgown_out_dir -e \align.sorted.bam
2. tablemaker

tablemaker软件通过调用cufflinks软件,也可以生成ballgown的输入文件,该软件可以从以下链接下载

https://figshare.com/articles/Tablemaker_Linux_Binary/1053137

基本用法如下

tablemaker \-p 4 \-q -W \-G hg19.gtf \-o out_dir \align.sorted.bam

对于每个样本,都会生成一个文件夹,包含如下5个文件

e_data.ctabe2t.ctabi2t.ctabi_data.ctabt_data.ctab

e代表exon, i代表intron, t代表transcript_data的文件为不同水平的表达量值。i2t表示intron和transcript之间的对应关系,e2t表示exon和transcript的对应关系。

输入文件准备好之后,就可以进行差异分析了。现在的R包都是高度封装的,几个函数就可以完成整套分析了。首先是读取所有样本的输入文件,代码如下

library(ballgown)bg = ballgown(  samples = c("sampleA.dir", "sampleB.dir"),  meas='all')

samples 指定所有样本的ballgown的输入文件夹。导入成功之后,可以通过*expr函数在R中查看样本在不同水平的表达量信息, *的取值范围为i, e, tg,代表不同水平。

查看转录本水平的表达量的代码示例如下

transcript_fpkm = texpr(bg, 'FPKM')

需要注意的是,intron, exon, transcript 这些水平的表达量信息在原本的ctab文件中都有,而gene水平的表达量信息,需要根据基因对应的转录本的表达量来计算,所以比较费时。

读取之后,需要设置样本分组, 代码如下

pData(bg) <- data.frame(  id=sampleNames(bg),  group=rep(c(1,0), each=3))

其实就是一个数据框,第一列为样本名称,第二列为样本对应的分组。

ballgown会自动根据group的种类进行不同类型的差异分析,如果样本分为两组,则进行两组间的差异分析,如果样本为多组,则进行多组间的差异分析。

ballgown通过stattest函数进行差异分析,支持以下4种水平的差异分析

  1. exon

  2. intron

  3. gene

  4. transcript


通过feature参数指定差异分析的水平。常规用法如下

# 转录本水平的差异分析stat_results = stattest(bg,  feature='transcript',  meas='FPKM',  covariate='group')# 基因水平的差异分析stat_results = stattest(bg,  feature='gene',  meas='FPKM',  covariate='group')

ballgown还支持时间序列的差异分析,用法如下

pData(bg) <- data.frame(  pData(bg),  time=rep(1:10, 2))results <- stattest(bg,  feature='transcript',  meas='FPKM',  covariate='time',  timecourse=TRUE)

只需要添加timecourse=TRUE即可。ballgown还支持自定义差异分析的模型。

上述就是小编为大家分享的怎么使用ballgown进行转录本水平的差异分析了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。

分析 差异 水平 文件 样本 输入 不同 代表 软件 代码 信息 函数 方式 支持 生成 内容 参数 基因 就是 文件夹 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 广州无源网络技术开发服务标准 我的世界可以赚货币的服务器 电力新闻网络安全预警单 广日电梯G15服务器图片 北京刘然软件开发 数据库连接关不关 优优互联网科技公司官网 jdbc访问数据库的基本操作 网络技术与控制 哪家的云服务器比较好 哈尔滨商业大学网络技术中心 数据库安全的三个基本要求 深圳酒店软件开发咨询 DNF跨区后服务器一起的嘛 宁波软件开发靠谱吗 上海个人软件开发哪个好 管道数据库零件号的作用 汇川 s400服务器说明书 怎么导出数据库MySQL 腾讯分布式文件存储数据库 计算机网络安全文献在线观看 嵌入式软件开发相关比赛 2020年互联网网络安全峰会 气象网络安全检查 需求分析图书馆管理系统数据库 网络安全审计推荐机构 数据库技术及应用填空题 福建好的软件开发品质保障 包头市短期云计算网络安全培训班 为什么京东服务器最好
0