千家信息网

怎么用R语言进行KM生存

发表于:2024-10-22 作者:千家信息网编辑
千家信息网最后更新 2024年10月22日,本篇内容介绍了"怎么用R语言进行KM生存"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!R是数据分析常
千家信息网最后更新 2024年10月22日怎么用R语言进行KM生存

本篇内容介绍了"怎么用R语言进行KM生存"的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

R是数据分析常用的软件之一,通过各种功能强大的R包,可以简单方便的实现各种分析。在R语言中,能够进行生存分析的R包很多,survival和survminer是其中最基本的两个,survival负责分析,survimner负责可视化,二者相结合,可以轻松实现生存分析。具体过程如下

1. 准备生存数据

对于每个个体而言,其生存数据会出现两种情况,第一种是观测到生存时间,通常用1表示,第二种则是删失。通常用0表示。survival自带了一个测试数据lung, 内容如下所示

每一行代表一个样本,time表示生存时间,status表示删失情况,这里只有1和2两种取值,默认排序后的第一个level对应的值为删失,这里则为1表示删失。其他列为样本对应的性别,年龄等基本信息。

2. 进行生存分析

这里根据性别这个二分类变量,采用KM算法来估计生存曲线,代码如下

fit中提取结果构成了d这个数据框,可以看到已经包含了每个时间点的生存概率,删失等信息,通过这些信息,完全可以自己写代码来画图。为了方便,我们直接采用survminer中的函数来进行可视化。

3. 分析结果的可视化

最基本的可视化方式如下

library("survminer")
ggsurvplot(fit)

效果图如下所示

两条不同颜色的折线代表不用性别的生存曲线。对于两组生存数据,通常都需要比较二者之间是否具有差异,最常用的算法是log-rank test。survminer在可视化结果时,也支持进行差异检验,并将对应的p值标记在图上,代码如下

ggsurvplot(fit, pval = TRUE)

效果图如下

上图中的p值小于0.05,说明不同性别的生存曲线存在显著差异。除了这些基本功能外,该函数还有多个参数,可以灵活的展示结果,比如添加置信区间,代码如下

ggsurvplot(fit, pval = TRUE, conf.int = TRUE)

效果图如下

也支持标记生存时间的中位数,代码如下

ggsurvplot(fit, pval = TRUE, conf.int = TRUE, surv.median.line = "hv")

效果图如下

该函数还有非常多的参数,可以非常个性化的调整可视化结果,更加详细的参数用法请参考官方的帮助文档。

"怎么用R语言进行KM生存"的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!

分析 数据 可视化 代码 结果 常用 性别 效果 效果图 时间 语言 信息 内容 函数 参数 差异 情况 曲线 不同 代表 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 事业单位招聘网络安全员 服务器连接电视后网络打不开 邮储银行网络安全周宣传 网络安全的就业方向都有哪些 护苗网络安全课5集 服务器的容量与什么有关 浅谈计算机网络安全对策论文 方舟服务器图鉴管理员工具 铁路站段网络安全专项检查 hp服务器u盘装系统找不到硬盘 数据库备份的两种方法 吕梁网络安全教育活动 网络安全概念股有哪几个 深圳百思互联网科技有限公司 布达佩斯天气预报软件开发 教你一招电脑软件开发 网络技术发展前沿打击犯罪行为 陕西软件开发报价 桌面如何进入mysql数据库 软件开发环境都有哪些问题 服务器管理员求职简历 数据库check语句的两种写法 数据库处于简单恢复模式 杭州安卓软件开发公司如何选择 企业网络安全培训通讯稿 带数据库的vlookup函数 软件开发测试工程师基本工资 网络安全战略 应对 网络安全联席会发言 数据库中数据约束的概念
0