如何确定最佳logistic回归方程
如何确定最佳logistic回归方程,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
问题:您好,想问下二元logistic回归的多因素分析中如何选择检验方法。是都选最常用的"向后(有条件)",还是每个检验方法试过来然后根据什么指标选用一种检验方法?
回复:回归模型的拟合,我们可以将回归拟合视为一种"探索性"分析,即通过回归拟合探索出最优的回归方程,logistic回归亦然。因此,我们可以根据专业知识,确定哪些需要变量引入logistic回归方程中,当然也可以采用不同的逐步回归方法进行拟合,根据各种统计量判断回归方程的优劣,找出"最优"的回归方程。概括起来有大概有如下几类指标
一、模型拟合优度检验
如果预测值与实际观测值相近,说明模型的拟合效果好,统计量的值偏小,对应的P值较大。检验假设H0:模型的拟合效果好,α可取0.1 或0.2。
1、偏差检验,统计量为χD2。
2、Pearsonχ2检验,统计量为χ2
3、Homser-Lemeshow 检验,统计量χHL2
判断原则:χ2值越小,P越大,模型拟合效果越好。
二、模型拟合优度信息指标
1、-2lnL。
2、AIC 准则。
3、SC准则。
在其他条件不变的情况下,这三个指标越小表示模型拟合的越好。
三、logistic 回归模型的预测准确度
1、广义决定系数:Cox-Snell 广义决定系数(Cox-SnellR2)、Nagelkerke广义决定系数(Nagelkerke R2),与线性回归分析中的决定系数R2相似,这2个指标都在0-1间取值,指标越大,说明变异中被模型解释的比例越大,模型预测的准确性越高。
2、预测概率与观测值之间的关联,常用的评价指标有Somers'D 、Goodman-Kruskal Gamma、
Kendall's Tau-a 和KendaIl'sTau-c,指标的绝对值越大,表示预测概率与反应变量之间的关联程度越高,也就意味着模型的预测能力越强。
四、预测准确率
用于评价logistic回归模型的预测准确性,准确率越高效果越好。
五、"最佳"模型的选择
读者可结合上述统计指标对拟合所得到模型进行综合评价,在统计分析的基础上,结合专业知识,从可解释性、简约性、变量的易得性等方面,最终选出"最佳"模型。通常"最佳"模型不是一次计算就可以确定的,往往是要对变量做不同的组合分析最终确定。
看完上述内容,你们掌握如何确定最佳logistic回归方程的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!