python计算IV值及使用
发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,更多大数据分析、建模等内容请关注公众号《bigdatamodeling》在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:def Cal
千家信息网最后更新 2025年02月04日python计算IV值及使用
更多大数据分析、建模等内容请关注公众号《bigdatamodeling》
在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,python计算IV值的代码如下:
def CalcIV(Xvar, Yvar): N_0 = np.sum(Yvar==0) N_1 = np.sum(Yvar==1) N_0_group = np.zeros(np.unique(Xvar).shape) N_1_group = np.zeros(np.unique(Xvar).shape) for i in range(len(np.unique(Xvar))): N_0_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 0)].count() N_1_group[i] = Yvar[(Xvar == np.unique(Xvar)[i]) & (Yvar == 1)].count() iv = np.sum((N_0_group/N_0 - N_1_group/N_1) * np.log((N_0_group/N_0)/(N_1_group/N_1))) return iv def caliv_batch(df, Kvar, Yvar): df_Xvar = df.drop([Kvar, Yvar], axis=1) ivlist = [] for col in df_Xvar.columns: iv = CalcIV(df[col], df[Yvar]) ivlist.append(iv) names = list(df_Xvar.columns) iv_df = pd.DataFrame({'Var': names, 'Iv': ivlist}, columns=['Var', 'Iv']) return iv_df
其中,df是分箱后的数据集,Kvar是主键,Yvar是y变量(0是好,1是坏)。代码运行结果如下:
变量
重要
代码
数据
重要性
公众
内容
数据分析
更多
结果
区分度
分析
统计
评估
运行
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
光明区网络技术转移
600服务器机柜厂家
公司网络安全的部门名称
服务器如何防护网络安全
网络安全培训材料
政务外网网络安全态势
深圳吉屋网络技术怎么样
网络安全与执法研究生好就业吗
服务器的部署
龙源数据库官网入口教育培训
操作mysql数据库语句的软件
北京正规软件开发服务郑重承诺
经开区服务器上门回收价格
苏州网络安全公司
网络技术的应用
北京环球软件开发公司
社区诊断数据库
英国智能汽车网络安全准则
服务器托管劣势
怎么看数据库字符集版本
网络安全作文初一500字
qq聊天记录数据库破解
数据库主变量的作用是什么
江苏工业软件开发正规平台
上海万网互联网科技有限公司
辽宁网络安全大讲堂观后感
索引数据库英语
数据库表txt怎么写
宁波东联网络技术有限公司
半条命服务器指令