Python垃圾邮件的逻辑回归分类示例分析
发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,这篇文章主要介绍"Python垃圾邮件的逻辑回归分类示例分析",在日常操作中,相信很多人在Python垃圾邮件的逻辑回归分类示例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对
千家信息网最后更新 2025年01月20日Python垃圾邮件的逻辑回归分类示例分析
这篇文章主要介绍"Python垃圾邮件的逻辑回归分类示例分析",在日常操作中,相信很多人在Python垃圾邮件的逻辑回归分类示例分析问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Python垃圾邮件的逻辑回归分类示例分析"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
按以下要求处理数据集
(1)分离出仅含特征列的部分作为 X 和仅含目标列的部分作为 Y。
(2)将数据集拆分成训练集和测试集(70%和 30%)。
建立逻辑回归模型
分别用 LogisticRegression 建模。
结果比对
(1)输出测试集前 5 个样本的预测结果。
(2)计算模型在测试集上的分类准确率(=正确分类样本数/测试集总样本数)
(3)从测试集中找出模型不能正确预测的样本。
(4)对参数 penalty 分别取'l1', 'l2', 'elasticnet', 'none',对比它们在测试集上的预测性能(计算 score)。
拆分特征值和目标数据前面已经可知,预测和模型得分结果也是直接使用模型的方法,下面主要是要测试准确率和找出不能正确预测的样本,以及不同的惩罚下的模型得分,主要运用到Numpy模块和列表list的函数,代码如下:
y_train_pred = model.predict(x_train)# In[26]:train_accu = np.equal(y_train,y_train_pred)print(y_train.shape,y_train_pred.shape)# In[27]:#计算模型在测试集上的分类准确率(=正确分类样本数/测试集总样本数)accuracy = list(train_accu).count(True)/len(list(y_train))print("准确率为"+"%f"%float(accuracy*100)+"%")# In[28]:#从测试集中找出模型不能正确预测的样本。test_accu = list(np.equal(y_pred,y_test))i = 0len_test = len(test_accu)False_index = [][False_index.append(i) for i in range(0,len_test) if test_accu[i]==False]print(x_test[False_index])# In[29]:#对参数 penalty 分别取'l1', 'l2', 'elasticnet', 'none',对比它们在测试集上的预测性能(计算 score)。model2 = LogisticRegression(multi_class='ovr',penalty='l1',max_iter=10000,solver='saga').fit(x_train, y_train)print("penalty='l1'"+'的得分:', model2.score(x_test, y_test))# In[33]:#对参数 penalty 分别取'l1', 'l2', 'elasticnet', 'none',对比它们在测试集上的预测性能(计算 score)。model2 = LogisticRegression(multi_class='ovr',penalty='l2',max_iter=10000).fit(x_train, y_train)print("penalty='l2'"+'的得分:', model2.score(x_test, y_test))# In[31]:model4 = LogisticRegression(multi_class='ovr',penalty='elasticnet',max_iter=10000,solver='saga',l1_ratio=0).fit(x_train, y_train)#模型建立产生一些参数的问题一般都是sklearn的版本问题,要是忽略,就升级更新一下版本就好了solver指定penalty参数的范围print("penalty='elasticnet'"+'的得分:', model4.score(x_test, y_test))# In[32]:model5 = LogisticRegression(multi_class='ovr',penalty='none',max_iter=10000,solver='lbfgs').fit(x_train, y_train)print("penalty='none'"+'的得分:', model5.score(x_test, y_test))
到此,关于"Python垃圾邮件的逻辑回归分类示例分析"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
测试
模型
分类
样本
得分
逻辑
参数
垃圾
示例
邮件
分析
准确率
样本数
学习
性能
数据
结果
问题
方法
更多
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
对网络安全啊看法400字
停车普查数据库
网络安全法之我见
网络安全概念etf
南京汉路网络技术有限公司
软件开发工具数据库
欧洲数据库
华科大网络安全专业
有人说软件开发时一个错误
医学国外常用的数据库有哪些
屏幕共享软件开发好吗
廊坊市方诚网络技术
数据库论文文献
数据库有四种特性
建友网络技术
分布式信息检索数据库
软件开发数据后台保存
阿里云企业邮箱服务器
网络安全法 监控记录
软件开发都要学啥
国内教育软件开发
网络安全补漏网站
未来教育网络技术答案
中专生为什么要学数据库
银行安全邮储银行网络安全
王者注册的服务器怎么删除
r如何设置服务器安全设置
习近平在中央网络安全
网络安全管理工程师
宁夏政务软件开发费用