spark mllib分类之如何支持向量机
发表于:2025-02-02 作者:千家信息网编辑
千家信息网最后更新 2025年02月02日,小编给大家分享一下 spark mllib分类之如何支持向量机,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!胃癌转移数据说明肾细胞癌转移情况(有转移 y=1,无转移 y=2)x1:确
千家信息网最后更新 2025年02月02日spark mllib分类之如何支持向量机
小编给大家分享一下 spark mllib分类之如何支持向量机,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!
胃癌转移数据说明
肾细胞癌转移情况(有转移 y=1,无转移 y=2)x1:确诊时患者年龄(岁)x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级x3:肾细胞癌组织内微血管数(MVC)x4:肾癌细胞核组织学分级,由低到高共4级x5:肾细胞癌分期,由低到高共4级y x1 x2 x3 x4 x50 59 2 43.4 2 1
运行代码如下
package spark.logisticRegressionimport org.apache.spark.mllib.classification.{SVMWithSGD}import org.apache.spark.mllib.evaluation.MulticlassMetricsimport org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.mllib.regression.LabeledPointimport org.apache.spark.mllib.util.MLUtilsimport org.apache.spark.{SparkConf, SparkContext}/** * MLLib分类,逻辑回归,是分类,不是回归 * 支持向量机分析胃癌转移判断 * Created by eric on 16-7-17. */object SVMTest { val conf = new SparkConf() //创建环境变量 .setMaster("local") //设置本地化处理 .setAppName("LogisticRegression4") //设定名称 val sc = new SparkContext(conf) def main(args: Array[String]) { val data = MLUtils.loadLibSVMFile(sc, "./src/main/spark/logisticRegression/wa.txt") //读取数据文件,一定注意文本格式 val splits = data.randomSplit(Array(0.7, 0.3), seed = 11L) //对数据集切分 val parsedData = splits(0) //分割训练数据 val parseTtest = splits(1) //分割测试数据 val model = SVMWithSGD.train(parsedData,50) //训练模型 val predictionAndLabels = parseTtest.map { //计算测试值 case LabeledPoint(label, features) => //计算测试值 val prediction = model.predict(features) //计算测试值 (prediction, label) //存储测试和预测值 } val metrics = new MulticlassMetrics(predictionAndLabels) //创建验证类 val precision = metrics.precision //计算验证值 println("Precision = " + precision) //打印验证值 val patient = Vectors.dense(Array(70,3,180.0,4,3)) //计算患者可能性 if(patient == 1) println("患者的胃癌有几率转移。") //做出判断 else println("患者的胃癌没有几率转移。") //做出判断 //Precision = 0.5555555555555556 //患者的胃癌没有几率转移。 }}
wa.txt
0 1:59 2:2 3:43.4 4:2 5:10 1:36 2:1 3:57.2 4:1 5:10 1:61 2:2 3:190 4:2 5:11 1:58 2:3 3:128 4:4 5:31 1:55 2:3 3:80 4:3 5:40 1:61 2:1 3:94 4:4 5:20 1:38 2:1 3:76 4:1 5:10 1:42 2:1 3:240 4:3 5:20 1:50 2:1 3:74 4:1 5:10 1:58 2:2 3:68.6 4:2 5:20 1:68 2:3 3:132.8 4:4 5:21 1:25 2:2 3:94.6 4:4 5:30 1:52 2:1 3:56 4:1 5:10 1:31 2:1 3:47.8 4:2 5:11 1:36 2:3 3:31.6 4:3 5:10 1:42 2:1 3:66.2 4:2 5:11 1:14 2:3 3:138.6 4:3 5:30 1:32 2:1 3:114 4:2 5:30 1:35 2:1 3:40.2 4:2 5:11 1:70 2:3 3:177.2 4:4 5:31 1:65 2:2 3:51.6 4:4 5:40 1:45 2:2 3:124 4:2 5:41 1:68 2:3 3:127.2 4:3 5:30 1:31 2:2 3:124.8 4:2 5:3
结果如图
看完了这篇文章,相信你对" spark mllib分类之如何支持向量机"有了一定的了解,如果想了解更多相关知识,欢迎关注行业资讯频道,感谢各位的阅读!
患者
数据
细胞
胃癌
测试
分类
向量
支持
几率
验证
篇文章
训练
代码
内皮
分期
变量
可能性
名称
因子
完了
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
装备强化的数据库
贵阳大数据库最新消息
化学各个数据库
北京耗材阳光采购数据库没有信息
网络技术知识点汇总
嵌入式软件开发板级测试
江苏省网络安全测评中心
我的世界手游防炸服务器
工程工业控制 软件开发
kof97怎么设计服务器
西城区电子软件开发介绍
nbaps4国内服务器
oracle数据库编辑器
数据库运维形考任务一答案
做软件开发的是什么专业
免备案宝塔服务器
失落的方舟美东服务器有哪些
pubg国际服服务器掉线
网络安全应急暨网络安全培训
国际网络安全软件有哪些公司
如何开展服务器可靠性设计
北京耗材阳光采购数据库没有信息
app什么软件开发好
数据库修改属性用啥命令动词
指纹识别软件开发毕业设计
我们的网络安全由你们来守护
网络安全存储服务器机箱哪家好
数据库相似性是什么
数据库与程序的安装
西安建设银行软件开发中心