导航：首页 > 服务器 >

spark mllib如何实现快速迭代聚类

发表于：2025-02-04 作者：千家信息网编辑

千家信息网最后更新 2025年02月04日，小编给大家分享一下spark mllib如何实现快速迭代聚类，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！运行代码如下package spark.clusteringimport o

千家信息网最后更新 2025年02月04日spark mllib如何实现快速迭代聚类

小编给大家分享一下spark mllib如何实现快速迭代聚类，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！

运行代码如下

package spark.clusteringimport org.apache.spark.mllib.clustering.{PowerIterationClustering}import org.apache.spark.{SparkConf, SparkContext}/**  * 快速迭代聚类  * 基本原理：使用含有权重的无向线将样本数据连接在一张无向图中，之后按照相似度划分，  * 使得划分后的子图内部具有最大的相似度二不同的子图具有最小的相似度从而达到聚类的效果．  * 数据源要求　　RDD[(Long), (Long), (Double)]  * 第一个参数和第二个参数是第一个点和第二个点的编号，即其之间 ID，第三个参数是相似度计算值．  * Created by eric on 16-7-21.  */object PIC {  val conf = new SparkConf()                                     //创建环境变量    .setMaster("local")                                             //设置本地化处理    .setAppName("pic")                              //设定名称  val sc = new SparkContext(conf)  def main(args: Array[String]) {    val data = sc.textFile("./src/main/spark/clustering/pic.txt")    val similarities = data.map { line =>      val parts = line.split(" ")      (parts(0).toLong, parts(1).toLong, parts(2).toDouble)    }    val pic = new PowerIterationClustering()      .setK(2) //设置聚类数      .setMaxIterations(10) //设置迭代次数    val model = pic.run(similarities)    model.assignments.foreach {a =>      println(s"${a.id} -> ${a.cluster}")    }  }}

pic.txt

0 1 1.00 2 1.00 3 1.01 2 1.01 3 1.02 3 1.03 4 0.14 5 1.04 15 1.05 6 1.06 7 1.07 8 1.08 9 1.09 10 1.010 11 1.011 12 1.012 13 1.013 14 1.014 15 1.0

结果如下

看完了这篇文章，相信你对"spark mllib如何实现快速迭代聚类"有了一定的了解，如果想了解更多相关知识，欢迎关注行业资讯频道，感谢各位的阅读！

很赞哦！

迭代相似参数数据篇文章无向不同最大最小三个之间代码原理变量名称完了效果数据源更多权重数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全 2018网络安全博览会 pm2.5数据库网络安全由哪个部门管理员暗黑4服务器多大存储服务器是否支持热拔插网络技术和数据库技术区别沙怒服务器数据库中fetch是什么意思简述数据库设置密码的步骤微信连接不上服务器怎么办虚拟机做域服务器银行网络技术岗能力要求 oracle查找数据库名说说你对网络安全信息安全上海携程网络技术大楼主要业务网上防骗数据库中科院中科软件开发科技公司数据库 trc文件虚拟专用网络技术的应用场景网络安全硬件市场帝国神话服务器没更新进不去惠普服务器服务电话网络安全的市场特征长沙帝国网络技术黄石专业的软件开发中心软件开发就业前景走向 wow服务器格瑞姆巴托滁州手机软件开发公司哪家好三级网络技术地址类别穿越火线用的哪个服务器

千家信息网

千家信息网

spark mllib如何实现快速迭代聚类

运行代码如下

结果如下

Linux中怎么给目录创建软链接或硬链接

如何搭建ansible roles

相关文章