spark中怎么实现二次排序
发表于:2025-02-08 作者:千家信息网编辑
千家信息网最后更新 2025年02月08日,这篇文章给大家介绍spark中怎么实现二次排序,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。import org.apache.spark._ import SparkConte
千家信息网最后更新 2025年02月08日spark中怎么实现二次排序
这篇文章给大家介绍spark中怎么实现二次排序,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
import org.apache.spark._ import SparkContext._ object SecondarySort { def main(args: Array[String]) { val sparkConf = new SparkConf().setAppName(" Secondary Sort ") sparkConf.set("mapreduce.framework.name", "yarn"); sparkConf.set("spark.rdd.compress", "true"); sparkConf.set("spark.serializer","org.apache.spark.serializer.KryoSerializer"); sparkConf.set("spark.storage.memoryFraction", "0.5"); sparkConf.set("spark.akka.frameSize", "100"); sparkConf.set("spark.default.parallelism", "1"); val sc = new SparkContext(sparkConf) val file = sc.textFile("hdfs://namenode:9000/test/secsortdata") val rdd = file.map(line => line.split("\t")). map(x => (x(0),x(1))).groupByKey(). sortByKey(true).map(x => (x._1,x._2.toList.sortWith(_>_))) val rdd2 = rdd.flatMap{ x => val len = x._2.length val array = new Array[(String,String)](len) for(i <- 0 until len) { array(i) = (x._1,x._2(i)) } array } sc.stop() }}
关于spark中怎么实现二次排序就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
排序
内容
更多
帮助
不错
兴趣
小伙
小伙伴
文章
知识
篇文章
参考
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
数据库系统中最重要的人员
网络安全破绽是什么
计算机网络技术专接本必考
无锡编译分布式存储服务器
早上steam无法连接服务器
如影随形小说软件开发
网络安全奖学金 2027
硬件负载均衡服务器F5
华为网络技术大赛 赛区
2018互联网科技产业分析
莫纳什大学网络安全排名
山东网络安全大数据
计算化学服务器配置知乎
视频行业中的软件开发
伟文标签数据库格式
服务管理器 服务器为空
戴尔服务器显卡什么意思
杭州手淘网络技术有限
数据库的表的表头怎么改
我的世界小型服务器多少钱一个月
开票服务器管理端
马星人软件开发中心
九方数据库
深圳市潜力网络技术公司
如何组装微型企业服务器
华品博瑞网络技术有限公司
亚马逊运营中心和云服务器区别
城市专题数据库
定制化国产服务器厂家直销
车载网络技术的含义