Spark算子的转换操作介绍
发表于:2025-01-31 作者:千家信息网编辑
千家信息网最后更新 2025年01月31日,这篇文章主要介绍"Spark算子的转换操作介绍",在日常操作中,相信很多人在Spark算子的转换操作介绍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Spark算子的转
千家信息网最后更新 2025年01月31日Spark算子的转换操作介绍
这篇文章主要介绍"Spark算子的转换操作介绍",在日常操作中,相信很多人在Spark算子的转换操作介绍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"Spark算子的转换操作介绍"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
##概述
每一次转换操作都会产生不同的RDD,供给下一个操作使用。
####算子
解决问题其实是将问题的初始化状态,通过一系列的操作Operate对问题的状态进行转换,然后达到完成解决的状态
####惰性机制
RDD的转换过程是惰性求值的,也就是,整个转换过程只记录轨迹,并不会发生真正的计算,只有遇到了行动操作时,才会触发真正的计算。
##filter(func)
过滤出满足函数func的元素,并返回存入一个新的数据集
val conf = new SparkConf().setAppName("spark").setMaster("local") val sc = new SparkContext(conf) val rdd = sc.parallelize(List(1,2,3,4,5,6)) val result = rdd.filter(_%2==0) println(result.collect().mkString(","))
##map(func)
将每个元素传递到函数func中进行操作,并将结果返回为一个新的数据集。
collect()以数组的形式返回rdd的结果,但列表中每个数乘以2
val conf = new SparkConf().setAppName("spark").setMaster("local") val sc = new SparkContext(conf) val rdd = sc.parallelize(List(1,2,3,4,5,6)) val mapResult = rdd.map(_*2) println(mapResult.collect().toBuffer)
##flatMap(func)
与map相似,但是每个输入元素都可以映射到0或多个输出结果,所以func应该返回一个序列,而不是单一元素
val conf = new SparkConf().setAppName("RDD").setMaster("local[*]") val sc = new SparkContext(conf) val arrayRDD: RDD[List[Int]] = sc.makeRDD(Array(List(1,2),List(3,4))) val listRDD: RDD[Int] = arrayRDD.flatMap(data=>data) listRDD.collect().foreach(println)
val conf = new SparkConf().setAppName("spark").setMaster("local") val sc = new SparkContext(conf) val rdd = sc.parallelize(Array("a b c","b c d")) val result = rdd.flatMap(_.split(" ")) println(result.collect().mkString(","))
##sample
参数1 是否抽出的数据放回
参数2 抽样比例 浮点型
参数3 种子,默认值
val conf = new SparkConf().setAppName("spark").setMaster("local") val sc = new SparkContext(conf) val rdd = sc.parallelize(1 to 10) val result = rdd.sample(false,0.5) println(result.collect().mkString(","))
##union
求并集
##intersection
求交集
##distinct
去除重复元素
到此,关于"Spark算子的转换操作介绍"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!
算子
元素
问题
学习
参数
数据
状态
结果
函数
惰性
更多
过程
帮助
不同
实用
相似
接下来
也就是
交集
只有
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
达梦数据库decode
数据库批量插入单次设置为多少
免费文件服务器
数据库统计新增字段
服务器突然开不了机
网络安全与移动互联网
勤哲服务器系统管理密码修改
扬中财务软件开发
安阳互联网科技有限公司
国外文献数据库
查看数据库 锁
小学生网络安全教育主题
本科网络安全毕业设计
软考 数据库工程师考试
2021年网络安全试点赛
网络安全高级工程师pdf
软件开发手机软件开发
服务器异响
软件开发的需求有哪些
老板服务器
做简单app软件开发
英国情报网络安全
互联网网络安全观的重要理念
软件开发不是对应专业
英文免费检索的数据库
小糖互联网络科技有限公司
支付宝网络技术信息技术
江苏挑选软件开发简介
网络安全工程学什么
ibm 二手服务器