记载我的spark源码阅读火花
发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,记载我的spark源码阅读火花知识点:1、seq:列表,适合存有序重复数据,进行快速插入/删除元素等场景,Set是集合,适合存无序非重复数据,进行快速查找海量元素等场景memoryKeys = Seq
千家信息网最后更新 2025年02月05日记载我的spark源码阅读火花
记载我的spark源码阅读火花
知识点:
1、seq:列表,适合存有序重复数据,进行快速插入/删除元素等场景,
Set
是集合,适合存无序非重复数据,进行快速查找海量元素等场景
memoryKeys = Seq( )
2、private 声明变量为私有
privateval hadoopConf = SparkHadoopUtil.get.newConfiguration(conf)
private[this] val value
private[spark],声明变量为私有,并且在包spark是可见的,这里的[spark],是一种保护的作用域。
这是Master的类声明,同样在master域里
private[master] class Master(
3、没有括号的函数
下面是个函数调用
hellotheworld //无参数不括号
4、可变参数的函数
(s:*)={ s.foreach(x=>(x))}
5、函数的奇葩定义:
(x:y:):=x+y =(x:y:)=>x+y (x:)(y:):=x+y anonymous=(x:y:)=>x+y
6、import:可以在任何地方出现,作用范围是直到包含该语句的块末尾,好处是避免产生名称冲突。
SparkConf(loadDefaults: Boolean) Cloneable Logging { SparkConf._
7、this:函数的末尾最后一句
setExecutorEnv(variables: Seq[(StringString)]): SparkConf = { ((kv) <- variables) { setExecutorEnv(kv) } }
该函数返回SparkConf类型的值
8、模式匹配之master配置类型
master match{case "local" =>case LOCAL_N_REGEX(threads) =>case LOCAL_N_FAILURES_REGEX(threads, maxFailures) =>case SPARK_REGEX(sparkUrl) =>case LOCAL_CLUSTER_REGEX(numSlaves, coresPerSlave, memoryPerSlave) =>
case "yarn-standalone" | "yarn-cluster" =>
case "yarn-client" =>
case SIMR_REGEX(simrUrl) =>
case mesosUrl @ MESOS_REGEX(_) =>
可见有上述几种配置类型
9、scala的Parallelize实现
第一种RDD生产方式,就是从本地的collection生成,可以看见生成的是ParallelCollectionRDD类型的
parallelize[T: ClassTag]( seq: Seq[T]numSlices: Int = defaultParallelism): RDD[T] = withScope { assertNotStopped() ParallelCollectionRDD[T](seqnumSlicesMap[IntSeq[String]]())}
函数
类型
作用
元素
参数
变量
场景
括号
数据
末尾
生成
私有
配置
源码
火花
生产方式
名称
地方
奇葩
好处
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
dnf连接服务器超时
怀旧服tbc服务器崩溃
武当云平台网络安全
沂慧网络技术有限公司
网络安全管理分工
存储管理平台服务器
软件开发信息理解误差
蹭网络安全吗
菏泽公安局网络安全大队电话
聊天软件开发难点
qq代理服务器
php ci框架 数据库
晟同网络技术
长沙有哪些网络技术学院
网络技术封装与解封
提升全民网络安全意识和防护技能
360网络安全应急
全国网络安全培训教育
oracle更新一组数据库
网络安全排雷总结
杭州九歌网络技术有限公司
h2数据库无法保存数据库
企业应用开发和游戏软件开发
中职计算机网络技术技能大赛
离线瓦片地图服务器
全国网络安全培训教育
物联网非关系数据库技术
唐山森联互联网科技有限公司
许昌市公安局网络安全支队办公地
易语言数据库操作模块