Spark sql的批处理物理计划BatchScanExec有什么用
发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,这篇文章将为大家详细讲解有关Spark sql的批处理物理计划BatchScanExec有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。BatchScanEx
千家信息网最后更新 2025年02月05日Spark sql的批处理物理计划BatchScanExec有什么用
这篇文章将为大家详细讲解有关Spark sql的批处理物理计划BatchScanExec有什么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
BatchScanExec是batch类的物理计划,对应的逻辑计划是DataSourceV2Relation,是Datasource。
它的入参是Scan类,Scan类有两个重要方法,一个获取分区列表信息;另一个方法获取读取器工厂。
override lazy val partitions: Seq[InputPartition] = batch.planInputPartitions() override lazy val readerFactory: PartitionReaderFactory = batch.createReaderFactory() override lazy val inputRDD: RDD[InternalRow] = { new DataSourceRDD(sparkContext, partitions, readerFactory, supportsColumnar) }
planInputPartitions方法获取分区列表;createReaderFactory获取分区读取者工厂,这两者决定一个DataSourceRDD来作为inputRDD对象。
对于传统的DataSource类,只要实现对应数据源的Scan子类就可以使用了。
而StreamingDataSourceV2Relation对应的物理计划是MicroBatchScanExec和ContinuousScanExec,这时候Scan就不用了,而使用MicroBatchStream和ContinuousStream两个流的定义类。
关于"Spark sql的批处理物理计划BatchScanExec有什么用"这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
物理
方法
篇文章
两个
工厂
更多
不错
实用
重要
不用
传统
信息
内容
子类
对象
数据
数据源
文章
知识
逻辑
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
php写入数据库乱码
韩城市网络安全保卫大队
tftp服务器哪个版本好用
社交网络技术
负责网络技术的部门
操作数据库的语言叫什么
歌华有线访问服务器认证超时
邮件服务器有哪些协议
全球网络安全事故
网络安全法实施条例第三十七条
如何把多个文件打包成数据库
国内地铁网络安全典型事件
崇州网络安全宣传周
广州环境监测软件开发报价
交通工具数据库
杭州前端软件开发哪家可靠
已经有一个数据库怎么写软件
软件开发公司会有电脑吗
西电网络技术
荒野日记连接不上服务器
网络安全宣传志愿者怎么报名
网络安全为人民手抄报高中
加强网络安全技术平台建设
负责网络技术的部门
网络安全PSD图片模板
震惊世界的网络安全事件
计算机网络技术是计算机类吗
数据库能为一标识一个元组
泰拉瑞亚pc数据库
有关股市的数据库