spark写orc格式文件
发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,在hive中建表格式存储格式为orccreate table user(id int,name string) stored as orc;spark写文件 val jsons = "hdfs:
千家信息网最后更新 2024年11月11日spark写orc格式文件
在hive中建表格式存储格式为orc
create table user(id int,name string) stored as orc;
spark写文件
val jsons = "hdfs://localhost:9000/test/artist_orc.json" val people = sc.textFile(jsons) val schemaString = "id name" val schema = StructType(schemaString.split(" ").map(fieldName => {if(fieldName == "name") StructField(fieldName, StringType, true) else StructField(fieldName, IntegerType, true)})) val rowRDD = people.map(line=>{ JSONObject.fromObject(line) }).map(p => Row(new Integer(p.get("id").toString), p.get("name"))) val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) val peopleSchemaRDD = hiveContext.createDataFrame(rowRDD, schema) peopleSchemaRDD.write.format("orc").save("hdfs://localhost:9000/user/xb/warehouse/artist_orc/adf")
格式
文件
存储
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
四川宜米互联网科技有限公司
徐州现代软件开发设计规范
老年机显示正在连接服务器
昔阳天气预报软件开发
网络安全vip终身
网络安全技术应用教程
c 数据库读取数据库
关于初中网络安全活动简报
pc25300p服务器专用内存
互联网黑科技动态壁纸
监管仓软件开发定制实施方案
FSA数据库
折跃门服务器未准备好
网络安全队课
网络安全工程师1到3年
软件开发工期进度计划
长沙聚金网络技术部招聘
网络技术公司岗位结构图
个人服务器cpu要求
哈佛全脑数据库的特点
大学生网络安全竞赛什么时候报名
网络安全资金申请报告
猎鹿人无法连接到服务器
哈尔滨计算机网络技术
安徽服务器防火墙品牌
驱动开发和软件开发
网络安全涉及了哪五部分
妇联网络安全宣传材料及展板
每年几月是国家网络安全周
orm数据库时间范围查询