spark写orc格式文件
发表于:2025-02-04 作者:千家信息网编辑
千家信息网最后更新 2025年02月04日,在hive中建表格式存储格式为orccreate table user(id int,name string) stored as orc;spark写文件 val jsons = "hdfs:
千家信息网最后更新 2025年02月04日spark写orc格式文件
在hive中建表格式存储格式为orc
create table user(id int,name string) stored as orc;
spark写文件
val jsons = "hdfs://localhost:9000/test/artist_orc.json" val people = sc.textFile(jsons) val schemaString = "id name" val schema = StructType(schemaString.split(" ").map(fieldName => {if(fieldName == "name") StructField(fieldName, StringType, true) else StructField(fieldName, IntegerType, true)})) val rowRDD = people.map(line=>{ JSONObject.fromObject(line) }).map(p => Row(new Integer(p.get("id").toString), p.get("name"))) val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) val peopleSchemaRDD = hiveContext.createDataFrame(rowRDD, schema) peopleSchemaRDD.write.format("orc").save("hdfs://localhost:9000/user/xb/warehouse/artist_orc/adf")
格式
文件
存储
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
金铲铲之战服务器和版本
不同数据库怎么分盘
软件开发技能的具体应用领域
工信部通讯网络安全监管
软件开发电商机构
qq聊天采用数据库技术
魔兽是什么软件开发的
画图连线类软件开发
mysql数据库报告书
宿迁直销网络技术市场
ccs软件开发过程
ai多媒体服务器 英文
网络安全幽默短片
死亡之翼服务器安琪拉开门
软件开发使用云桌面
三级网络技术考过的
软件开发生命周期指南
网络安全法法条
教学云管理服务器厂家
可以检索专利的数据库
南昌大学数据库实验2
服务器开发属于it行业吗
广东广物互联网科技待遇
网络安全时间价值
暴风下载软件开发
我的世界豆丁服务器
服务器可以创建几个实例
大数据库实施课程
杭州软件开发公司开早会
信用数据库应用