Spark 整合hive 实现数据的读取输出
发表于:2025-02-03 作者:千家信息网编辑
千家信息网最后更新 2025年02月03日,实验环境: linux centOS 6.7 vmware虚拟机spark-1.5.1-bin-hadoop-2.1.0apache-hive-1.2.1eclipse 或IntelJIDea 本次使
千家信息网最后更新 2025年02月03日Spark 整合hive 实现数据的读取输出
实验环境: linux centOS 6.7 vmware虚拟机
spark-1.5.1-bin-hadoop-2.1.0
apache-hive-1.2.1
eclipse 或IntelJIDea 本次使用eclipse.
代码:
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.sql.DataFrame;import org.apache.spark.sql.hive.HiveContext;public class SparkOnHiveDemo {public static void main(String[] args) { // 首先还是创建SparkConf SparkConf conf = new SparkConf().setAppName("HiveDataSource"); // 创建JavaSparkContext JavaSparkContext sc = new JavaSparkContext(conf); // 创建HiveContext,注意,这里,它接收的是SparkContext作为参数,不是JavaSparkContext HiveContext hiveContext = new HiveContext(sc.sc()); //1.可以使用HiveContext 下面的sql(xxx语句)执行HiveSQL语句 //1 .删除表,创建表 // stars_infos ,stars_scores hiveContext.sql("DROP TABLE IF EXISTS stars_infos"); hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_infos(name STRING,age INT) " + "row format delimited fields terminated by ','"); //2.向表里面导入数据 hiveContext.sql("LOAD DATA " + "LOCAL INPATH " + "'/root/book/stars_infos.txt' " + "INTO TABLE stars_infos"); hiveContext.sql("DROP TABLE IF EXISTS stars_scores"); hiveContext.sql("CREATE TABLE IF NOT EXISTS stars_scores(name STRING,score INT) " + "row format delimited fields terminated by ','"); hiveContext.sql("LOAD DATA " + "LOCAL INPATH " + "'/root/book/stars_score.txt' " + "INTO TABLE stars_scores"); //3.从一张已经存在的hive表里面拿数据,转换为DF DataFrame superStarDataFrame = hiveContext.sql("SELECT si.name,si.age,ss.score " + "FROM stars_infos si " + "JOIN stars_scores ss ON si.name=ss.name " + "WHERE ss.score>=90"); //4.把DF的数据再持久化到hive中去,千万别和registerTemtable搞混了 hiveContext.sql("DROP TABLE IF EXISTS superStar"); superStarDataFrame.saveAsTable("superStar"); //5.直接从Hive中得到DF hiveContext.table("superStar").show(); sc.close(); }}
元数据:
可以下载附件,然后上传到指定的目录下。
把程序打包jar后上传到linux指定的目录下,写一个脚本。脚本附件见正文。具体内容修改即可。
运行脚本就可以了。当然要保证MySQL数据库正常,hive正常。
附件:http://down.51cto.com/data/2366931
数据
脚本
附件
目录
语句
代码
内容
参数
数据库
正文
环境
程序
还是
面的
保证
实验
运行
整合
输出
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
网络安全教育内容演讲稿
aws进军网络安全市场
华为软件开发岗前景
网络技术的应用产品
如何建域服务器
gnu开源软件开发指导
软件开发和管理办法
最新数据库教程视频教程
电脑怎么连接远程共享服务器
用jdbc增加数据库
第五人格怎么制裁服务器
photon服务器常用吗
tbc部落哪个服务器g团多
华为高密度服务器检测维修
用友网络安全科技
NYU2数据库
评价网络安全标准
数据库怎么读取两个表的内容
linux 服务器机器码
dell服务器系统崩溃
广东视频会议服务器生产厂家
计算机网络技术专业有分配吗
网络技术是怎样改变世界的
网络安全从哪些方面考虑
利用电子病历数据库开展临床研究
中信银行软件开发中心年假
河北嵌入式软件开发价格表
国外网络安全大赛
施乐700服务器系统
数据库技术概述总结