千家信息网

Hive部署

发表于:2024-11-11 作者:千家信息网编辑
千家信息网最后更新 2024年11月11日,什么是 HiveHive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序常见的数据分析引擎: Hive, Pig, Impala, Spark SQLHive 是一个基于Hado
千家信息网最后更新 2024年11月11日Hive部署

什么是 Hive
Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序

常见的数据分析引擎: Hive, Pig, Impala, Spark SQL
Hive 是一个基于Hadoop 之上的数据分析引擎(数据仓库)

Hives HDFS
表 --------> 目录
数据 --------> 文件
分区 --------> 目录


环境部署:

部署前准备:

环境变量:vi ~/.bash_profile
HIVE_HOME=/root/training/apache-hive-2.3.0-bin
export HIVE_HOME

PATH=$HIVE_HOME/bin:$PATH
export PATH


嵌入式部署:
(1)使用Hive自带的Derby数据库来存储元信息
(2)Hive只支持一个连接
创建 conf/hive-site.xml




javax.jdo.option.ConnectionURL
jdbc:derby:;databaseName=metastore_db;create=true



javax.jdo.option.ConnectionDriverName
org.apache.derby.jdbc.EmbeddedDriver



hive.metastore.local
true



hive.metastore.warehouse.dir
file:///root/training/apache-hive-2.3.0-bin/warehouse



初始化MetaStore:
schematool -dbType derby -initSchema



远程模式(需要MySQL数据库):

1. 安装 MySQL数据库(此处省略)

2. 配置 hive-site.xml (JDBC的参数)





javax.jdo.option.ConnectionURL
jdbc:mysql://localhost:3306/hive?useSSL=false



javax.jdo.option.ConnectionDriverName
com.mysql.jdbc.Driver



javax.jdo.option.ConnectionUserName
hiveowner



javax.jdo.option.ConnectionPassword
Welcome_1


3. 把MySQL 数据库的驱动放到: Hive/lib 下

4. 初始化 MySQL数据库

老版本的hive 在第一次运行时自动初始化 MySQL数据库

新版本的hive 需要执行命令:

schematool -dbType mysql -initSchema







0