导航：首页 > 互联网科技 >

Flink SQL如何连接Hive并写入/读取数据

发表于：2025-02-03 作者：千家信息网编辑

千家信息网最后更新 2025年02月03日，这篇文章主要介绍Flink SQL如何连接Hive并写入/读取数据，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！1. 添加依赖 1.11.2

千家信息网最后更新 2025年02月03日Flink SQL如何连接Hive并写入/读取数据

这篇文章主要介绍Flink SQL如何连接Hive并写入/读取数据，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

1. 添加依赖

            1.11.2        2.11                            org.apache.flink            flink-streaming-scala_${scala.version}            ${flink.version}                            org.apache.flink            flink-connector-kafka-0.11_${scala.version}            ${flink.version}                            org.apache.flink            flink-clients_${scala.version}            ${flink.version}                            org.apache.flink            flink-table-api-java-bridge_${scala.version}            ${flink.version}                            org.apache.flink            flink-table-planner-blink_${scala.version}            ${flink.version}                                    org.apache.flink            flink-connector-hive_${scala.version}            ${flink.version}                                    org.apache.hive            hive-exec            2.1.1                            org.apache.flink            flink-shaded-hadoop-2-uber            2.6.5-7.0                            org.apache.flink            flink-json            ${flink.version}                            org.apache.flink            flink-connector-elasticsearch7_${scala.version}            ${flink.version}                            org.apache.flink            flink-csv            ${flink.version}                            com.fasterxml.jackson.core            jackson-databind            2.4.0                            com.fasterxml.jackson.core            jackson-annotations            2.4.0                            com.fasterxml.jackson.core            jackson-core            2.4.0

2. 创建blink版本的批处理Table执行环境

EnvironmentSettings bbSettings = EnvironmentSettings.newInstance()                .useBlinkPlanner()                .inBatchMode()                .build();TableEnvironment bbTableEnv = TableEnvironment.create(bbSettings);

经过实际测试，目前HiveTableSink 不支持流式写入（未实现 AppendStreamTableSink），必须是批处理环境才可以往hive里面写入数据，而不能将流式数据写入hive。例如将kafka创建一张临时表，然后将表中的数据流持续插入hive，这是不可以的，官网上1.11版本通过flink sql-client可以实现hive的流式写入，还有待验证。

3. 连接文件系统，创建hive catalog，对表进行操作，类似于Spark on Hive,flink可以直接获取Hive的元数据，并使用flink进行计算。

        // 连接外部文件        bbTableEnv.connect(new FileSystem().path("file:///E:/d.txt"))                .withFormat(new Csv().fieldDelimiter(','))                .withSchema(new Schema().field("id", DataTypes.STRING()))                .createTemporaryTable("output");        // 设置 hive 方言        bbTableEnv.getConfig().setSqlDialect(SqlDialect.HIVE);        // 获取hive-site.xml目录        String hiveConfDir = Thread.currentThread().getContextClassLoader().getResource("").getPath().substring(1);        HiveCatalog hive = new HiveCatalog("hive", "warningplatform", hiveConfDir);        bbTableEnv.registerCatalog("hive", hive);        bbTableEnv.useCatalog("hive");        bbTableEnv.useDatabase("warningplatform");        bbTableEnv.executeSql("insert into  test select id from    default_catalog.default_database.output");

通过bbTableEnv.connect()去创建临时表的方式已经过时了，建议使用bbTableEnv.executeSql()的方式，通过DDL去创建临时表，临时表到底是属于哪一个catalog目前还不太确定，到底是什么规则目前还不清楚。查资料得知，临时表与单个Flink会话的生命周期相关，临时表始终存储在内存中。永久表需要一个catalog来管理表对应的元数据，比如hive metastore，该表将一直存在，直到明确删除该表为止。因此猜测：default_catalog是存储在内存中，如果在切换成hive catalog之前创建临时表，那我们就可以使用default_catalog.default_database.tableName来获取这个临时表。如果切换了catalog再去创建临时表，那我们就无法获取到临时表了，因为它不在default_catalog中，而且保存在内存里面，直接查询临时表会去当前的catalog里面去查找临时表，因此一定要在default_catalog 里面创建临时表。而临时视图好像是存储在当前的catalog里面

通过bbTableEnv.createTemporaryView()创建的视图则是属于当前的database的

bbTableEnv.createTemporaryView("output",bbTableEnv.sqlQuery("select * from default_catalog.default_database.output"));

注意1.11版本的执行sql的方法发生了改变，通过执行环境的executeSql(),executeInsert()等来进行插入或者执行sql语句

以上是"Flink SQL如何连接Hive并写入/读取数据"这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注行业资讯频道！

很赞哦！

数据内存版本环境存储内容文件方式篇文章切换清楚过时价值兴趣单个周期实际小伙小伙伴建议数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全我的世界不认证的服务器手机版云服务器怎么优化网络安全控制系统文山州国家网络安全宣传周活动山东数据软件开发设施标准数据库系统设计层次大学生网络安全教育数据分析数据库读取所需要的服务器资源网络安全师证数据库查询古人关系电力国产数据库排名网络技术购销合同模板武汉游戏服务器开发招聘网络安全反恐宣传标语大红猪网络技术 xshell远程重启服务器服务器是可选还是必选 vr软件开发主要技术 mysql 迁移后数据库打不开 db2数据库查看有哪些用户青岛博文网络安全公司数据库设计会员与系统人员如何看待网络安全隐患各种数据库资源手机号写入数据库服务器分类管理正规的浪潮存储服务器店面资深数据库专家地下管网数据库网络技术支持顾问

千家信息网

千家信息网

Flink SQL如何连接Hive并写入/读取数据

1. 添加依赖

2. 创建blink版本的批处理Table执行环境

3. 连接文件系统，创建hive catalog，对表进行操作，类似于Spark on Hive,flink可以直接获取Hive的元数据，并使用flink进行计算。

怎么在swarm manager上创建mysql service

笔记本电脑SSD固态硬盘如何分区

相关文章