Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办
发表于:2025-02-01 作者:千家信息网编辑
千家信息网最后更新 2025年02月01日,这篇文章主要介绍Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!flume打到hdfs上时,按照文件大小
千家信息网最后更新 2025年02月01日Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办
这篇文章主要介绍Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
flume打到hdfs上时,按照文件大小生成文件,在达到指定大小之前数据都是以.tmp文件形式保存在hdfs上,hive外部表也会加载这些文件,但是当文件完成后.tmp会消失,这时候hive会报找不到文件的错误。解决方法是自己写hive的pathfilter类,hive加载数据的时候把tmp文件过滤掉不加载即可。
错误信息如下:
自定义PathFilter类如下:
/** * * @Title: FileFilterExcludeTmpFiles.java * @Description: hive加载分区表时会加载.tmp的文件,该类型文件在flume滚动数据之后就会消失,此时hive找不到该文件就会报错 * 该类会将.tmp的文件过滤掉,不加载进hive的分区表中 * @version V0.1.0 * @see */public class FileFilterExcludeTmpFiles implements PathFilter{ private static final Logger logger = LoggerFactory.getLogger(FileFilterExcludeTmpFiles.class); public boolean accept(Path path) { // TODO Auto-generated method stub return !name.startsWith("_") && !name.startsWith(".") && !name.endsWith(".tmp"); }}
编写完后,打成jar包上传服务器,再修改hive-site.xml文件,修改如下:
hive.aux.jars.path file:///usr/lib/mylib/FilterTmpPath.jar The location of the plugin jars that contain implementations of user defined functions and serdes. mapred.input.pathFilter.class cn.utils.hive.FileFilterExcludeTmpFiles
以上是"Hive外部分区表加载flume打到hdfs上文件读不到.tmp文件怎么办"这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!
文件
分区表
数据
怎么办
内容
大小
篇文章
错误
会报
价值
信息
兴趣
小伙
小伙伴
形式
方法
时候
更多
服务器
知识
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
三七网络安全
数据库对象课程介绍
上海市企业服务云软件开发
三级网络技术资料书pdf
丽水企业软件开发工程师
无线网络安全探究
新盗墓笔有几个服务器
vfp 数据库索引
服务器上面安装显卡
郑州交友软件开发哪里好
武汉网络安全基地专场
教育统计数据库加载
北京租服务器
数据库实验 安全性控制
宝山区大型软件开发采购信息
服务器带外
16亿qq绑数据库
病历本软件开发
代理服务器访问不安全
南京正有网络技术有限公司
linux查看所在服务器
dnf手游不能连接服务器
确保全局网络安全
广州中通生化软件开发
信息网络安全知识新青年
文明重启怎么获得好友的服务器
扫描文字识别软件开发教程
怎么修改文件数据库名
家客网络技术支撑工作职责
北京宏天软件开发公司