导航：首页 > 互联网科技 >

hive使用UDF函数

发表于：2025-02-04 作者：千家信息网编辑

千家信息网最后更新 2025年02月04日，官方关于UDF的使用介绍：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDFUDF几个相关概念：UDF: one-t

千家信息网最后更新 2025年02月04日hive使用UDF函数

官方关于UDF的使用介绍：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

UDF几个相关概念：

UDF: one-to-one row mapping : upper substr【进来一行出去一行】

UDAF: Aggregation Many-to-one row mapping 比如sum/min【进来多行出去一行】

UDTF: Table-generating one-to-many 比如：lateral view explode()【一对多】

编写UDF函数测试代码：

pod.xml添加hive：

1.1.0-cdh6.7.0  org.apache.hive  hive-exec  ${hive.version}

HelloUDF.java：

package com.ruozedata.hadoop.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class HelloUDF extends UDF{    public String evaluate(String input) {        //TODO...此处为开发业务逻辑的地方        return "Hello：" + input;    }    //下面为测试代码    public static void main(String[] args) {        HelloUDF udf = new HelloUDF();        String output = udf.evaluate("测试数据");        System.out.println(output);    }}注：实现UDF函数的套路是一样的，第一步继承UDF函数，第二步重写evaluate方法

在idea中用maven打包后，上传到hive服务器；包名为：g6-hadoop-udf.jar

hive创建函数的几种方式：

方法一：创建临时函数（Temporary Functions）

官方参考：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateFunction

缺点：Temporary Functions只对当前 session(窗口)有效

示例：在Hive的Shell中执行

ADD JAR /home/hadoop/lib/g6-hadoop-udf.jar;

CREATE TEMPORARY FUNCTION sayHello AS 'com.ruozedata.hadoop.udf.HelloUDF';

show functions;(执行此语句，可以看到sayHello在函数中)

select sayhello('abc') from dual;（输出的结果为：Hello：abc）

注：此种方式还有一个缺点是，jar需要每次手动add才能识别class_name

方法二：无需手动add jar包

在hive的家目录下创建auxlib目录，把jar包放在此目录下即可；

不管创建临时函数，还是持久函数，把jar放入auxlib后就无需手动进行加载；

方法三：创建持久函数（Permanent Functions），并且使用hdfs上的jar；生产建议此种方式

从hive 0.13开始，支持将函数注册到metastore中，存放的表为FUNCS（里边默认为空）；

将jar包放在hdfs的/lib目录下；

示例：在Hive的Shell中执行以下命令

CREATE FUNCTION sayhello2 AS 'com.ruozedata.hadoop.udf.HelloUDF' USING JAR 'hdfs://ruozeclusterg6/lib/g6-hadoop-udf.jar';

注：此时可以任何窗口使用sayhello2函数（使用show functions无法查到，但在元数据的FUNCS表中可以看到）

查看mysql中hive库的FUNCS表；发现sayhello2已成功进行注册；

很赞哦！

函数方法目录一行手动方式测试代码官方数据示例缺点有效成功业务中用命令地方套路建议数据库的安全要保护哪些东西数据库安全各自的含义是什么生产安全数据库录入数据库的安全性及管理数据库安全策略包含哪些海淀数据库安全审计系统建立农村房屋安全信息数据库易用的数据库客户端支持安全管理连接数据库失败ssl安全错误数据库的锁怎样保障安全中软网络技术股份有限公司官网南通人先网络技术有限公司介绍网络技术基础华科服务器主板电池位置幼儿园网络安全教育目标明日之后莱文市的服务器数据库张军无盘服务器怎么传游戏到有盘广州当康丰年网络技术有限公司信息网络安全监察如何广州培训软件开发中心 input读取数据库的值服务器泄漏风险四川龙芯服务器批发厂家问道怎么改数据库转行it大数据开发还是网络安全华润置地软件开发部待遇如何 dns服务器地址哪个好2021 户外展示屏网络安全上海网络安全等保步骤新乡市鼎裕网络技术有限公司数据库什么是候选码达梦数据库复制表结构 dell服务器怎么消除报警灯巴中范围软件开发数据库重命名字段锁表 scum进入服务器慢网络安全伴我行装饰搭建ssr国外服务器推荐企业网络安全实验

千家信息网

千家信息网

hive使用UDF函数

Go语言中Web服务的实现方式

机器人对未来的影响是什么

相关文章