导航：首页 > 开发技术 >

SQL Hive中的Select Fromsql怎么使用

发表于：2024-11-25 作者：千家信息网编辑

千家信息网最后更新 2024年11月25日，这篇"SQL Hive中的Select Fromsql怎么使用"文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，

千家信息网最后更新 2024年11月25日SQL Hive中的Select Fromsql怎么使用

这篇"SQL Hive中的Select Fromsql怎么使用"文章的知识点大部分人都不太理解，所以小编给大家总结了以下内容，内容详细，步骤清晰，具有一定的借鉴价值，希望大家阅读完这篇文章能有所收获，下面我们一起来看看这篇"SQL Hive中的Select Fromsql怎么使用"文章吧。

Select Fromsql里面最基本的查询语句，select*from后面加表名，这样查询出来是这个表里面的所以数据，后面还可以加where条件挑选，也能够加Orderby排序，也能够加groupby分组。

01-查询表中的内容

查询指定的某一列或某几列，命令如下：

SELECT 列名1,列名2,…… FROM 表名;

查询表中的所有字段时，可以使用代表所有字段。星号()是选取所有列的快捷方式。命令如下：

SELECT * FROM 表名;

如果我们想查询表 t_od_use_cnt 中的所有的user_id和use_cnt，具体命令如下：

SELECT user_id     ,use_cntFROM app.t_od_use_cnt;

备注：app是数据库名，如果当前查询表与当前使用数据库一致，可以省略不写

02-Hive严格模式

在Hive中这样写虽然语法正确(不加分区)，但在实际工作中这样写很可能会报错。

因为Hive中的表一般数据量极大，为了防止用户误操作进行全表扫描，可以设置为查询分区表时必须加入分区限制。比如这里我们的分区字段是date_8这个日期字段，工作中的表会要求我们必须限定查询哪几天的分区数据。这里我们可以输入设置参数进行模拟，命令如下：

hive (app)> set hive.mapred.mode;hive.mapred.mode=nonstricthive (app)> set hive.mapred.mode=strict;hive (app)> set hive.mapred.mode;hive.mapred.mode=strict

然后我们重新执行上面的查询语句，报错如下：

hive (app)> SELECT user_id         >       ,use_cnt         > FROM app.t_od_use_cnt;FAILED: SemanticException [Error 10041]: No partition predicate found for Alias "t_od_use_cnt" Table "t_od_use_cnt"hive (app)>

如下使用where语句限定分区即可解决这个问题：

SELECT user_id     ,use_cntFROM app.t_od_use_cntWHERE date_8 = '20210420';

03-limit限制查询返回行数

上面的查询语句会返回查询到的所有数据，但有时候我们只是要确认一下表中的数据内容，或者要指定行数据，比如只要100行，这时只需要在查询语句后加上(limit 数字)即可。

查询表t_od_use_cnt中前5行数据，命令如下：

SELECT user_id     ,use_cntFROM app.t_od_use_cntWHERE date_8 = 20190101 Limit 5;

运行结果如下：

hive (app)> SELECT user_id         >       ,use_cnt         > FROM app.t_od_use_cnt         > WHERE date_8 = 20210420 Limit 5;OKuser_id  use_cnt10000  610001  4910002  2310003  110004  29Time taken: 0.829 seconds, Fetched: 5 row(s)hive (app)>

04-列四则运算

在查询时可以对数值类型的字段进行加减乘除和取余等四则运算

下面我们将表t_od_use_cnt中use_cnt列和is_active列相乘得到一个新列，其他用法依次类推。

hive (app)> SELECT user_id         >       ,use_cnt         >       ,is_active         >       ,use_cnt * is_active         > FROM app.t_od_use_cnt         > WHERE date_8 = 20210420 Limit 5;OKuser_id  use_cnt  is_active  _c310000  6  1  610001  49  1  4910002  23  1  2310003  1  0  010004  29  1  29Time taken: 0.124 seconds, Fetched: 5 row(s)hive (app)>

05-列别名

可以看到上面的例子中我们通过两个列相乘人为制造出一个新列，系统默认将其列名起为_c3。通常有必要给这些新产生的列起一个别名。已有列的列名如果含义不清晰也可以通过起别名的方式进行更改。不过别名只在本条SQL语句中生效，不影响原表中的字段名。

这里顺便介绍一下字段命名规则：

1.不能和已有字段重复

2.只能包括小写字母(a-z)、数字(0-9)、下划线(_)

3.以字母开头

4.单词之间用下划线_分割

这里我们将别名起为active_use_cnt，在列后面加 AS active_use_cnt即可。另AS可以省略，只用空格分隔别名也可以生效

hive (app)> SELECT user_id         >       ,use_cnt         >       ,is_active         >       ,use_cnt * is_active AS active_use_cnt         > FROM app.t_od_use_cnt         > WHERE date_8 = 20210420 Limit 5;OKuser_id  use_cnt  is_active  active_use_cnt10000  6  1  610001  49  1  4910002  23  1  2310003  1  0  010004  29  1  29Time taken: 0.239 seconds, Fetched: 5 row(s)hive (app)>

以上就是关于"SQL Hive中的Select Fromsql怎么使用"这篇文章的内容，相信大家都有了一定的了解，希望小编分享的内容对大家有帮助，若想了解更多相关的知识内容，请关注行业资讯频道。

很赞哦！