千家信息网

Oracle 11g收集多列统计信息详解

发表于:2024-11-26 作者:千家信息网编辑
千家信息网最后更新 2024年11月26日,前言通常,当我们将SQL语句提交给Oracle数据库时,Oracle会选择一种最优方式来执行,这是通过查询优化器Query Optimizer来实现的。CBO(Cost-Based Optimizer
千家信息网最后更新 2024年11月26日Oracle 11g收集多列统计信息详解

前言

通常,当我们将SQL语句提交给Oracle数据库时,Oracle会选择一种最优方式来执行,这是通过查询优化器Query Optimizer来实现的。CBO(Cost-Based Optimizer)是Oracle默认使用的查询优化器模式。在CBO中,SQL执行计划的生成,是以一种寻找成本(Cost)最优为目标导向的执行计划探索过程。所谓成本(Cost)就是将CPU和IO消耗整合起来的量化指标,每一个执行计划的成本就是经过优化器内部公式估算出的数字值。

我们在写SQL语句的时候,经常会碰到where子句后面有多个条件的情况,也就是根据多列的条件筛选得到数据。默认情况下,oracle会把多列的选择率(selectivity)相乘从而得到where语句的选择率,这样有可能造成选择率(selectivity)不准确,从而导致优化器做出错误的判断。为了能够让优化器做出准确的判断,从而生成准确的执行计划,oracle在11g数据库中引入了收集多列统计信息。本文通过对测试表的多条件查询,介绍收集多列统计信息的重要性。

一、环境准备

我们在Oracle 11g中进行试验。

SQL> SQL> select * from v$version;BANNER--------------------------------------------------------------------------------Oracle Database 11g Enterprise Edition Release 11.2.0.3.0 - ProductionPL/SQL Release 11.2.0.3.0 - ProductionCORE 11.2.0.3.0 ProductionTNS for Linux: Version 11.2.0.3.0 - ProductionNLSRTL Version 11.2.0.3.0 - ProductionSQL>

在hr用户下创建测试表hoegh,重复插入数据,数据量相当于16个employees表(总行数1712=107*16)。

SQL> SQL> conn hr/hrConnected.SQL> SQL> create table hoegh as select * from employees;Table created.SQL> select count(*) from hoegh; COUNT(*)----------  107SQL> SQL> insert into hoegh select * from hoegh;107 rows created.SQL> /214 rows created.SQL> /428 rows created.SQL> /856 rows created.SQL> commit;Commit complete.SQL> select count(*) from hoegh; COUNT(*)----------  1712SQL>

二、按照常规方法收集统计量信息;

SQL> SQL> exec dbms_stats.gather_table_stats(\'HR\',\'HOEGH\');PL/SQL procedure successfully completed.SQL>

三、查看执行单个条件的where语句的执行计划

SQL> SQL> explain plan for select * from hoegh where employee_id=110;Explained.SQL> select * from table(dbms_xplan.display);PLAN_TABLE_OUTPUT--------------------------------------------------------------------------------Plan hash value: 774871165---------------------------------------------------------------------------| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |---------------------------------------------------------------------------| 0 | SELECT STATEMENT | | 16 | 1104 | 8 (0)| 00:00:01 ||* 1 | TABLE ACCESS FULL| HOEGH | 16 | 1104 | 8 (0)| 00:00:01 |---------------------------------------------------------------------------Predicate Information (identified by operation id):---------------------------------------------------PLAN_TABLE_OUTPUT-------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110)13 rows selected.SQL>

从执行计划可以看出返回了16行记录,结果没有问题。可是,这个16是哪儿来的呢,我们先要了解选择率(selectivity)和返回行数是如何计算的:

选择率(selectivity)=在本例中是 1/唯一值

返回行数=选择率(selectivity)*表记录总数

也就是说,在这个查询语句中,选择率=1/107,返回行数=1/107*1712=16

四、查看执行两个条件的where语句的执行计划

SQL> SQL> explain plan for select * from hoegh where employee_id=110 and email=\'JCHEN\';Explained.SQL> SQL> select * from table(dbms_xplan.display);PLAN_TABLE_OUTPUT--------------------------------------------------------------------------------Plan hash value: 774871165---------------------------------------------------------------------------| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |---------------------------------------------------------------------------| 0 | SELECT STATEMENT | | 1 | 69 | 8 (0)| 00:00:01 ||* 1 | TABLE ACCESS FULL| HOEGH | 1 | 69 | 8 (0)| 00:00:01 |---------------------------------------------------------------------------Predicate Information (identified by operation id):---------------------------------------------------PLAN_TABLE_OUTPUT-------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110 AND \"EMAIL\"=\'JCHEN\')13 rows selected.SQL>

从执行计划可以看出返回了1行记录,而事实又是什么样的呢?我们执行一下这条sql语句。

SQL> select count(*) from hoegh where employee_id=110 and email=\'JCHEN\'; COUNT(*)----------  16SQL>

由此看出,测试表hoegh符合查询条件的数据有16行,而执行计划提示的只有1行,出错了。这是怎么回事呢,也就是我们在开篇提到的选择率(selectivity)出了问题。

在这个多列条件查询语句中,选择率=1/107*1/107,返回行数=1/107*1/107*1712=16/107<1;由于表中存在符合条件的记录,并且返回行数不可能小于1,所以Oracle返回了1。

五、收集多列统计信息,再次查看两个条件的where语句的执行计划

SQL> SQL> exec dbms_stats.gather_table_stats(\'HR\',\'HOEGH\',method_opt=>\'for columns(employee_id,email)\');PL/SQL procedure successfully completed.SQL> SQL> explain plan for select * from hoegh where employee_id=110 and email=\'JCHEN\';Explained.SQL> select * from table(dbms_xplan.display);PLAN_TABLE_OUTPUT--------------------------------------------------------------------------------Plan hash value: 774871165---------------------------------------------------------------------------| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |---------------------------------------------------------------------------| 0 | SELECT STATEMENT | | 16 | 1152 | 8 (0)| 00:00:01 ||* 1 | TABLE ACCESS FULL| HOEGH | 16 | 1152 | 8 (0)| 00:00:01 |---------------------------------------------------------------------------Predicate Information (identified by operation id):---------------------------------------------------PLAN_TABLE_OUTPUT-------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110 AND \"EMAIL\"=\'JCHEN\')13 rows selected.SQL>

从执行计划的结果来看,同样的一条sql查询语句,在收集多列统计信息后,Oracle的选择率(selectivity)由错变对,这是由于sql语句中的两个条件是有关联的,即employee_id和email在employees表中都是唯一的,都可以唯一标识一行记录;而在收集多列统计信息之前,Oracle并不知道这两个查询条件有关联,所以在计算选择率(selectivity)时,只是简单地采取了相乘的方法。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。

选择 条件 语句 查询 信息 统计 数据 两个 也就是 就是 成本 这是 测试 内容 情况 数据库 方法 结果 问题 关联 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 做网络安全是什么 蓟州区应用软件开发服务咨询报价 学校体质健康数据库数据填报说明 北京服务器机柜有哪些 小程序管理系统在服务器 网络安全设备行业分析 冬残奥会的网络安全 上海通用软件开发市场价 好看的重生互联网科技小说 某软件开发项目包括 男孩子的软件开发职业 网络安全时事新闻课 没有可显示的数据库 传媒设计软件开发 杭州电商软件开发 本地web连接sql数据库 安全狗填写服务器名 世界僵尸大战连接服务器失败 网络安全意识形态的重要意义 网络安全审查法作用 金融信息技术数据库是干嘛的 云南数据网络技术服务价目表 怎样删除苹果里的全部数据库 计算机网络技术的就业前景女生 惠山区上门软件开发代理品牌 网络安全渗透测试理论选择题题库 mirna生存分析数据库 小鹿吾爱网络技术站 超级人类老是显示服务器繁忙 在数据库中怎样保证数据的安全
0