本文只讲最最平常最最简单的索引 就是以create index ix on tx(a b c);形式创建的索引 而不讲位图索引 反向键索引 倒序索引 基于函数的索引等等 其实呢 只要是基于B树的索引 不管是在Oracle Mysql 还是其它数据库中 原理应当都是一样的
创新互联建站专业为企业提供平桂网站建设、平桂做网站、平桂网站设计、平桂网站制作等企业网站建设、网页设计与制作、平桂企业网站模板建站服务,十余年平桂做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。
索引最重要的一个性质应该就是有序 索引中的每一项 是从左到右 从小到大 以严格的顺序排列好的
下面的讨论都以上面的索引ix(a b c)为例
把这棵索引的叶子节点画到纸上 大概是这样的
a a a an
b b b bn
c c c cn
上面这个 ×n的矩阵 每一列代表了一条记录 同时这一列记录 也对应了表里的唯一一条记录 当然 在Oracle里 对于non unique索引 需要补上rowid 才是真正唯一的 上面的索引相当于create unique index ix on tx(a b c rowid); 我们把这个细节忽略掉
把每一列看作一个向量 vi = (ai bi ci)
有序的含义就是
vi vj iff i j;
vi vj这么定义
(ai aj) or (ai = aj and bi bj) or (ai = aj and bi = bj and ci cj)
从这个基本性质 我们可以得到一些其它性质(为了打字方便 ai+k表示a(i+k) 而不是a(i)+k)
) 如果ai ai+ …… ai+k 都是相等的 那么
bi = bi+ = …… = bi+k
) 如果ai ai+ …… ai+k是相等的 而且bi bi+ …… bi+k也是相等的 那么
ci = ci+ = …… ci+k
但是从 ai ai+ …… ai+k相等 我们得不到
ci = ci+ = …… = ci+k这个结论
索引相关的很多问题 都和上面提到的这几个性质有关系
下面来看几个常见的查询:
q ) select * from tx where a = :va and b = :vb;
q ) select * from tx where b = :vb and c = :vc;
q ) select * from tx where a = :va and c = :vc;
q ) select * from tx where a = :va order by b;
q ) select * from tx where a = :va order by b c;
q ) select * from tx where a = :va order by c;
q ) select * from tx where a = :va order by b c desc;
q ) select * from tx where a = :va order by b desc c desc;
q ) select * from tx where a = :va and b = :vb
qa) select * from tx where a = :va and b = :vb
qb) select * from tx where a = :va and c = :vc
qc) select * from tx where a = :va and b = :vb order by c
大家可以考虑一下这些查询各自会以怎样的方式执行 不同查询之间有什么区别?
同样 为什么在索引字段上作了函数运算之后 索引不可用?
考虑下面这个语句:
select * from tx where f(a) = :vfa;
首先 在字段 a上作了函数运算之后 排序的规则是否仍旧一样? a b 与 f(a) f(b)是否等价?
其次 就算f(a)和a的排序规则一样 但是索引块中存的a 但是你传给它的是经过了函数运算的值:vfa 只有oracle知道函数f的反函数inv_f 并在vfa上做inv_f(:vfa)计算之后 才能通过索引的B树结果进行查找
当然 现实中f可能不是显示的 而是隐式的 如传入参数和字段类型不匹配的情况下 Oracle可能在字段上作函数运算 从语句上可能看不出索引字段上被做了函数运算 但Oracle内部已经在字段上运用了函数 这样也会导致索引不可用 这种情况下用hint强制使用索引也是没用的
通过dbms_xplan display_cursor可以或许可以查看到这种隐式类型转换
通过v$sql_bind_metadata应当可以查看到每个绑定变量的类型
通过v$sql_bind_capture这个视图甚至可以看到每个绑定变量具体的值 不要把bind_capture和bind peek搞混哦 而且这里bind_cature也不会每绑定一次变量就capture一次 不然对执行量非常高 绑定频繁的语句 capture以同样频率进行的话 开销可能还是有点大的
上面讲到了索引的有序性 下面来讲讲索引另外一个有趣的性质 其实 我们完全可以把索引看作一张表 这张表包含和主表一样多的记录(如果不考虑null) 只不过每条记录只有主表的部分字段 开个玩笑 我们是不是可以把索引叫做有序视图呢?或者精确一点 有序物化视图:)
那么 我在执行一些查询的时候 如果所有字段都包含在索引中 是不是只要访问索引就可以了呢?
这些字段可以出现在select列表中 where条件中 order by字段中 也可以出现在两个表连接时的连接条件中
那么 根据业务的需求 我们是不是可以设计或调整索引以减少对主表的访问呢?或者 是不是可以适当的调整应用的设计或实现来满足索引呢?
同时 考虑到索引的有序性 是不是可以利用索引来避免排序呢?
当然 我们不能忽略null的存在 如果一条记录在索引中的所有字段上都是null的 那么oracle是不会索引这条记录的 比如如果记录ri的ai bi ci字段都是null的 索引中是找不到这条记录的 这会有什么问题呢?首先表中的记录和索引中的记录从数量上来说就不一样了
考虑一下Oracle会怎样执行下面这个查询:
select count(*) from tx;
这个呢 hint起作用了吗?
select /*+ parallel(tx ) */ count(*) from tx;
大家可以测试一下 怎样把count(*)这个操作并行化 从这里或许可以得到一些Oracle怎么处理hint的提示
最后 讲一下Oracle CBO计算索引访问成本的公式
cost =
blevel +
ceiling(leaf_blocks * effective index selectivity) +
ceiling(clustering_factor * effective table selectivity)
这个公式相信很多地方可以找到(我是从cost base oracle fundamentals这本书里copy出来的) 简单说一下我自己对这个公式的理解
blevel是索引树的高度
leaf_blocks是索引的页子节点的个数
effective index selectivity (eis)怎么算呢?
还是举几个例子
where a = :va and b = :vb c = :vc
这里eis是 (selectivity a) * (selectivity b) * (selectivity c)
where a = :va and c = :vc
这里eis是 selectivity a
where b = :vb and c = :vc
这里eis是
where a = :va and b = :vb and c = :vc
这里eis是 (selectivity a) * (selectivity range b)
就是说按索引字段的顺序 第一个不在where条件中出现的字段 或者第一个做了范围运算的字段 之后出现的字段的selectivity是不能乘到effective index selectivity里去的
简单的说 ceiling(leaf_blocks * effective index selectivity)表示的是Oracle需要访问的索引叶子节点的个数
clustering_factor表示的是按索引的顺序 从头走到尾 需要访问多少次数据块 这里需要考虑到Oracle的一个优化 如果连续n条记录在同一个表块中 那么oracle认为只需要访问一次数据块
那么clustering_factor的值的范围就很容易确定了 cf = table blocks and cf = rows in index
effective table selectivity 这个计算就容易了 把索引中所有字段的selectivity乘起来就可以了
如果查询中还有其它条件 比如 d = :vd and e = :ve 但是d e这些字段又不在索引中 那么在这些列上的过滤条件 需要回表后把这些值取出来才能判断 所以d e这些列的selectivity是不能乘到effective table selectivity里去的
ceiling(clustering_factor * effective table selectivity)表示需要回表的次数
所以上面索引访问的cost就是走某个索引 需要访问的数据块的个数
当然 前面的讨论忽略了index skip scan这种情况 因为本人对index skip scan也不是很明白
什么情况下会走skip scan?
select * from tx where a = :va and c = :vc 是不是会在c这个字段上也作一个skip scan呢?
lishixinzhi/Article/program/Oracle/201311/16730
你这个是联合索引,a2索引本身
它是当你有前导列时,条件中只有前导列这个条件时也会用到组合索引,不用两个列作为条件。
比如
(A,B)建了组合索引
当WHERE A='sf'时会用到索引的
而WHERE B='sd'是不会用到组合索引的。
如果联合索引中的多个字段都在where谓词中出现了,则联合索引效率比单列索引高,因为通过多个条件可以从索引中过滤得到更少的记录条数,也就减少了需要回表扫描的次数,甚至可以直接在联合索引中得到所查的所有结果,则不再需要回表。
表创建标准语法:
CREATE TABLE [schema.]table
(column datatype [DEFAULT expr] , …);
--设计要求:建立一张用来存储学生信息的表,表中的字段包含了学生的学号、姓名、年龄、入学日期、年级、班级、email等信息,
--并且为grade指定了默认值为1,如果在插入数据时不指定grade得值,就代表是一年级的学生
--DML是不需要commit的,隐式事务
create table student
(
stu_id number(10),
name varchar2(20),
age number(2),
hiredate date,
grade varchar2(10) default 1,
classes varchar2(10),
email varchar2(50)
);
-- 注意日期格式要转换,不能是字符串,varchar2类型要用引号,否则出现类型匹配
--DML 需要收到commit
insert into student values(20211114,'zhangsan',22,to_date('2021-11-14','YYYY-MM-DD'),'2','1',' 123@qq.com ');
insert into student(stu_id,name,age,hiredate,classes,email) values(20211114,'zhangsan',22,to_date('2021-11-14','YYYY-MM-DD'),'1',' 1234@qq.com ');
select * from student;
-- 给表添加列,添加新列时不允许为not null,因为与旧值不兼容
alter table student add address varchar(100);
-- 删除列
alter table student drop column address;
--修改列
alter table student modify(email varchar2(100));
正规表设计使用power disinger
--表的重命名
rename student to stu;
-- 表删除
drop table stu;
**
在删除表的时候,经常会遇到多个表关联的情况(外键),多个表关联的时候不能随意删除,使用如下三种方式:
2.表的约束(constraint)
约束:创建表时,指定的插入数据的一些规则
约束是在表上强制执行的数据校验规则
Oracle 支持下面五类完整性约束:
1). NOT NULL 非空约束 ---- 插入数据时列值不能空
2). UNIQUE Key 唯一键约束 ----限定列唯一标识,唯一键的列一般被用作索引
3). PRIMARY KEY 主键约束 ----唯一且非空,一张表最好有主键,唯一标识一行记录
4). FOREIGN KEY 外键约束---多个表间的关联关系,一个表中的列值,依赖另一张表某主键或者唯一键
-- 插入部门编号为50的,部门表并没有编号为50的,报错
insert into emp(empno,ename,deptno) values(9999,'hehe',50);
5). CHECK 自定义检查约束---根据用户需求去限定某些列的值,使用check约束
-- 添加主键约束/not null约束/check约束/唯一键约束
create table student
(
stu_id number(10) primary key,
name varchar2(20) not null,
age number(3) check(age0 and age126),
hiredate date,
grade varchar2(10) default 1,
classes varchar2(10),
email varchar2(50) unique,
deptno number(2),
);
-- 添加外键约束
create table stu
(
stu_id number(10) primary key,
name varchar2(20) not null,
age number(3) check(age0 and age126),
hiredate date,
grade varchar2(10) default 1,
classes varchar2(10),
email varchar2(50) unique,
deptno number(2),
FOREIGN KEY(deptno) references dept(deptno)
);
-- 创建表时没添加外键约束 也可以修改 其中fk_0001为外键名称
alter table student add constraint fk_0001 foreign key(deptno) references dept(deptno);
索引创建有两种方式:
组合索引:多个列组成的索引
--索引:加快数据剪碎
create index i_ename on emp(ename);
--当创建某个字段索引后,查询某个字段会自动使用到索引
select * from emp where ename = 'SMITH';
--删除索引 索引名称也是唯一的
drop index i_ename;
一些概念:
回表:
覆盖索引
组合索引
最左匹配
使用oracle10g的朋友可能会发现以前删除的表在数据库中出现了很多垃圾表,如:BINjR8PK5HhrrgMK8KmgQ9nw==之类的表无法删除无法用delete 删除,一般不影响正常使用,但是有以下情况使我们必须删除它
1,这些表占用空间
2,如果使用Middlegen-Hibernate-r5的朋友会发现一些问题,不你象以前用oracle9时那么顺的生成hibernate配置文件,原因就在这里将它删除就没有问题了.
3,其它情况
BINjR8PK5HhrrgMK8KmgQ9nw==之类的表这个是10g 的新特性。
Drop Table 后,没有真正的删除表,而是在“垃圾站”中了。可以通过:
SQL SHOW RECYCLEBIN
看到。如果要彻底删除,使用:
SQL PURGE TABLE "BINjR8PK5HhrrgMK8KmgQ9nw==";
删除这一个或
SQL PURGE RECYCLEBIN;
删除全部。