聊一聊怎样操作索引进步机能
在相关数据库中,表中数据广泛以无序的状态存储在磁盘上,在没有响应索引时,若要对表中数据举办查询,就只能全表检索,将全部记录挨个读取,然后和查询前提举办较量,显然,这种方法会导致大量的磁盘 I/O 操纵和 CPU 计较,耗损大量的体系时刻,因此,成立索引就成了一个必需思量的选项。 行使 CREATE INDEX [索引名] on 表名 (列名,……) 语句可觉得表中数据成立最常用的键值索引,而键值索引的实现多半回收 B+ 树数据布局,它有以下一些性子: 1、 是一棵均衡树,即从根节点到叶子节点的深度相差不高出 1; 2、 非叶子节点只生涯键值和指向子节点的指针,不生涯数据; 3、 叶子节点生涯键值、对应记录的地点及叶子节点的链表指针,链表中叶子节点是键值有序的 但这些性子就必然能担保查询机能满意用户的需求吗?下面,我们以对银行账户举办时刻段查询为例,切磋索引的机能题目。 为了利便声名题目,我们在这里把 B+ 树简化为 3 叉 B+ 树,以账号和买卖营业日期作为键值,如下图所示: ![]() 假如我们要查询账号 A002 从 2000-01-01 到 2000-01-07 的买卖营业流水,数据库体系会起主要查找账号为 A002、日期不早于 2000-01-01 的键值地址的叶子节点,功效是依次读取索引块 A、B、C,然后找出索引块 C 中满意前提的键值对应的记录地点并读出记录返回,若索引块 C 中最后一个日期早于或便是 2001-01-07,则可以按照叶子节点的链表直接读取索引列 D,以此类推,直到某个索引块的某个日期比 2001-01-07 大为止。 调查上述进程,我们发明 2000-01-01 对应的记录在数据页 1,2000-01-02 和 2000-01-03 对应的记录在数据页 2,2000-01-04 对应的记录则在数据页 3,4 笔记录必要读取 3 个数据页,极度环境下乃至恣意一笔记录都在差异的数据页,而此时假如数据区中记录已按键值序存储则可以明显镌汰磁盘 IO。更进一步,假如记录数据直接生涯在叶子节点,则可以镌汰查询进程中索引页与数据页之间的跳读,这对付机器硬盘的机能影响尤甚。 这些题目对付集算器的组表来说,可以很是轻松地获得办理。 我们照旧以股票买卖营业数据为例讲授组表的行使。 ![]() A2: 建设数据布局为 (sid,tdate,open,close,volume) 的组表,且指定 sid 和 tdate 为键,@r 指定命据按行存储 A5: 将按 sid 和 tdate 有序的数据追加到组表中 A6: 以 sid 和 tdate 为键值成立索引 idx1 ![]() A1: 读取组表 A2: 界说按照索引 idx1 查询数据的游标 A3: 取出游标中的数据 在成立索引 idx1 时,也可以将所需的数据都储存在索引里,譬如要将 open、close、volume 这 3 列也储存在索引 idx1 里,只需将前面表格里的A2.index(idx1;sid,tdate)改为A1.index(idx1; sid,tdate; open,close,volume)即可,这样查询时就可以不读数据文件、只读取索引文件,使查询速率更快。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |