MySQL索引背后的数据结构及算法原理(一)

索引的本质

MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据数据结构。提取句子主干,就可以得到索引的本质:索引是数据结构

我们知道,数据库查询是数据库的最主要功能之一。我对分查找算法们都希望查询数据的速数据透视表度能尽可能的快,因此数数据透视表据库系统的设计者会其他综合收益从查询算法的角度进行优化。最基本的数据库系统概论第五版课后答案查询算法当然是​​顺序查找其他业务收入​​​(linear search),这种复杂度为O(n)的算法在数据量很大时显然是糟糕的,好在计算机科学的发展提供了很多更优秀的查找算法,例如​​二分查找​​​(binary search)、​​二叉树查找​​​(binary tree search)其他应收款是什么科目等。如果稍微分析一下会发现,每种查找算法都只能应用数据结构c语言版于特定的数据结构之上,例如二分查找要求被检索数据有序,而二叉树查找只数据库管理系统应用于​​二叉查找树​​上,但是数据本身的组织结构不可能其他完全满足各数据漫游是什么意思种数据结构(例如,理论上不可能同时将两列都按顺序进行组织),所以,在数据之外,数据库数据库查询语句系统还维护着满足特定查找算数据结构课程设计心得体会法的数据结构,折半查找算法这些数据结构以某种方其他垃圾式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。

看一个例子:

图1

图1展示了一种可能的索引方式。左边是数据表,一共有两列七条记录,最左边的是数查找算法据记录的物理地址(注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的)。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个数据结构与算法节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在O(数据结构log2n)的复杂度内获取到相应数据。

虽然这是一个货真价实的索引,但是实际的数据库系统几乎没有使数据恢复软件免费版用二叉查找树或其进化品种​​红黑树​​(red-black tree)实现的,原因会在下文介绍。