大战熟女丰满人妻av-荡女精品导航-岛国aaaa级午夜福利片-岛国av动作片在线观看-岛国av无码免费无禁网站-岛国大片激情做爰视频

專注Java教育14年 全國咨詢/投訴熱線:400-8080-105
動力節(jié)點LOGO圖
始于2009,口口相傳的Java黃埔軍校
首頁 hot資訊 MySQL索引原理

MySQL索引原理

更新時間:2021-07-15 16:06:07 來源:動力節(jié)點 瀏覽1060次

B+樹索引是B+樹在數(shù)據(jù)庫中的一種實現(xiàn),是最常見也是數(shù)據(jù)庫中使用最為頻繁的一種索引。B+樹中的B代表平衡(balance),而不是二叉(binary),因為B+樹是從最早的平衡二叉樹演化而來的。在講B+樹之前必須先了解二叉查找樹、平衡二叉樹(AVLTree)和平衡多路查找樹(B-Tree),B+樹即由這些樹逐步優(yōu)化而來。

二叉查找樹

二叉樹具有以下性質(zhì):左子樹的鍵值小于根的鍵值,右子樹的鍵值大于根的鍵值。

如下圖所示就是一棵二叉查找樹,

mysql索引

對該二叉樹的節(jié)點進行查找發(fā)現(xiàn)深度為1的節(jié)點的查找次數(shù)為1,深度為2的查找次數(shù)為2,深度為n的節(jié)點的查找次數(shù)為n,因此其平均查找次數(shù)為 (1+2+2+3+3+3) / 6 = 2.3次

二叉查找樹可以任意地構造,同樣是2,3,5,6,7,8這六個數(shù)字,也可以按照下圖的方式來構造:

但是這棵二叉樹的查詢效率就低了。因此若想二叉樹的查詢效率盡可能高,需要這棵二叉樹是平衡的,從而引出新的定義——平衡二叉樹,或稱AVL樹。

平衡二叉樹(AVL Tree)

平衡二叉樹(AVL樹)在符合二叉查找樹的條件下,還滿足任何節(jié)點的兩個子樹的高度最大差為1。下面的兩張圖片,左邊是AVL樹,它的任何節(jié)點的兩個子樹的高度差<=1;右邊的不是AVL樹,其根節(jié)點的左子樹高度為3,而右子樹高度為1;

如果在AVL樹中進行插入或刪除節(jié)點,可能導致AVL樹失去平衡,這種失去平衡的二叉樹可以概括為四種姿態(tài):LL(左左)、RR(右右)、LR(左右)、RL(右左)。它們的示意圖如下:

這四種失去平衡的姿態(tài)都有各自的定義:

LL:LeftLeft,也稱“左左”。插入或刪除一個節(jié)點后,根節(jié)點的左孩子(Left Child)的左孩子(Left Child)還有非空節(jié)點,導致根節(jié)點的左子樹高度比右子樹高度高2,AVL樹失去平衡。

RR:RightRight,也稱“右右”。插入或刪除一個節(jié)點后,根節(jié)點的右孩子(Right Child)的右孩子(Right Child)還有非空節(jié)點,導致根節(jié)點的右子樹高度比左子樹高度高2,AVL樹失去平衡。

LR:LeftRight,也稱“左右”。插入或刪除一個節(jié)點后,根節(jié)點的左孩子(Left Child)的右孩子(Right Child)還有非空節(jié)點,導致根節(jié)點的左子樹高度比右子樹高度高2,AVL樹失去平衡。

RL:RightLeft,也稱“右左”。插入或刪除一個節(jié)點后,根節(jié)點的右孩子(Right Child)的左孩子(Left Child)還有非空節(jié)點,導致根節(jié)點的右子樹高度比左子樹高度高2,AVL樹失去平衡。

AVL樹失去平衡之后,可以通過旋轉使其恢復平衡。下面分別介紹四種失去平衡的情況下對應的旋轉方法。

LL的旋轉。LL失去平衡的情況下,可以通過一次旋轉讓AVL樹恢復平衡。步驟如下:

  • 將根節(jié)點的左孩子作為新根節(jié)點。
  • 將新根節(jié)點的右孩子作為原根節(jié)點的左孩子。
  • 將原根節(jié)點作為新根節(jié)點的右孩子。

LL旋轉示意圖如下:

mysql索引 

RR的旋轉:RR失去平衡的情況下,旋轉方法與LL旋轉對稱,步驟如下:

  • 將根節(jié)點的右孩子作為新根節(jié)點。
  • 將新根節(jié)點的左孩子作為原根節(jié)點的右孩子。
  • 將原根節(jié)點作為新根節(jié)點的左孩子。

RR旋轉示意圖如下:

LR的旋轉:LR失去平衡的情況下,需要進行兩次旋轉,步驟如下:

  • 圍繞根節(jié)點的左孩子進行RR旋轉。
  • 圍繞根節(jié)點進行LL旋轉。

LR的旋轉示意圖如下:

RL的旋轉:RL失去平衡的情況下也需要進行兩次旋轉,旋轉方法與LR旋轉對稱,步驟如下:

  • 圍繞根節(jié)點的右孩子進行LL旋轉。
  • 圍繞根節(jié)點進行RR旋轉。

RL的旋轉示意圖如下:

mysql索引

平衡多路查找樹(B-Tree)

B-Tree是為磁盤等外存儲設備設計的一種平衡查找樹。因此在講B-Tree之前先了解下磁盤的相關知識。

系統(tǒng)從磁盤讀取數(shù)據(jù)到內(nèi)存時是以磁盤塊(block)為基本單位的,位于同一個磁盤塊中的數(shù)據(jù)會被一次性讀取出來,而不是需要什么取什么。

InnoDB存儲引擎中有頁(Page)的概念,頁是其磁盤管理的最小單位。InnoDB存儲引擎中默認每個頁的大小為16KB,可通過參數(shù)innodb_page_size將頁的大小設置為4K、8K、16K,在MySQL中可通過如下命令查看頁的大小:

mysql> show variables like 'innodb_page_size';

而系統(tǒng)一個磁盤塊的存儲空間往往沒有這么大,因此InnoDB每次申請磁盤空間時都會是若干地址連續(xù)磁盤塊來達到頁的大小16KB。InnoDB在把磁盤數(shù)據(jù)讀入到磁盤時會以頁為基本單位,在查詢數(shù)據(jù)時如果一個頁中的每條數(shù)據(jù)都能有助于定位數(shù)據(jù)記錄的位置,這將會減少磁盤I/O次數(shù),提高查詢效率。

B-Tree結構的數(shù)據(jù)可以讓系統(tǒng)高效的找到數(shù)據(jù)所在的磁盤塊。為了描述B-Tree,首先定義一條記錄為一個二元組[key,data],key為記錄的鍵值,對應表中的主鍵值,data為一行記錄中除主鍵外的數(shù)據(jù)。對于不同的記錄,key值互不相同。

一棵m階的B-Tree有如下特性:

1.每個節(jié)點最多有m個孩子。

2.除了根節(jié)點和葉子節(jié)點外,其它每個節(jié)點至少有Ceil(m/2)個孩子。

3.若根節(jié)點不是葉子節(jié)點,則至少有2個孩子

4.所有葉子節(jié)點都在同一層,且不包含其它關鍵字信息

5.每個非終端節(jié)點包含n個關鍵字信息(P0,P1,…Pn,k1,…kn)

6.關鍵字的個數(shù)n滿足:ceil(m/2)-1<=n<=m-1

7.ki(i=1,…n)為關鍵字,且關鍵字升序排序。

8.Pi(i=1,…n)為指向子樹根節(jié)點的指針。P(i-1)指向的子樹的所有節(jié)點關鍵字均小于ki,但都大于k(i-1)

B-Tree中的每個節(jié)點根據(jù)實際情況可以包含大量的關鍵字信息和分支,如下圖所示為一個3階的B-Tree:

mysql索引

每個節(jié)點占用一個盤塊的磁盤空間,一個節(jié)點上有兩個升序排序的關鍵字和三個指向子樹根節(jié)點的指針,指針存儲的是子節(jié)點所在磁盤塊的地址。兩個關鍵詞劃分成的三個范圍域?qū)齻€指針指向的子樹的數(shù)據(jù)的范圍域。以根節(jié)點為例,關鍵字為17和35,P1指針指向的子樹的數(shù)據(jù)范圍為小于17,P2指針指向的子樹的數(shù)據(jù)范圍為17~35,P3指針指向的子樹的數(shù)據(jù)范圍為大于35。

模擬查找關鍵字29的過程:

  • 根據(jù)根節(jié)點找到磁盤塊1,讀入內(nèi)存。【磁盤I/O操作第1次】
  • 比較關鍵字29在區(qū)間(17,35),找到磁盤塊1的指針P2。
  • 根據(jù)P2指針找到磁盤塊3,讀入內(nèi)存。【磁盤I/O操作第2次】
  • 比較關鍵字29在區(qū)間(26,30),找到磁盤塊3的指針P2。
  • 根據(jù)P2指針找到磁盤塊8,讀入內(nèi)存。【磁盤I/O操作第3次】
  • 在磁盤塊8中的關鍵字列表中找到關鍵字29。

分析上面過程,發(fā)現(xiàn)需要3次磁盤I/O操作,和3次內(nèi)存查找操作。由于內(nèi)存中的關鍵字是一個有序表結構,可以利用二分法查找提高效率。而3次磁盤I/O操作是影響整個B-Tree查找效率的決定因素。B-Tree相對于AVLTree縮減了節(jié)點個數(shù),使每次磁盤I/O取到內(nèi)存的數(shù)據(jù)都發(fā)揮了作用,從而提高了查詢效率。

B+Tree

B+Tree是在B-Tree基礎上的一種優(yōu)化,使其更適合實現(xiàn)外存儲索引結構,InnoDB存儲引擎就是用B+Tree實現(xiàn)其索引結構。

從上一節(jié)中的B-Tree結構圖中可以看到每個節(jié)點中不僅包含數(shù)據(jù)的key值,還有data值。而每一個頁的存儲空間是有限的,如果data數(shù)據(jù)較大時將會導致每個節(jié)點(即一個頁)能存儲的key的數(shù)量很小,當存儲的數(shù)據(jù)量很大時同樣會導致B-Tree的深度較大,增大查詢時的磁盤I/O次數(shù),進而影響查詢效率。在B+Tree中,所有數(shù)據(jù)記錄節(jié)點都是按照鍵值大小順序存放在同一層的葉子節(jié)點上,而非葉子節(jié)點上只存儲key值信息,這樣可以大大加大每個節(jié)點存儲的key值數(shù)量,降低B+Tree的高度。

B+Tree相對于B-Tree有幾點不同:

  • 非葉子節(jié)點只存儲鍵值信息。
  • 所有葉子節(jié)點之間都有一個鏈指針。
  • 數(shù)據(jù)記錄都存放在葉子節(jié)點中。

將上一節(jié)中的B-Tree優(yōu)化,由于B+Tree的非葉子節(jié)點只存儲鍵值信息,假設每個磁盤塊能存儲4個鍵值及指針信息,則變成B+Tree后其結構如下圖所示:

 mysql索引

通常在B+Tree上有兩個頭指針,一個指向根節(jié)點,另一個指向關鍵字最小的葉子節(jié)點,而且所有葉子節(jié)點(即數(shù)據(jù)節(jié)點)之間是一種鏈式環(huán)結構。因此可以對B+Tree進行兩種查找運算:一種是對于主鍵的范圍查找和分頁查找,另一種是從根節(jié)點開始,進行隨機查找。

可能上面例子中只有22條數(shù)據(jù)記錄,看不出B+Tree的優(yōu)點,下面做一個推算:

InnoDB存儲引擎中頁的大小為16KB,一般表的主鍵類型為INT(占用4個字節(jié))或BIGINT(占用8個字節(jié)),指針類型也一般為4或8個字節(jié),也就是說一個頁(B+Tree中的一個節(jié)點)中大概存儲16KB/(8B+8B)=1K個鍵值(因為是估值,為方便計算,這里的K取值為〖10〗^3)。也就是說一個深度為3的B+Tree索引可以維護10^3*10^3*10^3=10億條記錄。

實際情況中每個節(jié)點可能不能填充滿,因此在數(shù)據(jù)庫中,B+Tree的高度一般都在2~4層。MySQL的InnoDB存儲引擎在設計時是將根節(jié)點常駐內(nèi)存的,也就是說查找某一鍵值的行記錄時最多只需要1~3次磁盤I/O操作。

數(shù)據(jù)庫中的B+Tree索引可以分為聚集索引(clustered index)和輔助索引(secondary index)。上面的B+Tree示例圖在數(shù)據(jù)庫中的實現(xiàn)即為聚集索引,聚集索引的B+Tree中的葉子節(jié)點存放的是整張表的行記錄數(shù)據(jù)。輔助索引與聚集索引的區(qū)別在于輔助索引的葉子節(jié)點并不包含行記錄的全部數(shù)據(jù),而是存儲相應行數(shù)據(jù)的聚集索引鍵,即主鍵。當通過輔助索引來查詢數(shù)據(jù)時,InnoDB存儲引擎會遍歷輔助索引找到主鍵,然后再通過主鍵在聚集索引中找到完整的行記錄數(shù)據(jù)。

以上就是動力節(jié)點小編介紹的"MySQL索引原理",希望對大家有幫助,想了解更多可查看MySQL教程。動力節(jié)點在線學習教程,針對沒有任何Java基礎的讀者學習,讓你從入門到精通,主要介紹了一些Java基礎的核心知識,讓同學們更好更方便的學習和了解Java編程,感興趣的同學可以關注一下。

提交申請后,顧問老師會電話與您溝通安排學習

免費課程推薦 >>
技術文檔推薦 >>
主站蜘蛛池模板: 伊人久久精品成人网 | 伊人久久丁香色婷婷啪啪 | 欧美日韩精品一区二区在线线 | 欧美乱大交xxxxx在线观看 | 综合国产 | 九九视频在线播放 | 女人18毛片a级毛片免费 | 日批视频网址免费观看 | 国产精品露脸张开双腿 | 久久亚洲国产精品五月天 | 999在线观看视频 | 精品久久香蕉国产线看观看亚洲 | 四虎影院永久在线 | 伊人久久在线观看 | 亚洲国产婷婷香蕉久久久久久 | 美女美女高清毛片视频 | 国产福利在线观看第二区 | 777kkk亚洲综合欧美色老头 | 国产精品呦呦 | 亚洲日韩欧美一区二区在线 | 久久美剧 | 5060网永久免费一级毛片 | 日本欧美精品 | 国产成人成人一区二区 | 国产一级精品视频 | 久久国产乱子伦免费精品 | 毛片段| 亚洲伊人久久大香线蕉结合 | 国产最新在线视频 | 欧美一级aa免费毛片 | 伊人久热这里只精品视频 | 狠狠综合欧美综合欧美色 | 天天干天天干天天干 | 91伦理视频| 玖玖精品在线视频 | 国产尤物福利视频一区二区 | 九九综合九九 | 伊人手机在线视频 | 欧美另类videosbestv | 乱色专区| 亚洲视频手机在线观看 |