免费爱碰视频在线观看,九九精品国产屋,欧美亚洲尤物久久精品,1024在线观看视频亚洲

<menu id="tgqfz"></menu>

<dfn id="tgqfz"><rt id="tgqfz"><em id="tgqfz"></em></rt></dfn>

<fieldset id="tgqfz"><rp id="tgqfz"><thead id="tgqfz"></thead></rp></fieldset>

MySQL 索引原理詳解

用戶投稿 ? 2022年6月20日 06:16 ? 社會

一、索引是什么？

1.1. 索引是什么

當(dāng)一張表有 500 萬條數(shù)據(jù)，在沒有索引的 name 字段上執(zhí)行一個查詢：

select * from user_innodb where name =’jim’;

如果 name 字段上面有索引呢？

ALTER TABLE user_innodb DROP INDEX idx_name;

ALTER TABLE user_innodb ADD INDEX idx_name (name);

索引的創(chuàng)建是需要消耗時間的。

有索引的查詢和沒有索引的查詢相比，效率相差幾十倍。

索引到底是什么呢？為什么可以對我們的查詢產(chǎn)生這么大的影響？創(chuàng)建索引的時候做了什么事情？

1.1.1.索引圖解

定義：數(shù)據(jù)庫索引，是數(shù)據(jù)庫管理系統(tǒng)（DBMS）中一個排序的數(shù)據(jù)結(jié)構(gòu)，以協(xié)助快速查詢、更新數(shù)據(jù)庫表中數(shù)據(jù)。

數(shù)據(jù)是以文件的形式存放在磁盤上面的，每一行數(shù)據(jù)都有它的磁盤地址。如果沒有索引的話，我們要從 500 萬行數(shù)據(jù)里面檢索一條數(shù)據(jù)，只能依次遍歷這張表的全部數(shù)據(jù)（循環(huán)調(diào)用存儲引擎的讀取下一條行數(shù)據(jù)的接口），直到找到這條數(shù)據(jù)。

但是我們有了索引之后，只需要在索引里面去檢索這條數(shù)據(jù)就行了，因為它是一種特殊的專門用來快速檢索的數(shù)據(jù)結(jié)構(gòu)，我們找到數(shù)據(jù)存放的磁盤地址以后，就可以拿到數(shù)據(jù)了。這個很容易理解，就像我們從一開始 500 頁的書里面去找特定的一小節(jié)的內(nèi)容，肯定不可能從第一頁開始翻。

這本書會有專門的目錄，它可能只有幾頁的內(nèi)容，它是按頁碼來組織的，可以根據(jù)拼音或者偏旁部首來查找，我們只要確定內(nèi)容對應(yīng)的頁碼，就能很快地找到我們想要的內(nèi)容。

1.1.2.索引類型

那在數(shù)據(jù)表上面，怎么創(chuàng)建一個索引？建表的時候指定，或者說是 alter table，也可以使用工具。

第一個是索引的名稱，第二個是索引的列表，比如我們是要對 id 創(chuàng)建索引還是對 name創(chuàng)建索引。后面前兩個很重要，一個叫索引類型。

在 InnoDB 中，索引類型有三種，普通索引、唯一索引（主鍵索引是特殊的唯一索引）、全文索引。

普通（Normal）：也叫非唯一索引，是最普通的索引，沒有任何的限制。

唯一（Unique）：唯一索引要求鍵值不能重復(fù)。另外需要注意的是，主鍵索引是一種特殊的唯一索引，它還多了一個限制條件，要求鍵值不能為空。主鍵索引用 primay key創(chuàng)建。

全文（Fulltext）：針對比較大的數(shù)據(jù)，比如我們存放的是消息內(nèi)容，有幾 KB 的數(shù)據(jù)的這種情況，

如果要解決 like 查詢效率低的問題，可以創(chuàng)建全文索引。只有文本類型的字段才可以創(chuàng)建全文索引，比如如 char、varchar、text。

create table m3 (

name varchar(50),

fulltext index(name)

);

select * from fulltext_test where match(content) against(‘馬士兵教育’ IN NATURAL

LANGUAGE MODE);

在 5.6 的版本之后，MyISAM 和 InnoDB 都支持全文索引。但是 MySQL 自帶的全文索引功能使用限制還是比較多，建議用其他的搜索引擎方案。

我們說索引是一種數(shù)據(jù)結(jié)構(gòu)，那么它到底應(yīng)該選擇一種什么數(shù)據(jù)結(jié)構(gòu)，才能實現(xiàn)數(shù)據(jù)的高效檢索呢？

二、索引存儲模型推演

二分查找

抖音很火的猜數(shù)字游戲，

猜你現(xiàn)在是100以內(nèi)的幾，

最后通過不斷縮小范圍，

鎖定數(shù)字

這個就是二分查找的一種思想，也叫折半查找，每一次，我們都把候選數(shù)據(jù)縮小了一半。如果數(shù)據(jù)已經(jīng)排過序的話，這種方式效率比較高。

所以第一個，可以考慮用有序數(shù)組作為索引的數(shù)據(jù)結(jié)構(gòu)。

有序數(shù)組的等值查詢和比較查詢效率非常高，但是更新數(shù)據(jù)的時候會出現(xiàn)一個問題，

可能要挪動大量的數(shù)據(jù)（改變 index），所以只適合存儲靜態(tài)的數(shù)據(jù)。

為了支持頻繁的修改，比如插入數(shù)據(jù)，我們需要采用鏈表。鏈表的話，如果是單鏈表，它的查找效率還是不夠高的。

所以，有沒有可以使用二分查找的鏈表呢？

為了解決這個問題，BST（Binary Search Tree）也就是我們所說的二叉查找樹誕生了

2.2. 二叉查找樹（BST Binary Search Tree）

二叉查找樹的特點是什么？

左子樹所有的節(jié)點都小于父節(jié)點，右子樹所有的節(jié)點都大于父節(jié)點。投影到平面以后，就是一個游戲序列的線性表。

二叉查找樹既能夠?qū)崿F(xiàn)快速查找，又能夠?qū)崿F(xiàn)快速插入。

但是二叉查找樹有一個問題：

就是它的查找耗時是和這棵樹的深度相關(guān)的，在最壞的情況下時間復(fù)雜度會退化成O(n)。

什么情況是最壞的情況呢？

https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

還是剛才的這一批數(shù)字，如果我們插入的數(shù)據(jù)剛好是有序的，5、7、12、14、17、 25。

這個時候二叉查找樹變成了什么樣了呢？

它會變成鏈表（我們把這種樹叫做“斜樹”），這種情況下不能達(dá)到加快檢索速度的目的，和順序查找效率是沒有區(qū)別的。

造成它傾斜的原因是什么呢？

因為左右子樹深度差太大，這棵樹的左子樹根本沒有節(jié)點——也就是它不夠平衡。

所以，有沒有左右子樹深度相差不是那么大，更加平衡的樹呢？

這個就是平衡二叉樹，叫做 Balanced binary search trees，或者 AVL 樹（AVL 是發(fā)明這個數(shù)據(jù)結(jié)果的人的名字縮寫）。

平衡二叉樹（AVL Tree）（左旋、右旋）

平衡二叉樹的定義：左右子樹深度差絕對值不能超過 1。

比如左子樹的深度就是 2，右子樹的深度只能是 1 或者 3。

這個時候我們再按順序插入 1、2、3、4、5、6，一定是這樣，不會變成一棵“斜樹”。

那它的平衡是怎么做到的呢？怎么保證左右子樹的深度差不能超過 1 呢？

https://www.cs.usfca.edu/~galles/visualization/AVLtree.html

插入 5、7、14。

注意看：當(dāng)我們插入了 5、7 之后，如果按照二叉查找樹的定義，14 肯定是要在 7 的右邊的，這個時候根節(jié)點 1 的右節(jié)點深度會變成 2，但是左節(jié)點的深度是 0，因為它沒有子節(jié)點，所以就會違反平衡二叉樹的定義。

那應(yīng)該怎么辦呢？因為它是右節(jié)點下面接一個右節(jié)點，右-右型，所以這個時候我們要把 7提上去，這個操作叫做左旋。

同樣的，如果我們插入 14、7、5，這個時候會變成左型，就會發(fā)生右旋操作，把 7提上去。

所以為了保持平衡，AVL 樹在插入和更新數(shù)據(jù)的時候執(zhí)行了一系列的計算和調(diào)整的操作。

平衡的問題我們解決了，那么平衡二叉樹作為索引怎么查詢數(shù)據(jù)？

在平衡二叉樹中，一個節(jié)點，它的大小是一個固定的單位，作為索引應(yīng)該存儲什么內(nèi)容？

它應(yīng)該存儲這三塊的內(nèi)容：

第一個是索引的鍵值。比如我們在 id 上面創(chuàng)建了一個索引，我在用 where id =1 的條件查詢的時候就會找到索引里面的東西 id 的這個鍵值。

第二個是數(shù)據(jù)的磁盤地址，因為索引的作用就是去查找數(shù)據(jù)的存放的地址。

第三個，因為是二叉樹，它必須還要有左子節(jié)點和右子節(jié)點的引用，這樣我們才能找到下一個節(jié)點。比如大于 26 的時候，走右邊，到下一個樹的節(jié)點，繼續(xù)判斷。

如果是這樣存儲數(shù)據(jù)的話，我們來看一下會有什么問題。

首先，對于 InnoDB 來說，索引的數(shù)據(jù)，是放在硬盤上的。查看數(shù)據(jù)和索引的大?。?/p>

select

CONCAT(ROUND(SUM(DATA_LENGTH/1024/1024),2),’MB’) AS data_len,

CONCAT(ROUND(SUM(INDEX_LENGTH/1024/1024),2),’MB’) as index_len

from information_schema.TABLES

where table_schema=’yteaher’ and table_name=’user_innodb’;

當(dāng)我們用樹的結(jié)構(gòu)來存儲索引的時候，因為拿到一塊數(shù)據(jù)就要在 Server 層比較是不是需要的數(shù)據(jù)，如果不是的話就要再讀一次磁盤。

訪問一個節(jié)點就要跟磁盤之間發(fā)生一次 I/O。InnoDB 操作磁盤的最小的單位是一頁（或者叫一個磁板塊），大小是 16K(16384 字節(jié))。

那么，一個樹的節(jié)點就是 16K 的大小。

如果我們一個節(jié)點只存一個鍵值+數(shù)據(jù)+引用，例如整形的字段，可能只用了十幾個或者幾十個字節(jié)奏，它遠(yuǎn)遠(yuǎn)達(dá)不到 16384 字節(jié)的容量，所以訪問一個樹節(jié)點，進行一次 IO 的時候，浪費了大量的空間。

所以如果每個節(jié)點存儲的數(shù)據(jù)太少，從索引中找到我們需要的數(shù)據(jù)，就要訪問更多的節(jié)點，意味著跟磁盤交互次數(shù)就會過多，消耗的時間也越多。

比如上面這張圖，我們一張表里面有 6 條數(shù)據(jù)，當(dāng)我們查詢 id=66 的時候，要查詢兩個子節(jié)點，就需要跟磁盤交互 3 次，如果我們有幾百萬的數(shù)據(jù)呢？這個時間更加難以估計。

所以解決方案是什么呢？

第一個，就是讓每個節(jié)點存儲更多的數(shù)據(jù)。

這樣的話，就會極大地降低樹的深度。我們的樹就從原來的高瘦高瘦的樣子，變成了矮胖矮胖的樣子。

這個時候，我們的樹就不再是二叉了，而是多叉，或者叫做多路。

多路平衡查找樹（B Tree）（分裂、合并）

Balanced Tree

這個就是我們的多路平衡查找樹，叫做 B Tree（B 代表平衡）。

跟 AVL 樹一樣，B 樹枝節(jié)點和葉子節(jié)點存儲鍵值、數(shù)據(jù)地址、節(jié)點引用。

它有一個特點：分叉數(shù)（路數(shù)）永遠(yuǎn)比關(guān)鍵字?jǐn)?shù)多 1。比如我們畫的這棵樹，每個節(jié)點存儲兩個關(guān)鍵字，那么就會有三個指針指向三個子節(jié)點。

B Tree 的查找規(guī)則是什么樣的呢？

比如我們要在這張表里面查找20。

? 搜索key = 20

? 20>15,排除0X01

? 20<35,排除0X03

? 那么他在15到35之間，

? 命中0X02

? 走磁盤塊3

? 20=20

? 命中

只用了 3 次 IO，這個是不是比 AVL 樹效率更高呢？

那 B Tree 又是怎么實現(xiàn)一個節(jié)點存儲多個關(guān)鍵字，還保持平衡的呢？跟 AVL 樹有什么區(qū)別？

https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

比如 Max Degree（路數(shù)）是 3 的時候，我們插入數(shù)據(jù) 1、2、3，在插入 3 的時候，本來應(yīng)該在第一個磁盤塊，但是如果一個節(jié)點有三個關(guān)鍵字的時候，意味著有 4 個指針，子節(jié)點會變成 4 路，所以這個時候必須進行分裂（其實就是 B+Tree）。把中間的數(shù)據(jù) 2提上去，把 1 和 3 變成 2 的子節(jié)點。

如果刪除節(jié)點，會有相反的合并的操作。

注意這里是分裂和合并，跟 AVL 樹的左旋和右旋是不一樣的。

我們繼續(xù)插入 4 和 5，B Tree 又會出現(xiàn)分裂和合并的操作。

從這個里面也能看到，在更新索引的時候會有大量的索引的結(jié)構(gòu)的調(diào)整，所以解釋了為什么不要在頻繁更新的列上建索引，或者為什么不要更新主鍵。

節(jié)點的分裂和合并，其實就是 InnoDB 頁（page）的分裂和合并。

B+樹（加強版多路平衡查找樹）

B Tree 的效率已經(jīng)很高了，為什么 MySQL 還要對 B Tree 進行改良，最終使用了B+Tree 呢？

總體上來說，這個時候 B 樹的改良版本解決的問題比 B Tree 更全面。

我們來看一下 InnoDB 里面的 B+樹的存儲結(jié)構(gòu)：

MySQL 中的 B+Tree 有兩個特點：

1、它的關(guān)鍵字的數(shù)量是跟路數(shù)相等的；

2、B+Tree 的根節(jié)點和枝節(jié)點中都不會存儲數(shù)據(jù)，只有葉子節(jié)點才存儲數(shù)據(jù)。

目前的認(rèn)知：我們這要存放的數(shù)據(jù)是什么？是不是真實數(shù)據(jù)的地址？

搜索到關(guān)鍵字不會直接返回，回到最后一層的葉子節(jié)點。比如我們搜索 id=28，雖然在第一層直接命中了，但是數(shù)據(jù)地址在葉子節(jié)點上面，所以我還要繼續(xù)往下搜索，一直到葉子節(jié)點。

3、B+Tree 的每個葉子節(jié)點增加了一個指向相鄰葉子節(jié)點的指針，它的最后一個數(shù)據(jù)會指向下一個葉子節(jié)點的第一個數(shù)據(jù)，形成了一個有序鏈表的結(jié)構(gòu)。

InnoDB 中的 B+Tree 這種特點帶來的優(yōu)勢：

1)它是 B Tree 的變種，B Tree 能解決的問題，它都能解決。B Tree 解決的兩大問題是什么？（每節(jié)點存儲更多關(guān)鍵字；路數(shù)更多）

2)掃庫、掃表能力更強（如果我們要對表進行全表掃描，只需要遍歷葉子節(jié)點就可以了，不需要遍歷整棵 B+Tree 拿到所有的數(shù)據(jù)）

3) B+Tree 磁盤讀寫能力相對于 B Tree 來說更強（根節(jié)點和枝節(jié)點不保存數(shù)據(jù)區(qū)，所以一個節(jié)點可以保存更多的關(guān)鍵字，一次磁盤加載的關(guān)鍵字更多）

4)排序能力更強（因為葉子節(jié)點上有下一個數(shù)據(jù)區(qū)的指針，數(shù)據(jù)形成了鏈表）

5)效率更加穩(wěn)定（B+Tree 永遠(yuǎn)是在葉子節(jié)點拿到數(shù)據(jù)，所以 IO 次數(shù)是穩(wěn)定的）

2.6. 索引方式：真的是用的 B+Tree 嗎？

在 Navicat 的工具中，創(chuàng)建索引，索引方式有兩種。

HASH：以 KV 的形式檢索數(shù)據(jù)，也就是說，它會根據(jù)索引字段生成哈希碼和指針，指針指向數(shù)據(jù)。

哈希索引有什么特點呢？

第一個，它的時間復(fù)雜度是 O(1)，查詢速度比較快。但是哈希索引里面的數(shù)據(jù)不是按順序存儲的，所以不能用于排序。

第二個，我們在查詢數(shù)據(jù)的時候要根據(jù)鍵值計算哈希碼，所以它只能支持等值查詢（= IN），不支持范圍查詢（> = <= between and）。

第三個：如果字段重復(fù)值很多的時候，會出現(xiàn)大量的哈希沖突（采用拉鏈法解決），效率會降低。

需要注意的是，在 InnoDB 中，不能顯示地創(chuàng)建一個哈希索引（所謂的支持哈希索引指的是Adaptive Hash Index）。

https://dev.mysql.com/doc/refman/5.7/en/create-index.html

memory 存儲引擎可以使用 Hash 索引.

CREATE TABLE `user_memory` (

`id` INT ( 11 ) NOT NULL AUTO_INCREMENT,

`name` VARCHAR ( 255 ) DEFAULT NULL,

`gender` TINYINT ( 1 ) DEFAULT NULL,

`phone` VARCHAR ( 11 ) DEFAULT NULL,

PRIMARY KEY ( `id` ),

KEY `idx_name` ( `name` ) USING HASH

) ENGINE = MEMORY AUTO_INCREMENT = 1 DEFAULT CHARSET = utf8mb4;

如果說面試的時候問到了為什么不用紅黑樹：

紅黑樹的種種約束保證的是什么？最長路徑不超過最短路徑的二倍。不太適合于數(shù)據(jù)庫索引。適合內(nèi)存的數(shù)據(jù)機構(gòu)，例如實現(xiàn)一致性哈希。

因為B Tree 和B+Tree 的特性，它們廣泛地用在文件系統(tǒng)和數(shù)據(jù)庫中，例如Windows的 HPFS 文件系統(tǒng)，Oracel、MySQL、SQLServer 數(shù)據(jù)庫。

三. B+Tree 落地形式

MySQL 數(shù)據(jù)存儲文件

上一節(jié)課我們知道了不同的存儲引擎文件不一樣。

show VARIABLES LIKE ‘datadir’;

每張 InnoDB 的表有兩個文件（ .frm 和 .ibd ）， MyISAM 的表有三個文件（.frm、.MYD、.MYI）。

有一個是相同的文件，.frm。 .frm 是 MySQL 里面表結(jié)構(gòu)定義的文件，不管你建表的時候選用任何一個存儲引擎都會生成，我們就不看了。

我們主要看一下其他兩個文件是怎么實現(xiàn)的 MySQL 不同的存儲引擎的索引的。

MyISAM

在 MyISAM 里面，另外有兩個文件：

一個是.MYD 文件，D 代表 Data，是 MyISAM 的數(shù)據(jù)文件，存放數(shù)據(jù)記錄，比如我們的user_myisam 表的所有的表數(shù)據(jù)。

一個是.MYI 文件，I 代表 Index，是 MyISAM 的索引文件，存放索引，比如我們在id 字段上面創(chuàng)建了一個主鍵索引，那么主鍵索引就是在這個索引文件里面。

也就是說，在 MyISAM 里面，索引和數(shù)據(jù)是兩個獨立的文件。

那我們怎么根據(jù)索引找到數(shù)據(jù)呢？

MyISAM 的 B+Tree 里面，葉子節(jié)點存儲的是數(shù)據(jù)文件對應(yīng)的磁盤地址。所以從索引文件.MYI 中找到鍵值后，會到數(shù)據(jù)文件.MYD 終于獲取相應(yīng)的數(shù)據(jù)記錄。

如果是輔助索引，有什么不一樣

ALTER TABLE user_innodb DROP INDEX index_user_name;

ALTER TABLE user_innodb ADD INDEX index_user_name (name);

在 MyISAM 里面，輔助索引也在這個.MYI 文件里面。

輔助索引跟主鍵索引存儲和檢索數(shù)據(jù)的方式是沒有任何區(qū)別的，一樣是在索引文件里面找到磁盤的址，然后到數(shù)據(jù)文件里面獲取數(shù)據(jù)。

這個就是 MyISAM 里面的索引以落地的形式。但是在 InnoDB 里面是不一樣的。我們來看一下。

InnoDB

InnoDB 只有一個文件（.ibd 文件），那索引放在哪里呢？

在 InnoDB 里面，它是以主鍵為索引來組織數(shù)據(jù)的存儲的，所以索引文件和數(shù)據(jù)文件是同一個文件，都在.ibd 文件里面。

在 InnoDB 的主鍵索引的葉子節(jié)點上，它直接存儲了我們的數(shù)據(jù)。

所以，為什么說在 InnoDB 中索引即數(shù)據(jù)，數(shù)據(jù)即索引，就是這個原因。

但是這里會有一個問題，一張 InnoDB 的表可能有很多個多索引，數(shù)據(jù)肯定是只有一份的，那數(shù)據(jù)在哪個索引的葉子節(jié)點上呢？

這里要給大家介紹一個叫做聚集索引（聚簇索引）的概念。

就是索引鍵值的邏輯順序跟表數(shù)據(jù)行的物理存儲順序是一致的。（比如字典的目錄是按拼音排序的的，內(nèi)容也是按拼音排序的，按拼音排序的這種目錄就叫聚集索引）。

InnoDB 組織數(shù)據(jù)的方式就是（聚集）索引組織表（clustered index organize table）。如果說一張表創(chuàng)建了主鍵索引，那么這個主鍵索引就是聚集索引，決定數(shù)據(jù)行的物理存儲順序。

問題來了，那主鍵索引之外的索引，他們存儲什么內(nèi)容，他們的葉子節(jié)點上沒有數(shù)據(jù)怎么檢索完整數(shù)據(jù)？比如在 name 字段上面建的普通索引。

InnoDB 中，主鍵索引和輔助索引是有一個主次之分的。剛才我們講了，如果有主鍵索引，那么主鍵鍵索引就是聚集索引。其他的索引統(tǒng)一叫做“二級索引”或者輔助索引。

二級索引存儲的是輔助索引的關(guān)鍵值，例如在 name 上面建立索引，節(jié)點上存的是 name的值，bobo，jim 等等。

而二級索引的葉子節(jié)點存的是這條記錄對應(yīng)的主鍵的值。比如 bobo id=1，jim id=4……

所以，二級索引檢索數(shù)據(jù)的流程是這樣的：

當(dāng) 我們用 name 索引查詢一條記錄，它會在二級索引的葉子節(jié) 點找到name=bobo，拿到主鍵值，也就是 id=，然后再到主鍵索引的葉子節(jié)點拿到數(shù)據(jù)。

從這個角度來說，因為主鍵索引比二級索引少掃描了一棵 B+Tree，它的速度相對會快一些。

但是，如果一張表沒有主鍵怎么辦？那完整的記錄放在哪個索引的葉子節(jié)點？或者，這張表根本沒有索引呢？數(shù)據(jù)放在哪里？

https://dev.mysql.com/doc/refman/5.7/en/innodb-index-types.html

1、如果我們定義了主鍵(PRIMARY KEY)，那么 InnoDB 會選擇主鍵作為聚集索引。

2、如果沒有顯式定義主鍵，則 InnoDB 會選擇第一個不包含有 NULL 值得唯一索引作為主鍵索引。

3、如果也沒有這樣的唯一索引，那么 InnoDB 會選擇內(nèi)置 6 字節(jié)長的 ROWID 作為隱藏的聚集索引，它會隨著行記錄的寫入而逐漸遞增。

select _rowid name from t2;

四、索引使用原則

我們?nèi)菀子幸粋€誤區(qū)，就是在經(jīng)常使用的查詢條件上都建立索引，索引越多越好，那到底是不是這樣樣呢？

列的離散（sàn）度

第一個叫做列的離散度，我們先來看一下列的離散度的公式：

count(distinct(column_name)) : count(*)，列的全部不同值和所有數(shù)據(jù)行的比例。數(shù)據(jù)行數(shù)相同的情況下，分子越大，分子的離散度就越高。

簡單來說，如果列的重復(fù)值越多，離散度就越低，重復(fù)值越少，離散度就越高。

我們不建議大家在離散度低的字段上建立索引。

沒有索引的時候查一遍：

SELECT * FROM `user_innodb` WHERE gender = 0;

建立索引之后再查一遍：

ALTER TABLE user_innodb DROP INDEX idx_user_gender;

ALTER TABLE user_innodb ADD INDEX idx_user_gender (gender); — 耗時比較久

SELECT * FROM `user_innodb` WHERE gender = 0;

發(fā)現(xiàn)消耗的時間更久了。

聯(lián)合索引最左匹配

前面我們說的都是針對單列創(chuàng)建的索引，但有的時候我們的多條件查詢的時候，也會建立聯(lián)合索引，舉例：查詢成績的時候必須同時輸入身份證和考號。

單列索引可以看成是特殊的聯(lián)合索引。

比如我們在 user 表上面，給 name 和 phone 建立了一個聯(lián)合索引。

ALTER TABLE user_innodb DROP INDEX comidx_name_phone;

ALTER TABLE user_innodb add INDEX comidx_name_phone (name,phone);

聯(lián)合索引在 B+Tree 中是復(fù)合的數(shù)據(jù)結(jié)構(gòu)，它是按照從左到右的順序來建立搜索樹的（name 在左邊，phone 在右邊）。

從這張圖可以看出來，name 是有序的，phone 是無序的。當(dāng) name 相等的時候，phone 才是有序的。

這個時候我們使用 where name= ‘jim’ and phone = ‘136xx ‘去查詢數(shù)據(jù)的時候，B+Tree 會優(yōu)先比較 name 來確定下一步應(yīng)該搜索的方向，往左還是往右。如果 name相同的時候再比較 phone。但是如果查詢條件沒有 name，就不知道第一步應(yīng)該查哪個節(jié)點，因為建立搜索樹的時候 name 是第一個比較因子，所以用不到索引。

什么時候用到聯(lián)合索引

所以，我們在建立聯(lián)合索引的時候，一定要把最常用的列表放在最左邊。

比如下面的三條語句，大家覺得用到聯(lián)合索引了嗎？

使用兩個字段，用到聯(lián)合索引：

EXPLAIN SELECT * FROM user_innodb WHERE name= ‘jim’ AND phone = ‘150000000000’;

使用左邊的 name 字段，用到聯(lián)合索引：

EXPLAIN SELECT * FROM user_innodb WHERE name= ‘權(quán)亮’

使用右邊的 phone 字段，無法使用索引，全表掃描：

EXPLAIN SELECT * FROM user_innodb WHERE phone = ‘15200000000’

如何創(chuàng)建聯(lián)合索引

有一天我們的 DBA 找到我，說我們的項目里面有兩個查詢很慢，按照我們的想法，一個查詢創(chuàng)建一個索引，所以我們針對這兩條 SQL 創(chuàng)建了兩個索引，這種做法覺得正確嗎？

CREATE INDEX idx_name on user_innodb(name);

CREATE INDEX idx_name_phone on user_innodb(name,phone);

當(dāng)我們創(chuàng)建一個聯(lián)合索引的時候，按照最左匹配原則，用左邊的字段 name 去查詢的時候，也能用

到索引，所以第一個索引完全沒必要。

相當(dāng)于建立了兩個聯(lián)合索引(name),(name,phone)。

如果我們創(chuàng)建三個字段的索引 index(a,b,c)，相當(dāng)于創(chuàng)建三個索引：

index(a)

index(a,b)

index(a,b,c)

用 where b=? 和 where b=? and c=? 是不能使用索引的。

這里就是 MySQL 里面聯(lián)合索引的最左匹配原則。

覆蓋索引

什么叫回表：

非主鍵索引，我們先通過索引找到主鍵索引的鍵值，再通過主鍵值查出索引里面的字有的數(shù)據(jù)，它比基于主鍵索引的查詢多掃描了一棵索引樹，這個過程就叫回表。

例如：

select * from user_innodb where name = ‘bobo’;

在輔助索引里面，不管是單列索引還是聯(lián)合索引，如果 select 的數(shù)據(jù)列只用從索引中就能夠取得，不必從數(shù)據(jù)區(qū)中讀取，這時候使用的索引就叫做覆蓋索引，這樣就避免了回表。

Extra 里面值為“Using index”代表使用了覆蓋索引。

我們先來創(chuàng)建一個聯(lián)合索引：

— 創(chuàng)建聯(lián)合索引

ALTER TABLE user_innodb DROP INDEX comixd_name_phone;

ALTER TABLE user_innodb add INDEX `comixd_name_phone` (`name`,`phone`);

這三個查詢語句都用到了覆蓋索引：

EXPLAIN SELECT name,phone FROM user_innodb WHERE name= ‘jim’ AND phone = ‘

13666666666′;

EXPLAIN SELECT nameFROM user_innodb WHERE name= ‘jim’ AND phone = ‘

13666666666′;

EXPLAIN SELECT phone FROM user_innodb WHERE name= ‘jim’ AND phone = ‘

13666666666′;

select * ，此處用不到覆蓋索引。

如果改成只用 where phone = 查詢呢？大家自己試試。按照我們之前的分析，它是用不到索引的。

實際上可以用到覆蓋索引！覆蓋的索引跟是否可能使用索引沒有直接關(guān)系。

很明顯，因為覆蓋的索引減少了 IO 次數(shù)多，減少了數(shù)據(jù)的訪問量，可以大大地提升查詢效率。

五. 索引的創(chuàng)建與使用

因為索引對于改善查詢性能的作用是巨大的，所以我們的目標(biāo)是盡量使用索引。

在什么字段上索引？

1、在用于 where 判斷 order 排序和 join 的（on）字段上創(chuàng)建索引

2、索引的個數(shù)不要過多。

——浪費空間，更新變慢。

3、區(qū)分度低的字段，例如性別，不要建索引。

——離散度太低，導(dǎo)致掃描行數(shù)過多。

4、頻繁更新的值，不要作為主鍵或者索引。

——頁分裂

5、隨機無序的值，不建議作為主鍵索引，例如身份證、UUID。

——無序，分裂

6、創(chuàng)建復(fù)合索引，而不是修改單列索引

什么時候索引失效？

1、索引列上使用函數(shù)（replaceSUBSTRCONCATsum count avg）、表達(dá)式

計算（+ – * /）：https://www.runoob.com/mysql/mysql-functions.html

explain SELECT * FROM `t2` where id+1 = 4;

2、字符串不加引號，出現(xiàn)隱式轉(zhuǎn)換

ALTER TABLE user_innodb DROP INDEX comidx_name_phone;

ALTER TABLE user_innodb add INDEX comidx_name_phone (name,phone);

explain SELECT * FROM `user_innodb` where name = 136;

explain SELECT * FROM `user_innodb` where name = ‘136’;

3、like 條件中前面帶%

where 條件中 like abc%，like %2673%，like %888 都用不到索引嗎？為什么？

explain select *from user_innodb where name like ‘wang%’;

explain select *from user_innodb where name like ‘%wang’;

過濾的開銷太大。這個時候可以用全文索引。

4、負(fù)向查詢

NOT LIKE 不能：

explain select *from employees where last_name not like ‘wang’

!= （）和 NOT IN 在某些情況下可以說：

explain select *from employees where emp_no not in (1) explain select *from

employees where emp_no 1

注意跟數(shù)據(jù)庫版本、數(shù)據(jù)量、數(shù)據(jù)選擇度都有關(guān)系。

其實，用不用索引，最終都是優(yōu)化器說了算。

優(yōu)化器是基于什么的優(yōu)化器？

基于 cost 開銷（Cost Base Optimizer），它不是基于規(guī)則（Rule-Based Optimizer），也不是基于語義。怎么樣開銷就怎么來。

https://docs.oracle.com/cd/B10501_01/server.920/a96533/rbo.htm#38960

https://dev.mysql.com/doc/refman/5.7/en/cost-model.html

使用索引有基本原則，但是沒有具體細(xì)則，沒有什么情況一定用索引，什么情況一定不用索引的規(guī)則則

鄭重聲明：本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng)，不代表本站立場，版權(quán)歸原作者所有，如有侵權(quán)請聯(lián)系管理員(admin#wlmqw.com)刪除。

內(nèi)容原理子樹字段數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)文件深度磁盤索引節(jié)點詳解

贊 (0)

Switch模擬器YUZU進度報告2022-2月

上一篇 2022年6月20日 06:16

利潤達(dá)到手機廠商們的2-7倍！諾基亞5G專利不合理收費引爭議

下一篇 2022年6月20日 06:16

金融科技能否通過開放式銀行API建立可行業(yè)務(wù)？
【中國金融案例中心編譯：葉子】開放式銀行API的誕生以及政府的關(guān)注使得開放式銀行API得到了前所未有的發(fā)展。由于辦理高效、用戶便捷等優(yōu)勢，這種業(yè)務(wù)已經(jīng)成為未來金融科技的發(fā)展方向…
2022年6月20日
0
智己L7將6月18日首批交付，36.88萬起售的純電轎車物有所值嗎？
6月14日晚上，智己汽車在線上舉行發(fā)布會，這個活動原本的主題是探尋“智能原點”，但我卻認(rèn)為最后一個“彩蛋”才是整個發(fā)布會的真正核心，因為智己L7馬上就要在6月18日開始交付了。其…
2022年6月17日
0
劇本殺為何深受年輕人喜愛？背后藏有"內(nèi)幕"，讓人迷失自我
據(jù)艾媒網(wǎng)對外公布的數(shù)據(jù)顯示，近年來劇本殺在我國的發(fā)展速度飛快，其中玩家主要以年輕人為主。按照年齡分布來看，26-30歲的群體及31-40歲的群體分別占劇本殺玩家中的39.2%與37…
2022年7月2日
0
撤僑令下，18歲奪百花影后，28歲宣誓效忠美國的陳沖，后來怎樣了
從中國走出的百花獎影后，陳沖在好萊塢也闖蕩了很多年時間，在《大班》、《天與地》以及《末代皇帝》等電影的加持下，她在影視圈的地位也最終得以奠定下來。不過，國籍的事情，始終是她飽受詬…
2022年8月1日
0
伽馬數(shù)據(jù)：高級/資深游戲研發(fā)人員缺口較大-
北京商報訊（記者鄭蕊）據(jù)伽馬數(shù)據(jù)3月21日發(fā)布的《2021-2022中國游戲企業(yè)研發(fā)競爭力報告》（以下簡稱《報告》）顯示，2021年游戲人才經(jīng)歷了新一輪的內(nèi)部調(diào)整，隨著游戲新品上…
2022年6月30日
0
8.23體驗服：“野亡”趙云喜迎加強！狄仁杰再度降溫
8.23體驗服：針對峽谷雙龍、中路河靈以及四位英雄進行調(diào)整。大家好，我是策策。注：體驗服版本，不代表最終上線及數(shù)值。第一部分王者峽谷調(diào)整 01 雙龍調(diào)整上一次體驗服已經(jīng)對…
2022年8月25日
0
特斯拉中國銷量驟降超60%！電動車最新數(shù)據(jù)來了
中國基金報見習(xí)記者文夕 8月9日，乘聯(lián)會發(fā)布數(shù)據(jù)，雖然7月新能源乘用車因淡季因素影響，零售銷量48.6萬輛環(huán)比下降8.5%，但7月的新能源乘用車廠商批發(fā)銷量56.4萬輛，跟去年增…
2022年8月10日
0
騰訊出了一款超良心的工具，瞬間節(jié)省 10 個 G
垃圾清理，可謂如今所有「沖浪人」的剛需。現(xiàn)在手機上一般都有自帶的清理軟件，Windows 電腦上的清理軟件也是多如牛毛。但一到了 Mac 電腦上，貌似好用的清理軟件就屈指可數(shù)了…
2022年8月3日
0
從增長玄學(xué)到增長科學(xué)，巨量云圖為618注入新變量
作者丨顧見監(jiān)制丨闌夕因為眾所周知的原因，今年618期間，電商平臺和商家對“增長”的渴望比往年更加強烈。但形成鮮明對比的是，這屆618少了很多刷街的戶外廣告和聲勢浩大的發(fā)布會，似…
2022年6月23日
0
極空間Z2S升級兩年質(zhì)保，藍(lán)光觀影體驗看到爽
6月9日極空間私有云宣布完成了近億元的A輪融資，相信從此“財大氣粗”的極空間會在產(chǎn)品研發(fā)和技術(shù)體驗上更進一步，產(chǎn)品更加優(yōu)化，服務(wù)更加升級，這讓早已入坑極空間的我還是倍感驕傲的！ #…
2022年6月22日
0

聯(lián)系我們

聯(lián)系郵箱：admin#wlmqw.com
工作時間：周一至周五，10:30-18:30，節(jié)假日休息

<strike id="6q1ju"></strike>

<fieldset id="6q1ju"><li id="6q1ju"></li></fieldset><menu id="6q1ju"><li id="6q1ju"><dd id="6q1ju"></dd></li></menu>

<menu id="6q1ju"><li id="6q1ju"><dd id="6q1ju"></dd></li></menu>

<fieldset id="6q1ju"></fieldset>

<label id="6q1ju"><rp id="6q1ju"></rp></label>