當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

索引，复合索引

發布時間：2025/4/16 编程问答 38 豆豆

生活随笔收集整理的這篇文章主要介紹了索引，复合索引小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這里只看BTree索引，至于哈希索引和全文索引本文暫不討論。

前言：

索引是有效使用數據庫的基礎，但你的數據量很小的時候，或許通過掃描整表來存取數據的性能還能接受，但當數據量極大時，當訪問量極大時，就一定需要通過索引的輔助才能有效地存取數據。一般索引建立的好壞是性能好壞的成功關鍵。

使用InnoDb作為數據引擎的Mysql和有聚集索引的SqlServer的數據存儲結構有點類似，雖然在物理層面，他們都存儲在Page上，但在邏輯上面，我們可以把數據分為三塊：數據區域，索引區域，主鍵區域，他們通過主鍵的值作為關聯，配合工作。

一個表數據空間中的索引數據區域中有很多索引，每一個索引都是一顆B+Tree，在非聚集索引的B+Tree中索引的值作為B+Tree的節點的Key，數據主鍵作為節點的Value。在InnoDB中，表數據文件本身就是按B+Tree組織的一個索引結構，這棵樹的葉節點數據域保存了完整的數據記錄。這個索引的key是數據表的主鍵，因此InnoDB表數據文件本身就是主鍵索引。這種索引也叫做聚集索引。聚集索引查詢速度比非聚集索引快，是因為聚集索引只查詢一次，查詢到的元素的key就是主鍵，value就是數據記錄。非聚集索引查詢要查詢兩次，第一次查詢到的元素的value為數據記錄的主鍵，再根據主鍵查詢匹配的數據記錄。

因為InnoDB的數據文件本身要按主鍵聚集，所以InnoDB要求表必須有主鍵（MyISAM可以沒有），如果沒有顯式指定，則MySQL系統會自動選擇一個可以唯一標識數據記錄的列作為主鍵，如果不存在這種列，則MySQL自動為InnoDB表生成一個隱含字段作為主鍵，這個字段長度為6個字節，類型為長整形。

磁盤IO與預讀

前面提到了訪問磁盤，那么這里先簡單介紹一下磁盤IO和預讀，磁盤讀取數據靠的是機械運動，每次讀取數據花費的時間可以分為尋道時間、旋轉延遲、傳輸時間三個部分，尋道時間指的是磁臂移動到指定磁道所需要的時間，主流磁盤一般在5ms以下；旋轉延遲就是我們經常聽說的磁盤轉速，比如一個磁盤7200轉，表示每分鐘能轉7200次，也就是說1秒鐘能轉120次，旋轉延遲就是1/120/2 = 4.17ms；傳輸時間指的是從磁盤讀出或將數據寫入磁盤的時間，一般在零點幾毫秒，相對于前兩個時間可以忽略不計。那么訪問一次磁盤的時間，即一次磁盤IO的時間約等于5+4.17 = 9ms左右，聽起來還挺不錯的，但要知道一臺500 -MIPS的機器每秒可以執行5億條指令，因為指令依靠的是電的性質，換句話說執行一次IO的時間可以執行40萬條指令，數據庫動輒十萬百萬乃至千萬級數據，每次9毫秒的時間，顯然是個災難。考慮到磁盤IO是非常高昂的操作，計算機操作系統做了一些優化，當一次IO時，不光把當前磁盤地址的數據，而是把相鄰的數據也都讀取到內存緩沖區內，因為局部預讀性原理告訴我們，當計算機訪問一個地址的數據的時候，與其相鄰的數據也會很快被訪問到。每一次IO讀取的數據我們稱之為一頁(page)。具體一頁有多大數據跟操作系統有關，一般為4k或8k，也就是我們讀取一頁內的數據時候，實際上才發生了一次IO，這個理論對于索引的數據結構設計非常有幫助。

復合索引：（索引的最左匹配特性）

當b+樹的數據項是復合的數據結構，比如(name,age,sex)的時候，b+數是按照從左到右的順序來建立搜索樹的，比如當(張三,20,F)這樣的數據來檢索的時候，b+樹會優先比較name來確定下一步的所搜方向，如果name相同再依次比較age和sex，最后得到檢索的數據；
但當(20,F)這樣的沒有name的數據來的時候，b+樹就不知道下一步該查哪個節點，因為建立搜索樹的時候name就是第一個比較因子，必須要先根據name來搜索才能知道下一步去哪里查詢。
比如當(張三,F)這樣的數據來檢索時，b+樹可以用name來指定搜索方向，但下一個字段age的缺失，所以只能把名字等于張三的數據都找到，然后再匹配性別是F的數據了，
這個是非常重要的性質，即索引的最左匹配特性。

優化原則：

1.最左前綴匹配原則，非常重要的原則，mysql會一直向右匹配直到遇到范圍查詢(>、<、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)順序的索引，d是用不到索引的，
如果建立(a,b,d,c)的索引則都可以用到，a,b,d的順序可以任意調整。
2.=和in可以亂序，比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序，mysql的查詢優化器會幫你優化成索引可以識別的形式
3.盡量選擇區分度高的列作為索引,區分度的公式是count(distinct col)/count(*)，表示字段不重復的比例，比例越大我們掃描的記錄數越少，唯一鍵的區分度是1，而一些狀態、性別字段可能在大數據面前區分度就是0，
那可能有人會問，這個比例有什么經驗值嗎？使用場景不同，這個值也很難確定，一般需要join的字段我們都要求是0.1以上，即平均1條掃描10條記錄
4.索引列不能參與計算，保持列“干凈”，比如from_unixtime(create_time) = '2014-05-29'就不能使用到索引，原因很簡單，b+樹中存的都是數據表中的字段值，
但進行檢索時，需要把所有元素都應用函數才能比較，顯然成本太大。所以語句應該寫成create_time = unix_timestamp('2014-05-29');
5.盡量的擴展索引，不要新建索引。比如表中已經有a的索引，現在要加(a,b)的索引，那么只需要修改原來的索引即可

慢查詢優化基本步驟：

0.先運行看看是否真的很慢，注意設置SQL_NO_CACHE 1.where條件單表查，鎖定最小返回記錄表。這句話的意思是把查詢語句的where都應用到表中返回的記錄數最小的表開始查起，單表每個字段分別查詢，看哪個字段的區分度最高 2.explain查看執行計劃，是否與1預期一致（從鎖定記錄較少的表開始查詢） 3.order by limit 形式的sql語句讓排序的表優先查 4.了解業務方使用場景 5.加索引時參照建索引的幾大原則 6.觀察結果，不符合預期繼續從0分析

https://tech.meituan.com/mysql-index.html

https://www.cnblogs.com/dreamworlds/p/5398535.html

http://blog.codinglabs.org/articles/theory-of-mysql-index.html

https://www.zhihu.com/question/36996520

總結

以上是生活随笔為你收集整理的索引，复合索引的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

索引

上一篇：实战4节点Centos7.3 安装Kub
下一篇：关于物理像素／逻辑像素

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

索引，复合索引

總結