當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

BTree,B-Tree,B+Tree,B*Tree

發(fā)布時間：2025/7/14 编程问答 15 豆豆

生活随笔收集整理的這篇文章主要介紹了 BTree,B-Tree,B+Tree,B*Tree 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

B樹

?????? 即二叉搜索樹：

?????? 1.所有非葉子結(jié)點至多擁有兩個兒子（Left和Right）；

?????? 2.所有結(jié)點存儲一個關(guān)鍵字；

?????? 3.非葉子結(jié)點的左指針指向小于其關(guān)鍵字的子樹，右指針指向大于其關(guān)鍵字的子樹；

?????? 如：

???????

?????? B樹的搜索，從根結(jié)點開始，如果查詢的關(guān)鍵字與結(jié)點的關(guān)鍵字相等，那么就命中；否則，如果查詢關(guān)鍵字比結(jié)點關(guān)鍵字小，就進入左兒子；如果比結(jié)點關(guān)鍵字大，就進入右兒子；如果左兒子或右兒子的指針為空，則報告找不到相應(yīng)的關(guān)鍵字；

?????? 如果B樹的所有非葉子結(jié)點的左右子樹的結(jié)點數(shù)目均保持差不多（平衡），那么B樹的搜索性能逼近二分查找；但它比連續(xù)內(nèi)存空間的二分查找的優(yōu)點是，改變B樹結(jié)構(gòu)（插入與刪除結(jié)點）不需要移動大段的內(nèi)存數(shù)據(jù)，甚至通常是常數(shù)開銷；

?????? 如：

??????

??? 但B樹在經(jīng)過多次插入與刪除后，有可能導(dǎo)致不同的結(jié)構(gòu)：

?? 右邊也是一個B樹，但它的搜索性能已經(jīng)是線性的了；同樣的關(guān)鍵字集合有可能導(dǎo)致不同的樹結(jié)構(gòu)索引；所以，使用B樹還要考慮盡可能讓B樹保持左圖的結(jié)構(gòu)，和避免右圖的結(jié)構(gòu)，也就是所謂的“平衡”問題；??????

?????? 實際使用的B樹都是在原B樹的基礎(chǔ)上加上平衡算法，即“平衡二叉樹”；如何保持B樹結(jié)點分布均勻的平衡算法是平衡二叉樹的關(guān)鍵；平衡算法是一種在B樹中插入和刪除結(jié)點的策略；

B-樹

?????? 是一種多路搜索樹（并不是二叉的）：

?????? 1.定義任意非葉子結(jié)點最多只有M個兒子；且M>2；

?????? 2.根結(jié)點的兒子數(shù)為[2, M]；

?????? 3.除根結(jié)點以外的非葉子結(jié)點的兒子數(shù)為[M/2, M]；

?????? 4.每個結(jié)點存放至少M/2-1（取上整）和至多M-1個關(guān)鍵字；（至少2個關(guān)鍵字）

?????? 5.非葉子結(jié)點的關(guān)鍵字個數(shù)=指向兒子的指針個數(shù)-1；

?????? 6.非葉子結(jié)點的關(guān)鍵字：K[1], K[2], …, K[M-1]；且K[i] < K[i+1]；

?????? 7.非葉子結(jié)點的指針：P[1], P[2], …, P[M]；其中P[1]指向關(guān)鍵字小于K[1]的子樹，P[M]指向關(guān)鍵字大于K[M-1]的子樹，其它P[i]指向關(guān)鍵字屬于(K[i-1], K[i])的子樹；

?????? 8.所有葉子結(jié)點位于同一層；

?????? 如：（M=3）

?????? B-樹的搜索，從根結(jié)點開始，對結(jié)點內(nèi)的關(guān)鍵字（有序）序列進行二分查找，如果命中則結(jié)束，否則進入查詢關(guān)鍵字所屬范圍的兒子結(jié)點；重復(fù)，直到所對應(yīng)的兒子指針為空，或已經(jīng)是葉子結(jié)點；

B-樹的特性：

?????? 1.關(guān)鍵字集合分布在整顆樹中；

?????? 2.任何一個關(guān)鍵字出現(xiàn)且只出現(xiàn)在一個結(jié)點中；

?????? 3.搜索有可能在非葉子結(jié)點結(jié)束；

?????? 4.其搜索性能等價于在關(guān)鍵字全集內(nèi)做一次二分查找；

?????? 5.自動層次控制；

?????? 由于限制了除根結(jié)點以外的非葉子結(jié)點，至少含有M/2個兒子，確保了結(jié)點的至少利用率，其最底搜索性能為：

????

?????? 其中，M為設(shè)定的非葉子結(jié)點最多子樹個數(shù)，N為關(guān)鍵字總數(shù)；

?????? 所以B-樹的性能總是等價于二分查找（與M值無關(guān)），也就沒有B樹平衡的問題；

?????? 由于M/2的限制，在插入結(jié)點時，如果結(jié)點已滿，需要將結(jié)點分裂為兩個各占M/2的結(jié)點；刪除結(jié)點時，需將兩個不足M/2的兄弟結(jié)點合并；

B+樹

?????? B+樹是B-樹的變體，也是一種多路搜索樹：

?????? 1.其定義基本與B-樹同，除了：

?????? 2.非葉子結(jié)點的子樹指針與關(guān)鍵字個數(shù)相同；

?????? 3.非葉子結(jié)點的子樹指針P[i]，指向關(guān)鍵字值屬于[K[i], K[i+1])的子樹（B-樹是開區(qū)間）；

?????? 5.為所有葉子結(jié)點增加一個鏈指針；

?????? 6.所有關(guān)鍵字都在葉子結(jié)點出現(xiàn)；

?????? 如：（M=3）

?? B+的搜索與B-樹也基本相同，區(qū)別是B+樹只有達到葉子結(jié)點才命中（B-樹可以在非葉子結(jié)點命中），其性能也等價于在關(guān)鍵字全集做一次二分查找；

?????? B+的特性：

?????? 1.所有關(guān)鍵字都出現(xiàn)在葉子結(jié)點的鏈表中（稠密索引），且鏈表中的關(guān)鍵字恰好是有序的；

?????? 2.不可能在非葉子結(jié)點命中；

?????? 3.非葉子結(jié)點相當于是葉子結(jié)點的索引（稀疏索引），葉子結(jié)點相當于是存儲（關(guān)鍵字）數(shù)據(jù)的數(shù)據(jù)層；

?????? 4.更適合文件索引系統(tǒng)；

B*樹

?????? 是B+樹的變體，在B+樹的非根和非葉子結(jié)點再增加指向兄弟的指針；

?? B*樹定義了非葉子結(jié)點關(guān)鍵字個數(shù)至少為(2/3)*M，即塊的最低使用率為2/3（代替B+樹的1/2）；

?????? B+樹的分裂：當一個結(jié)點滿時，分配一個新的結(jié)點，并將原結(jié)點中1/2的數(shù)據(jù)復(fù)制到新結(jié)點，最后在父結(jié)點中增加新結(jié)點的指針；B+樹的分裂只影響原結(jié)點和父結(jié)點，而不會影響兄弟結(jié)點，所以它不需要指向兄弟的指針；

?????? B*樹的分裂：當一個結(jié)點滿時，如果它的下一個兄弟結(jié)點未滿，那么將一部分數(shù)據(jù)移到兄弟結(jié)點中，再在原結(jié)點插入關(guān)鍵字，最后修改父結(jié)點中兄弟結(jié)點的關(guān)鍵字（因為兄弟結(jié)點的關(guān)鍵字范圍改變了）；如果兄弟也滿了，則在原結(jié)點與兄弟結(jié)點之間增加新結(jié)點，并各復(fù)制1/3的數(shù)據(jù)到新結(jié)點，最后在父結(jié)點增加新結(jié)點的指針；

?????? 所以，B*樹分配新結(jié)點的概率比B+樹要低，空間使用率更高；

小結(jié)

?????? B樹：二叉樹，每個結(jié)點只存儲一個關(guān)鍵字，等于則命中，小于走左結(jié)點，大于走右結(jié)點；

?????? B-樹：多路搜索樹，每個結(jié)點存儲M/2到M個關(guān)鍵字，非葉子結(jié)點存儲指向關(guān)鍵字范圍的子結(jié)點；

?????? 所有關(guān)鍵字在整顆樹中出現(xiàn)，且只出現(xiàn)一次，非葉子結(jié)點可以命中；

?????? B+樹：在B-樹基礎(chǔ)上，為葉子結(jié)點增加鏈表指針，所有關(guān)鍵字都在葉子結(jié)點中出現(xiàn)，非葉子結(jié)點作為葉子結(jié)點的索引；B+樹總是到葉子結(jié)點才命中；

?????? B*樹：在B+樹基礎(chǔ)上，為非葉子結(jié)點也增加鏈表指針，將結(jié)點的最低利用率從1/2提高到2/3；

摘自：http://blog.csdn.net/manesking/archive/2007/02/09/1505979.aspx

Innodb 作為 MySQL 中使用最為廣泛的事務(wù)型存儲引擎，不僅在事務(wù)實現(xiàn)數(shù)據(jù)版本控制方面和其他存儲引擎有一定的區(qū)別，其數(shù)據(jù)結(jié)構(gòu)也是以非常有特點的方式存儲的。

每個Innodb表的數(shù)據(jù)其實可以說就是以一個樹型（B-Tree）結(jié)構(gòu)存儲的，表的數(shù)據(jù)和主鍵（Primary Key）共同組成了一個索引結(jié)構(gòu)，也就是我們常說的Innodb的Clustered Primary Key。在這個Clustered Primary Key中，Leaf Nodes其實就是實際的表記錄，我們常規(guī)理解上的索引信息全部在Branch Nodes上面。

除了Clustered Primary Key之外的其他所有索引在Innodb中被稱為Secondary Index。Secondary Index就和普通的B-Tree索引差不多了，只不過在Secondary Index的所有Leaf Nodes上面同時包含了所指向數(shù)據(jù)記錄的主鍵信息，而不是直接指向數(shù)據(jù)記錄的位置信息。

所以，在 Innodb 中，如果主鍵值占用存儲空間較大的話，會直接影響整個存儲 Innodb 表所需要的物理空間，同時也會直接影響到 Innodb 的查詢性能。

下面是畫的一張 Innodb 索引基本結(jié)構(gòu)圖，包括 Primary Key 和 Secondary Index 兩種索引的比較。

在此之前曾經(jīng)寫過一篇介紹 “Innodb 索引結(jié)構(gòu)了解 - Innodb Index Structure” 的文章，這次再接著分析一下 MyISAM 存儲引擎索引的基本存儲結(jié)構(gòu)。

從索引基本的存放數(shù)據(jù)結(jié)構(gòu)來說，MyISAM 的索引不論是 Primary Key 還是普通 Index，存儲結(jié)構(gòu)都基本一樣，基本結(jié)構(gòu)都是 Balance Tree （簡稱為 B-Tree），所有的鍵值詳細信息和行“指針”信息都存放于 B-Tree 的 Leaf Nodes 上面。這個基本的數(shù)據(jù)結(jié)構(gòu)和 MySQL 的其他存儲引擎如 Innodb 也基本相同。但是，MyISAM 的索引并不像 Innodb 存儲引擎那樣 Primary Key 和 Secondary Index 中存放的數(shù)據(jù)存在較大區(qū)別。在 MyISAM 存儲引擎中，Primary Key 和其他的普通 Index 的主要區(qū)別僅僅在于 Primary Key 的索引鍵需要滿足是非空的唯一值而已，另外一個區(qū)別其實也是每一個普通索引之間都存在的區(qū)別，就是整個索引樹的鍵值排列順序不太一樣。

由于 MyISAM 存儲引擎中數(shù)據(jù)行的存儲分為固定長度和動態(tài)長度兩種，所以在 MyISAM 存儲引擎的數(shù)據(jù)文件中定位一行數(shù)據(jù)所需要信息也存在兩種方式。一種是直接通過行號（row number）來定位固定長度表數(shù)據(jù)的行，另外一種是通過其他一些相對的文件位置標識信息來定位動態(tài)長度表數(shù)據(jù)的行，這里我們姑且將兩種方式統(tǒng)稱為RID（Row ID）吧。

下面這張圖片展示了 MyISAM 索引的基本存儲方式：

myisam index structure

本文出自：http://www.jianzhaoyang.com/database/myisam-index-structure

轉(zhuǎn)載于:https://www.cnblogs.com/ajian005/archive/2011/11/30/2753764.html

總結(jié)

以上是生活随笔為你收集整理的BTree,B-Tree,B+Tree,B*Tree的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

tree
BTREE

上一篇： HDU_2065 红色病毒问题(指数型生
下一篇： Server Application U

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

BTree,B-Tree,B+Tree,B*Tree

總結(jié)