面试题总结15 自己构建一个哈希表
不使用hash庫函數可以使用其他如鏈表類的函數來構建一個哈希表,《stl源碼剖析》中講到hashtable是如何構建的,大致思路如下:
采用開鏈的方法使表格的負載系數小于1。
哈希散射來將大數映射為小數,索引為k = X%TableSize,tableSize需要一個質數,stl中自帶了28個質數,可以調用。
stl中采用桶子和鏈表的方式,整個桶子就是一張簡單的哈希表,整個桶子可以用一個數組表示,數組中的元素其實是一個鏈表的節點,保存鍵值和指針,指向key值為桶子內鍵值的鏈表。
注意下面幾點:
(1)哈希表要求的查找時間是O(N),在合理假設下,平均時間為O(1)。
(2)如果直接將鍵值作為桶子位置存放,當數據量較少時會造成空間的大量浪費,應該對一個hashfunction進行縮小,同時key值如果不一定按序存放,這樣會浪費一定的查找時間,這里要尋求一個時間與空間的平衡,就是動態數組大小來平衡。
(3)整個桶子用vector來表示,因為可以動態擴展,初始化時先賦予一個vector的大小,可以為最小的一個質數,當插入時,每次擴展為大于vector長度的最小質數。
(4)當vector動態擴展時,此時哈希函數的值就改變了,需要對原來的桶子進行重新配置,新桶子的創建中不需要拷貝鏈表,只要將每個桶子中的指針指向原來的鏈表即可。
(5)當插入(key,value)時,首先要使用哈希函數檢測key位于哪個桶子,如果沒有查找到桶子,則在桶子表后面插入一個新的桶子,里面保存key值和一個含有一個元素的鏈表結點,如果檢測到key值已經存在某個桶子中,則直接在后面的鏈表中插入一個新結點。
(6)當輸入key值得到value值時,只需在size中找到key值的位置,然后遍歷鏈表,如果key單一時不需要鏈表結構直接在桶子中保存value即可。
(7)得到鍵值總數,也就是桶子的個數,直接返回vector的大小,其實有點問題,這桶子的大小其實有部分是沒有存放數據的。
總結
以上是生活随笔為你收集整理的面试题总结15 自己构建一个哈希表的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 面试题总结14 动态规划
- 下一篇: linux下如何使用有道词典