Hash查找的基本原理及实现
理論:
很多查找算法是通過利用關于項在集合中相對余彼此存儲的位置的信息,改進搜索算法
建立一個可以在O(1)時間內被搜索的數據結構--> Hash查找
哈希表是以一種容易找到它們的方式存儲項的集合,哈希表的每個位置,通常稱為一個槽,可以容納一個項,并且由從0開始的整數值命名,例如有名為0的槽,名為1的槽......,最初,哈希表不包含項,因此每個槽為空,我們可以通過一個列表來實現哈希表每個元素初始化為none?
項和該項在散列表中所屬的槽之間的映射被稱為hash函數。hash函數將接受集合中的任何項,并在槽名范圍內(0~m-1之間)返回一個整數
hash函數:
余數法:只需要一個項并將其除以表大小,返回剩余部分作為其散列值(h(item) = item % 11(槽的大小))? ? ?結果必在槽名的范圍內
一旦計算了哈希值,我們可以將每個項插入到指定位置的哈希表中
給定項的集合,將每個項映射到唯一槽的散列函數被稱為完美散列函數,總是具有完美散列函數的一種方式就是增加散列表的大小,使得可以容納項范圍中的每個可能值
很多擴展簡單余數法:
1、分組求和法
2、平方取中法
3、基于字符的項創建哈希函數 如:ord('c') == 99
哈希函數必須是高效的,以便它不會成為存儲和搜索過程的主要部分;如果哈希函數太復雜,則計算槽名稱的程序要比順序查找和二分查找更耗時時,將打破散列的目的。
哈希沖突
當兩個項散列到同一個槽時,我們必須用一個系統的方法將第二項放在散列表中,這個過程稱為沖突解決
1、解決沖突的一種方法是查找散列表,嘗試查找另一個空槽以保存導致沖突的項,一個簡單的方法是從原始哈西值位置開始,然后以順序方式移動槽,直到遇到第一個空槽。我們可能回到第一個槽來查找整個散列表(循環),這種沖突解決的過程被稱為開放尋址,因為他試圖在三列表中找到下一個空槽或地址。通過系統地一次訪問每個槽,我們執行稱為線性探測的開放尋址技術
在沖突之后尋找另一個槽的過程叫重新散列,使用簡單的線性探測,reshape函數是newhashvalue = rehash(oldhashvalue),一般來說reshape(pos) = (pos + skip)%sizeoftable 注意:skip跳過的大小必須使得表中的所有槽最終都被訪問,否則,表的一部分將不被使用,通常建議表大小是素數
2、用于處理沖突問題的替代放大是允許每個槽保持對項的集合(或鏈)的引用
哈希查找代碼實現:
最好的情況下,散列將提供O(1),恒定時間搜索,但是,由于沖突,往往分析比較復雜
總結
以上是生活随笔為你收集整理的Hash查找的基本原理及实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 二分查找的基本原理及实现
- 下一篇: 选择排序的基本原理及实现