當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图

發布時間：2024/9/30 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?Hash Join只能用于相等連接，且只能在CBO優化器模式下。相對于nested loop join，hash join更適合處理大型結果集
? ? ? ?Hash Join的執行計劃第1個是hash表(build table)，第2個探查表(probe table)，一般不叫內外表，nested loop才有內外表
? ? ? ?Hash表也就是所謂的內表，探查表所謂的外表
? ? ? ?兩者的執行計劃形如：
? ? ? ?nested loop
? ? ? ? ? ?outer table ? ? ? ? ? ? --驅動表
? ? ? ? ? ?inner table
? ? ? ?
? ? ? ?hash join
? ? ? ? ? build table ? ? ? ? ? ? ?(inner table) --驅動表

? ? ? ? ? probe table ? ? ? ? ? ? (outer ?table)?

? ? ? ?先看一張圖片，大致了解Hash Join的過程：

? ? ??

? ? ? ?下面詳細了解一下Hash Join

? ? ? ?㈠ Hash join概念
? ? ? ? ??
? ? ? ? ??Hash join算法的一個基本思想就是根據小的row sources(稱作build input 也就是前文提到的build table，我們記較小的表為S，較大的表為B)
? ? ? ? ? 建立一個可以存在于hash area內存中的hash table
? ? ? ? ? 然后用大的row sources(稱作probe input，也就是前文提到的probe table) 來探測前面所建的hash table
? ? ? ? ? 如果hash area內存不夠大，hash table就無法完全存放在hash area內存中
? ? ? ? ? 針對這種情況，Oracle在連接鍵利用一個hash函數將build input和probe input分割成多個不相連的分區
? ? ? ? ? 分別記作Si和Bi，這個階段叫做分區階段；然后各自相應的分區，即Si和Bi再做Hash join，這個階段叫做join階段?
? ? ? ? ? 如果HASH表太大，無法一次構造在內存中，則分成若干個partition，寫入磁盤的temporary segment，則會多一個寫的代價，會降低效率
? ? ? ? ? 至于小表的概念，對于 hash join 來說，能容納在 pga 中的 hash table 都可以叫小表，通常比如：
? ? ? ? ? pga_aggregate_target ? ? ? ? ? ? ? ? big integer ? ?1073741824
? ? ? ? ? hash ?area size 大體能使用到40多 M ，這樣的話通常可能容納幾十萬的記錄
? ? ? ? ? hash area size缺省是2*sort_area_size,我們可以直接修改SORT_AREA_SIZE 的大小，HASH_AREA_SIZE也會跟著改變的
? ? ? ? ? 如果你的workarea_size_policy=auto，那么我們只需設定pga_aggregate_target
? ? ? ? ? 但請記住，這是一個session級別的參數，有時，我們更傾向于把hash_area_size的大小設成驅動表的1.6倍左右
? ? ? ? ? 驅動表僅僅用于nested loop join 和 hash join，但Hash join不需要在驅動表上存在索引，而nested loop join則迫切需求
? ? ? ? ? 一兩百萬記錄的表 join上 ?千萬記錄的表，hash join的通常表現非常好
? ? ? ? ? 不過，多與少，大與小，很多時候很難量化，具體情況還得具體分析
? ? ? ? ? 如果在分區后，針對某個分區所建的hash table還是太大的話，oracle就采用nested loop hash join
? ? ? ? ? 所謂的nested-loops hash join就是對部分Si建立hash table，然后讀取所有的Bi與所建的hash table做連接
? ? ? ? ? 然后再對剩余的Si建立hash table，再將所有的Bi與所建的hash table做連接，直至所有的Si都連接完了
? ? ? ?
? ? ???㈡ Hash Join原理
? ? ? ?
? ? ? ? ??考慮以下兩個數據集：
? ? ? ? ? S={1,1,1,3,3,4,4,4,4,5,8,8,8,8,10}
? ? ? ? ? B={0,0,1,1,1,1,2,2,2,2,2,2,3,8,9,9,9,10,10,11}
? ? ? ? ? Hash Join的第一步就是判定小表（即build input）是否能完全存放在hash area內存中
? ? ? ? ? 如果能完全存放在內存中，則在內存中建立hash table，這是最簡單的hash join
? ? ? ? ? 如果不能全部存放在內存中，則build input必須分區。分區的個數叫做fan-out
? ? ? ? ? Fan-out是由hash_area_size和cluster size來決定的。其中cluster size等于db_block_size * _hash_multiblock_io_count
? ? ? ? ? hash_multiblock_io_count是個隱藏參數,在9.0.1以后就不再使用了

[sql]?view plaincopyprint?

sys@ORCL>?ed??

Wrote?file?afiedt.buf??

??1??select?a.ksppinm?name,b.ksppstvl?value,a.ksppdesc?description??

??2??from?x$ksppi?a,x$ksppcv?b??

??3??where?a.indx?=?b.indx??

??4*?and?a.ksppinm?like?'%hash_multiblock_io_count%'??

sys@ORCL>?/??

NAME???????????????????????????VALUE?DESCRIPTION??

------------------------------?-----?------------------------------------------------------------??

_hash_multiblock_io_count??????0?????number?of?blocks?hash?join?will?read/write?at?once??

? ? ? ? ? Oracle采用內部一個hash函數作用于連接鍵上，將S和B分割成多個分區
? ? ? ? ? 在這里我們假設這個hash函數為求余函數，即Mod(join_column_value,10)
? ? ? ? ? 這樣產生十個分區，如下表:

? ? ? ? ??

? ? ? ? ? 經過這樣的分區之后，只需要相應的分區之間做join即可（也就是所謂的partition pairs）?
? ? ? ? ? 如果有一個分區為NULL的話，則相應的分區join即可忽略
? ? ? ? ? 在將S表讀入內存分區時，oracle即記錄連接鍵的唯一值，構建成所謂的位圖向量
? ? ? ? ? 它需要占hash area內存的5%左右。在這里即為{1,3,4,5,8,10}
? ? ? ? ? 當對B表進行分區時，將每一個連接鍵上的值與位圖向量相比較，如果不在其中，則將其記錄丟棄
? ? ? ? ? 在我們這個例子中，B表中以下數據將被丟棄{0,0,2,2,2,2,2,2,9,9,9,9,9}
? ? ? ? ? 這個過程就是位圖向量過濾
? ? ? ? ? 當S1,B1做完連接后，接著對Si,Bi進行連接
? ? ? ? ? 這里oracle將比較兩個分區，選取小的那個做build input，就是動態角色互換
? ? ? ? ? 這個動態角色互換發生在除第一對分區以外的分區上面

? ? ???㈢ Hash Join算法
? ? ? ?
? ? ? ? ??第1步：判定小表是否能夠全部存放在hash area內存中，如果可以，則做內存hash join。如果不行，轉第二步
? ? ? ? ? 第2步：決定fan-out數
? ? ? ? ? ? ? ? ? ? ? ?(Number of Partitions) * C<= Favm *M
? ? ? ? ? ? ? ? ? ? ? 其中C為Cluster size，其值為DB_BLOCK_SIZE*HASH_MULTIBLOCK_IO_COUNT
? ? ? ? ? ? ? ? ? ? ? Favm為hash area內存可以使用的百分比，一般為0.8左右
? ? ? ? ? ? ? ? ? ? ? M為Hash_area_size的大小
? ? ? ? ? 第3步：讀取部分小表S，采用內部hash函數(這里稱為hash_fun_1)
? ? ? ? ? ? ? ? ? ? ? ?將連接鍵值映射至某個分區，同時采用hash_fun_2函數對連接鍵值產生另外一個hash值
? ? ? ? ? ? ? ? ? ? ? ?這個hash值用于創建hash table用，并且與連接鍵值存放在一起
? ? ? ? ? 第4步：對build input建立位圖向量
? ? ? ? ? 第5步：如果內存中沒有空間了，則將分區寫至磁盤上
? ? ? ? ? 第6步：讀取小表S的剩余部分，重復第三步，直至小表S全部讀完
? ? ? ? ? 第7步：將分區按大小排序，選取幾個分區建立hash table(這里選取分區的原則是使選取的數量最多)
? ? ? ? ? 第8步：根據前面用hash_fun_2函數計算好的hash值，建立hash table
? ? ? ? ? 第9步：讀取表B，采用位圖向量進行位圖向量過濾
? ? ? ? ? 第10步：對通過過濾的數據采用hash_fun_1函數將數據映射到相應的分區中去，并計算hash_fun_2的hash值
? ? ? ? ? 第11步：如果所落的分區在內存中，則將前面通過hash_fun_2函數計算所得的hash值與內存中已存在的hash table做連接
? ? ? ? ? ? ? ? ? ? ? ? ?將結果寫致磁盤上。如果所落的分區不在內存中，則將相應的值與表S相應的分區放在一起
? ? ? ? ? 第12步：繼續讀取表B，重復第9步，直至表B讀取完畢 ?
? ? ? ? ? 第13步：讀取相應的(Si,Bi)做hash連接。在這里會發生動態角色互換
? ? ? ? ? 第14步：如果分區過后，最小的分區也比內存大，則發生nested-loop hash join ??

? ? ?
? ? ???㈣ Hash Join的成本
? ? ? ?
? ? ? ? ? ⑴ In-Memory Hash Join
? ? ? ? ? ? ? Cost(HJ)=Read(S)+ build hash table in memory(CPU)+Read(B) + Perform In memory Join(CPU)
? ? ? ? ? ? ? 忽略cpu的時間，則：
? ? ? ? ? ? ? Cost(HJ)=Read(S)+Read(B)
? ? ? ? ? ? ?
? ? ? ? ? ⑵ On-Disk Hash Join
? ? ? ? ? ? ? 根據上述的步驟描述，我們可以看出：
? ? ? ? ? ? ? Cost(HJ)=Cost(HJ1)+Cost(HJ2)?
? ? ? ? ? ? ? 其中Cost(HJ1)的成本就是掃描S,B表，并將無法放在內存上的部分寫回磁盤，對應前面第2步至第12步
? ? ? ? ? ? ? ? ? ? ?Cost(HJ2)即為做nested-loop hash join的成本，對應前面的第13步至第14步
? ? ? ? ? ? ? 其中Cost(HJ1)近似等于Read(S)+Read(B)+Write((S-M)+(B-B*M/S))
? ? ? ? ? ? ? 因為在做nested-loop hash join時，對每一chunk的build input，都需要讀取整個probe input，因此
? ? ? ? ? ? ? Cost(HJ2)近似等于Read((S-M)+n*(B-B*M/S))，其中n是nested-loop hash join需要循環的次數：n=(S/F)/M
? ? ? ? ? ? ? 一般情況下，如果n大于10的話，hash join的性能將大大下降
? ? ? ? ? ? ? 從n的計算公式可以看出，n與Fan-out成反比例，提高fan-out，可以降低n
? ? ? ? ? ? ? 當hash_area_size是固定時，可以降低cluster size來提高fan-out
? ? ? ? ? ? ? 從這里我們可以看出，提高hash_multiblock_io_count參數的值并不一定提高hash join的性能

? ? ? ? ? ? ?
? ? ? ?㈤ Hash Join的過程
? ? ? ?
? ? ? ? ??一次完整的hash join如下：
? ? ? ? ??1 ?計算小表的分區（bucket）數--Hash分桶
? ? ? ? ? ? ? 決定hash join的一個重要因素是小表的分區（bucket）數
? ? ? ? ? ? ? 這個數字由hash_area_size、hash_multiblock_io_count和db_block_size參數共同決定
? ? ? ? ? ? ? Oracle會保留hash area的20%來存儲分區的頭信息、hash位圖信息和hash表
? ? ? ? ? ? ? 因此，這個數字的計算公式是：
? ? ? ? ? ? ? Bucket數=0.8*hash_area_size/(hash_multiblock_io_count*db_block_size)
? ? ? ? ? ? ?
? ? ? ? ??2 ?Hash計算
? ? ? ? ? ? ? 讀取小表數據（簡稱為R），并對每一條數據根據hash算法進行計算
? ? ? ? ? ? ? Oracle采用兩種hash算法進行計算，計算出能達到最快速度的hash值（第一hash值和第二hash值）
? ? ? ? ? ? ? 而關于這些分區的全部hash值（第一hash值）就成為hash表
? ? ? ? ? ? ?
? ? ? ? ??3 ?存放數據到hash內存中
? ? ? ? ? ? ? 將經過hash算法計算的數據，根據各個bucket的hash值（第一hash值）分別放入相應的bucket中
? ? ? ? ? ? ? 第二hash值就存放在各條記錄中
? ? ? ? ? ? ?
? ? ? ? ??4 ?創建hash位圖
? ? ? ? ? ? ? 與此同時，也創建了一個關于這兩個hash值映射關系的hash位圖
? ? ? ? ? ? ?
? ? ? ? ??5 ?超出內存大小部分被移到磁盤
? ? ? ? ? ? ? 如果hash area被占滿，那最大一個分區就會被寫到磁盤（臨時表空間）上去
? ? ? ? ? ? ? 任何需要寫入到磁盤分區上的記錄都會導致磁盤分區被更新
? ? ? ? ? ? ? 這樣的話，就會嚴重影響性能，因此一定要盡量避免這種情況
? ? ? ? ? ? ? 2-5一直持續到整個表的數據讀取完畢
? ? ? ? ? ? ?
? ? ? ? ??6 ?對分區排序
? ? ? ? ? ? ?為了能充分利用內存，盡量存儲更多的分區，Oracle會按照各個分區的大小將他們在內存中排序
? ? ? ? ? ? ??
? ? ? ? ??7 ?讀取大表數據，進行hash匹配
? ? ? ? ? ? ? 接下來就開始讀取大表（簡稱S）中的數據
? ? ? ? ? ? ? 按順序每讀取一條記錄，計算它的hash值，并檢查是否與內存中的分區的hash值一致
? ? ? ? ? ? ? 如果是，返回join數據
? ? ? ? ? ? ? 如果內存中的分區沒有符合的，就將S中的數據寫入到一個新的分區中，這個分區也采用與計算R一樣的算法計算出hash值
? ? ? ? ? ? ? 也就是說這些S中的數據產生的新的分區數應該和R的分區集的分區數一樣。這些新的分區被存儲在磁盤（臨時表空間）上
? ? ? ? ? ? ?
? ? ? ? ??8 ?完全大表全部數據的讀取
? ? ? ? ? ? ? 一直按照7進行，直到大表中的所有數據的讀取完畢
? ? ? ? ? ? ?
? ? ? ? ??9 ?處理沒有join的數據
? ? ? ? ? ? ? 這個時候就產生了一大堆join好的數據和從R和S中計算存儲在磁盤上的分區
? ? ? ? ? ? ?
? ? ? ? ??10 ?二次hash計算
? ? ? ? ? ? ? ? 從R和S的分區集中抽取出最小的一個分區，使用第二種hash函數計算出并在內存中創建hash表
? ? ? ? ? ? ? ? 采用第二種hash函數的原因是為了使數據分布性更好
? ? ? ? ? ? ??
? ? ? ? ??11 ?二次hash匹配
? ? ? ? ? ? ? ? 在從另一個數據源（與hash在內存的那個分區所屬數據源不同的）中讀取分區數據，與內存中的新hash表進行匹配。返回join數據
? ? ? ? ??
? ? ? ? ??12 ?完成全部hash join
? ? ? ? ? ? ? 繼續按照9-11處理剩余分區，直到全部處理完畢

? ? ?
? ? ???㈥ Hash Join的模式
? ? ? ? ??Oracle中，Hash Join也有三種模式：optimal，one-pass，multi-pass
? ? ? ? ??⑴ optimal

? ? ? ? ? ? ? ?當驅動結果集生成的hash表全部可以放入PGA的hash area時，稱為optimal，大致過程如下：
? ? ? ? ? ? ?① 先根據驅動表，得到驅動結果集
? ? ? ? ? ? ?② 在hash area生成hash bulket，并將若干bulket分成一組，成為一個partition，還會生成一個bitmap的列表，每個bulket在上面占一位
? ? ? ? ? ? ?③ 對結果集的join鍵做hash運算，將數據分散到相應partition的bulket中
? ? ? ? ? ? ? ? ? 當運算完成后，如果鍵值唯一性較高的話，bulket里的數據會比較均勻，也有可能有的桶里面數據會是空的
? ? ? ? ? ? ? ? ? 這樣bitmap上對應的標志位就是0，有數據的桶，標志位會是1 ? ? ?
? ? ? ? ? ? ?④ 開始掃描第二張表，對jion鍵做hash運算，確定應該到某個partition的某個bulket去探測
? ? ? ? ? ? ? ? ? 探測之前，會看這個bulket的bitmap是否會1，如果為0，表示沒數據，這行就直接丟棄掉
? ? ? ? ? ? ?⑤ 如果bitmap為1，則在桶內做精確匹配，判斷OK后，返回數據
? ? ? ? ? ? ? ? ? 這個是最優的hash join，他的成本基本是兩張表的full table scan，在加微量的hash運算
? ? ? ? ? ? ? ? ? 博客開篇的那幅圖描述的也就是這種情況

? ? ? ? ??⑵ one-pass
? ? ? ? ? ? ? 如果進程的pga很小，或者驅動表結果集很大，超過了hash area的大小，會怎么辦？
? ? ? ? ? ? ? 當然會用到臨時表空間，此時oracle的處理方式稍微復雜點需奧注意上面提到的有個partition的概念
? ? ? ? ? ? ? 可以這么理解，數據是經過兩次hash運算的，先確定你的partition，再確定你的bulket
? ? ? ? ? ? ? 假設hash area小于整個hash table，但至少大于一個partition的size，這個時候走的就是one-pass
? ? ? ? ? ? ? 當我們生成好hash表后，狀況是部分partition留在內存中，其他的partition留在磁盤臨時表空間中
? ? ? ? ? ? ? 當然也有可能某個partition一半在內存，一半在磁盤，剩下的步驟大致如下：
? ? ? ? ? ? ?① 掃描第二張表，對join鍵做hash運算，確定好對應的partition和bulket
? ? ? ? ? ? ?② 查看bitmap，確定bulket是否有數據，沒有則直接丟棄
? ? ? ? ? ? ?③ 如果有數據，并且這個partition是在內存中的，就進入對應的桶去精確匹配，能匹配上，就返回這行數據，否則丟棄
? ? ? ? ? ? ?④ 如果partition是在磁盤上的，則將這行數據放入磁盤中暫存起來，保存的形式也是partition，bulket的方式
? ? ? ? ? ? ?⑤ 當第二張表被掃描完后，剩下的是驅動表和探測表生成的一大堆partition，保留在磁盤上
? ? ? ? ? ? ?⑥ 由于兩邊的數據都按照相同的hash算法做了partition和bulket，現在只要成對的比較兩邊partition數據即可
? ? ? ? ? ? ? ? ?并且在比較的時候，oracle也做了優化處理，沒有嚴格的驅動與被驅動關系
? ? ? ? ? ? ? ? ?他會在partition對中選較小的一個作為驅動來進行，直到磁盤上所有的partition對都join完
? ? ? ? ? ? ?可以發現，相比optimal，他多出的成本是對于無法放入內存的partition，重新讀取了一次，所以稱為one-pass
? ? ? ? ? ? ?只要你的內存保證能裝下一個partition，oracle都會騰挪空間，每個磁盤partition做到one-pass
? ? ? ? ? ? ?
? ? ? ? ??⑶ multi-pass
? ? ? ? ? ? ? 這是最復雜，最糟糕的hash join
? ? ? ? ? ? ? 此時hash area小到連一個partition也容納不下，當掃描好驅動表后
? ? ? ? ? ? ? 可能只有半個partition留在hash area中，另半個加其他的partition全在磁盤上
? ? ? ? ? ? ? 剩下的步驟和one-pass比價類似，不同的是針對partition的處理
? ? ? ? ? ? ? 由于驅動表只有半個partition在內存中，探測表對應的partition數據做探測時
? ? ? ? ? ? ? 如果匹配不上，這行還不能直接丟棄，需要繼續保留到磁盤，和驅動表剩下的半個partition再做join
? ? ? ? ? ? ? 這里舉例的是內存可以裝下半個partition，如果裝的更少的話，反復join的次數將更多
? ? ? ? ? ? ? 當發生multi-pass時，partition物理讀的次數會顯著增加

? ? ? ? ? ? ?
? ? ? ?㈦ Hash Join的位圖
? ? ? ? ? ?這個位圖包含了每個hash分區是否有有值的信息。它記錄了有數據的分區的hash值
? ? ? ? ? ?這個位圖的最大作用就是，如果probe input中的數據沒有與內存中的hash表匹配上
? ? ? ? ? ?先查看這個位圖，以決定是否將沒有匹配的數據寫入磁盤
? ? ? ? ? ?那些不可能匹配到的數據（即位圖上對應的分區沒有數據）就不再寫入磁盤
? ? ? ? ??
? ? ? ?㈧小結
? ? ? ? ? ① 確認小表是驅動表
? ? ? ? ? ② 確認涉及到的表和連接鍵分析過了
? ? ? ? ? ③ 如果在連接鍵上數據不均勻的話，建議做柱狀圖
? ? ? ? ? ④ 如果可以，調大hash_area_size的大小或pga_aggregate_target的值
? ? ? ? ? ⑤ Hash Join適合于小表與大表連接、返回大型結果集的連接.

轉自：http://blog.csdn.net/dba_waterbin/article/details/8554550

總結

以上是生活随笔為你收集整理的深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图

總結