前言
八大排序,三大查找是《數據結構》當中非常基礎的知識點,在這里為了復習順帶總結了一下常見的八種排序算法。 常見的八大排序算法,他們之間關系如下:
?
排序算法.png
?
他們的性能比較:
?
?
下面,利用Python分別將他們進行實現。
?
直接插入排序
直接插入排序.gif
?
直接插入排序的核心思想就是:將數組中的所有元素依次跟前面已經排好的元素相比較,如果選擇的元素比已排序的元素小,則交換,直到全部元素都比較過。 因此,從上面的描述中我們可以發現,直接插入排序可以用兩個循環完成:
第一層循環:遍歷待比較的所有數組元素 第二層循環:將本輪選擇的元素(selected)與已經排好序的元素(ordered)相比較。 如果:selected > ordered,那么將二者交換
#直接插入排序
def insert_sort(L):#遍歷數組中的所有元素,其中0號索引元素默認已排序,因此從1開始for x in range(1,len(L)):#將該元素與已排序好的前序數組依次比較,如果該元素小,則交換#range(x-1,-1,-1):從x-1倒序循環到0for i in range(x-1,-1,-1):#判斷:如果符合條件則交換if L[i] > L[i+1]:temp = L[i+1]L[i+1] = L[i]L[i] = temp
希爾排序
希爾排序.png
?
希爾排序的算法思想:將待排序數組按照步長gap進行分組,然后將每組的元素利用直接插入排序的方法進行排序;每次將gap折半減小,循環上述操作;當gap=1時,利用直接插入,完成排序。 同樣的:從上面的描述中我們可以發現:希爾排序的總體實現應該由三個循環完成:
第一層循環:將gap依次折半,對序列進行分組,直到gap=1 第二、三層循環:也即直接插入排序所需要的兩次循環。具體描述見上。
#希爾排序
def insert_shell(L):#初始化gap值,此處利用序列長度的一般為其賦值gap = (int)(len(L)/2)#第一層循環:依次改變gap值對列表進行分組while (gap >= 1):#下面:利用直接插入排序的思想對分組數據進行排序#range(gap,len(L)):從gap開始for x in range(gap,len(L)):#range(x-gap,-1,-gap):從x-gap開始與選定元素開始倒序比較,每個比較元素之間間隔gapfor i in range(x-gap,-1,-gap):#如果該組當中兩個元素滿足交換條件,則進行交換if L[i] > L[i+gap]:temp = L[i+gap]L[i+gap] = L[i]L[i] =temp#while循環條件折半gap = (int)(gap/2)
簡單選擇排序
簡單選擇排序.gif
?
簡單選擇排序的基本思想:比較+交換。
從待排序序列中,找到關鍵字最小的元素; 如果最小元素不是待排序序列的第一個元素,將其和第一個元素互換; 從余下的 N - 1 個元素中,找出關鍵字最小的元素,重復(1)、(2)步,直到排序結束。 因此我們可以發現,簡單選擇排序也是通過兩層循環實現。 第一層循環:依次遍歷序列當中的每一個元素 第二層循環:將遍歷得到的當前元素依次與余下的元素進行比較,符合最小元素的條件,則交換。
# 簡單選擇排序
def select_sort(L):
#依次遍歷序列中的每一個元素for x in range(0,len(L)):
#將當前位置的元素定義此輪循環當中的最小值minimum = L[x]
#將該元素與剩下的元素依次比較尋找最小元素for i in range(x+1,len(L)):if L[i] < minimum:temp = L[i];L[i] = minimum;minimum = temp
#將比較后得到的真正的最小值賦值給當前位置L[x] = minimum
堆排序
堆的概念 堆:本質是一種數組對象。特別重要的一點性質:<b>任意的葉子節點小于(或大于)它所有的父節點</b>。對此,又分為大頂堆和小頂堆,大頂堆要求節點的元素都要大于其孩子,小頂堆要求節點元素都小于其左右孩子,兩者對左右孩子的大小關系不做任何要求。 利用堆排序,就是基于大頂堆或者小頂堆的一種排序方法。下面,我們通過大頂堆來實現。
基本思想: 堆排序可以按照以下步驟來完成:
首先將序列構建稱為大頂堆; (這樣滿足了大頂堆那條性質:位于根節點的元素一定是當前序列的最大值)
?
構建大頂堆.png
取出當前大頂堆的根節點,將其與序列末尾元素進行交換; (此時:序列末尾的元素為已排序的最大值;由于交換了元素,當前位于根節點的堆并不一定滿足大頂堆的性質) 對交換后的n-1個序列元素進行調整,使其滿足大頂堆的性質;
?
Paste_Image.png
重復2.3步驟,直至堆中只有1個元素為止 代碼實現:
#-------------------------堆排序--------------------------------
#**********獲取左右葉子節點**********
def LEFT(i):return 2*i + 1
def RIGHT(i):return 2*i + 2
#********** 調整大頂堆 **********
#L:待調整序列 length: 序列長度 i:需要調整的結點
def adjust_max_heap(L,length,i):
#定義一個int值保存當前序列最大值的下標largest = i
#執行循環操作:兩個任務:1 尋找最大值的下標;2.最大值與父節點交換while (1):
#獲得序列左右葉子節點的下標left,right = LEFT(i),RIGHT(i)
#當左葉子節點的下標小于序列長度 并且 左葉子節點的值大于父節點時,將左葉子節點的下標賦值給largestif (left < length) and (L[left] > L[i]):largest = leftprint('左葉子節點')else:largest = i
#當右葉子節點的下標小于序列長度 并且 右葉子節點的值大于父節點時,將右葉子節點的下標值賦值給largestif (right < length) and (L[right] > L[largest]):largest = rightprint('右葉子節點')
#如果largest不等于i 說明當前的父節點不是最大值,需要交換值if (largest != i):temp = L[i]L[i] = L[largest]L[largest] = tempi = largestprint(largest)continueelse:break
#********** 建立大頂堆 **********
def build_max_heap(L):length = len(L)for x in range((int)((length-1)/2),-1,-1):adjust_max_heap(L,length,x)
#********** 堆排序 **********
def heap_sort(L):
#先建立大頂堆,保證最大值位于根節點;并且父節點的值大于葉子結點build_max_heap(L)
#i:當前堆中序列的長度.初始化為序列的長度i = len(L)
#執行循環:1. 每次取出堆頂元素置于序列的最后(len-1,len-2,len-3...)
# 2. 調整堆,使其繼續滿足大頂堆的性質,注意實時修改堆中序列的長度while (i > 0):temp = L[i-1]L[i-1] = L[0]L[0] = temp
#堆中序列長度減1i = i-1
#調整大頂堆adjust_max_heap(L,i,0)
冒泡排序
基本思想
?
冒泡排序.gif
? 冒泡排序思路比較簡單:
將序列當中的左右元素,依次比較,保證右邊的元素始終大于左邊的元素; ( 第一輪結束后,序列最后一個元素一定是當前序列的最大值;) 對序列當中剩下的n-1個元素再次執行步驟1。 對于長度為n的序列,一共需要執行n-1輪比較 (利用while循環可以減少執行次數)
*代碼實現
#冒泡排序
def bubble_sort(L):length = len(L)
#序列長度為length,需要執行length-1輪交換for x in range(1,length):
#對于每一輪交換,都將序列當中的左右元素進行比較
#每輪交換當中,由于序列最后的元素一定是最大的,因此每輪循環到序列未排序的位置即可for i in range(0,length-x):if L[i] > L[i+1]:temp = L[i]L[i] = L[i+1]L[i+1] = temp
快速排序
算法思想:
快速排序.gif
快速排序的基本思想:挖坑填數+分治法 從序列當中選擇一個基準數(pivot) 在這里我們選擇序列當中第一個數最為基準數 將序列當中的所有數依次遍歷,比基準數大的位于其右側,比基準數小的位于其左側 重復步驟1.2,直到所有子集當中只有一個元素為止。 用偽代碼 描述如下: 1.i =L; j = R; 將基準數挖出形成第一個坑a[i]。 2.j--由后向前找比它小的數,找到后挖出此數填前一個坑a[i]中。 3.i++由前向后找比它大的數,找到后也挖出此數填到前一個坑a[j]中。 4.再重復執行2,3二步,直到i==j,將基準數填入a[i]中 代碼實現:
#快速排序
#L:待排序的序列;start排序的開始index,end序列末尾的index
#對于長度為length的序列:start = 0;end = length-1
def quick_sort(L,start,end):if start < end:i , j , pivot = start , end , L[start]while i < j:
#從右開始向左尋找第一個小于pivot的值while (i < j) and (L[j] >= pivot):j = j-1
#將小于pivot的值移到左邊if (i < j):L[i] = L[j]i = i+1
#從左開始向右尋找第一個大于pivot的值while (i < j) and (L[i] < pivot):i = i+1
#將大于pivot的值移到右邊if (i < j):L[j] = L[i]j = j-1
#循環結束后,說明 i=j,此時左邊的值全都小于pivot,右邊的值全都大于pivot
#pivot的位置移動正確,那么此時只需對左右兩側的序列調用此函數進一步排序即可
#遞歸調用函數:依次對左側序列:從0 ~ i-1//右側序列:從i+1 ~ endL[i] = pivot
#左側序列繼續排序quick_sort(L,start,i-1)
#右側序列繼續排序quick_sort(L,i+1,end)
歸并排序
算法思想:
?
歸并排序.gif
歸并排序是建立在歸并操作上的一種有效的排序算法,該算法是采用分治法 的一個典型的應用。它的基本操作是:將已有的子序列合并,達到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。 歸并排序其實要做兩件事: 分解----將序列每次折半拆分 合并----將劃分后的序列段兩兩排序合并 因此,歸并排序實際上就是兩個操作,拆分+合并 如何合并? L[first...mid]為第一段,L[mid+1...last]為第二段,并且兩端已經有序,現在我們要將兩端合成達到L[first...last]并且也有序。 首先依次從第一段與第二段中取出元素比較,將較小的元素賦值給temp[] 重復執行上一步,當某一段賦值結束,則將另一段剩下的元素賦值給temp[] 此時將temp[]中的元素復制給L[],則得到的L[first...last]有序 如何分解? 在這里,我們采用遞歸的方法,首先將待排序列分成A,B兩組;然后重復對A、B序列 分組;直到分組后組內只有一個元素,此時我們認為組內所有元素有序,則分組結束。 代碼實現
# 歸并排序
#這是合并的函數
# 將序列L[first...mid]與序列L[mid+1...last]進行合并
def mergearray(L,first,mid,last,temp):
#對i,j,k分別進行賦值i,j,k = first,mid+1,0
#當左右兩邊都有數時進行比較,取較小的數while (i <= mid) and (j <= last):if L[i] <= L[j]:temp[k] = L[i]i = i+1k = k+1else:temp[k] = L[j]j = j+1k = k+1
#如果左邊序列還有數while (i <= mid):temp[k] = L[i]i = i+1k = k+1
#如果右邊序列還有數while (j <= last):temp[k] = L[j]j = j+1k = k+1
#將temp當中該段有序元素賦值給L待排序列使之部分有序for x in range(0,k):L[first+x] = temp[x]
# 這是分組的函數
def merge_sort(L,first,last,temp):if first < last:mid = (int)((first + last) / 2)
#使左邊序列有序merge_sort(L,first,mid,temp)
#使右邊序列有序merge_sort(L,mid+1,last,temp)
#將兩個有序序列合并mergearray(L,first,mid,last,temp)
# 歸并排序的函數
def merge_sort_array(L):
#聲明一個長度為len(L)的空列表temp = len(L)*[None]
#調用歸并排序merge_sort(L,0,len(L)-1,temp)
基數排序
算法思想
?
基數排序.gif
基數排序:通過序列中各個元素的值,對排序的N個元素進行若干趟的“分配”與“收集”來實現排序。分配 :我們將L[i]中的元素取出,首先確定其個位上的數字,根據該數字分配到與之序號相同的桶中收集 :當序列中所有的元素都分配到對應的桶中,再按照順序依次將桶中的元素收集形成新的一個待排序列L[ ] 對新形成的序列L[]重復執行分配和收集元素中的十位、百位...直到分配完該序列中的最高位,則排序結束 根據上述“基數排序”的展示,我們可以清楚的看到整個實現的過程 代碼實現
#************************基數排序****************************
#確定排序的次數
#排序的順序跟序列中最大數的位數相關
def radix_sort_nums(L):maxNum = L[0]
#尋找序列中的最大數for x in L:if maxNum < x:maxNum = x
#確定序列中的最大元素的位數times = 0while (maxNum > 0):maxNum = (int)(maxNum/10)times = times+1return times
#找到num從低到高第pos位的數據
def get_num_pos(num,pos):return ((int)(num/(10**(pos-1))))%10
#基數排序
def radix_sort(L):count = 10*[None] #存放各個桶的數據統計個數bucket = len(L)*[None] #暫時存放排序結果
#從低位到高位依次執行循環for pos in range(1,radix_sort_nums(L)+1):#置空各個桶的數據統計for x in range(0,10):count[x] = 0#統計當前該位(個位,十位,百位....)的元素數目for x in range(0,len(L)):#統計各個桶將要裝進去的元素個數j = get_num_pos(int(L[x]),pos)count[j] = count[j]+1#count[i]表示第i個桶的右邊界索引for x in range(1,10):count[x] = count[x] + count[x-1]#將數據依次裝入桶中for x in range(len(L)-1,-1,-1):#求出元素第K位的數字j = get_num_pos(L[x],pos)#放入對應的桶中,count[j]-1是第j個桶的右邊界索引bucket[count[j]-1] = L[x]#對應桶的裝入數據索引-1count[j] = count[j]-1# 將已分配好的桶中數據再倒出來,此時已是對應當前位數有序的表for x in range(0,len(L)):L[x] = bucket[x]
后記
寫完之后運行了一下時間比較:
直接插入排序:11.615608
希爾排序:13.012008
簡單選擇排序:3.645136000000001
堆排序:0.09587900000000005
冒泡排序:6.687218999999999
#****************************************************
快速排序:9.999999974752427e-07
#快速排序有誤:實際上并未執行
#RecursionError: maximum recursion depth exceeded in comparison
#****************************************************
歸并排序:0.05638299999999674
基數排序:0.08150400000000246
直接插入排序:1233.581131
希爾排序:1409.8012320000003
簡單選擇排序:466.66974500000015
堆排序:1.2036720000000969
冒泡排序:751.274449
#****************************************************
快速排序:1.0000003385357559e-06
#快速排序有誤:實際上并未執行
#RecursionError: maximum recursion depth exceeded in comparison
#****************************************************
歸并排序:0.8262230000000272
基數排序:1.1162899999999354
從運行結果上來看,堆排序、歸并排序、基數排序真的快。 對于快速排序迭代深度超過的問題,可以將考慮將快排通過非遞歸的方式進行實現。
參考資料
數據結構可視化:visualgo 希爾排序介紹:希爾排序 堆排序:《算法導論》讀書筆記之第6章 堆排序 博客園:靜默虛空 博客:vincent-cws
總結
以上是生活随笔 為你收集整理的Python数据结构常见的八大排序算法(详细整理) 的全部內容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔 網站內容還不錯,歡迎將生活随笔 推薦給好友。