STL sort()函数详解
西方有句諺語:不要重復發明輪子!
STL幾乎封裝了所有的數據結構中的算法,從鏈表到隊列,從向量到堆棧,對hash到二叉樹,從搜索到排序,從增加到刪除......可以說,如果你理解了STL,你會發現你已不用拘泥于算法本身,從而站在巨人的肩膀上去考慮更高級的應用。
排序是最廣泛的算法之一,本文詳細介紹了STL中不同排序算法的用法和區別。
1 STL提供的Sort 算法
C++之所以得到這么多人的喜歡,是因為它既具有面向對象的概念,又保持了C語言高效的特點。STL 排序算法同樣需要保持高效。因此,對于不同的需求,STL提供的不同的函數,不同的函數,實現的算法又不盡相同
。1.1 所有sort算法介紹
所有的sort算法的參數都需要輸入一個范圍,[begin, end)。這里使用的迭代器(iterator)都需是隨機迭代器(RadomAccessIterator), 也就是說可以隨機訪問的迭代器,如:it+n什么的。(partition 和stable_partition 除外)如果你需要自己定義比較函數,你可以把你定義好的仿函數(functor)作為參數傳入。每種算法都支持傳入比較函數。以下是所有STL sort算法函數的名字列表:
| sort | 對給定區間所有元素進行排序 |
| stable_sort | 對給定區間所有元素進行穩定排序 |
| partial_sort | 對給定區間所有元素部分排序 |
| partial_sort_copy | 對給定區間復制并排序 |
| nth_element | 找出給定區間的某個位置對應的元素 |
| is_sorted | 判斷一個區間是否已經排好序 |
| partition | 使得符合某個條件的元素放在前面 |
| stable_partition | 相對穩定的使得符合某個條件的元素放在前面 |
1.2 sort 中的比較函數
當你需要按照某種特定方式進行排序時,你需要給sort指定比較函數,否則程序會自動提供給你一個比較函數。 vector < int > vect; //... sort(vect.begin(), vect.end()); //此時相當于調用 sort(vect.begin(), vect.end(), less<int>() ); 上述例子中系統自己為sort提供了less仿函數。在STL中還提供了其他仿函數,以下是仿函數列表:| equal_to | 相等 |
| not_equal_to | 不相等 |
| less | 小于 |
| greater | 大于 |
| less_equal | 小于等于 |
| greater_equal | 大于等于 |
1.3 sort 的穩定性
你發現有sort和stable_sort,還有 partition 和stable_partition, 感到奇怪吧。其中的區別是,帶有stable的函數可保證相等元素的原本相對次序在排序后保持不變。或許你會問,既然相等,你還管他相對位置呢,也分不清楚誰是誰了?這里需要弄清楚一個問題,這里的相等,是指你提供的函數表示兩個元素相等,并不一定是一摸一樣的元素。例如,如果你寫一個比較函數:
bool less_len(const string &str1, const string &str2) {return str1.length() < str2.length(); } 此時,"apple" 和 "winter" 就是相等的,如果在"apple" 出現在"winter"前面,用帶stable的函數排序后,他們的次序一定不變,如果你使用的是不帶"stable"的函數排序,那么排序完后,"Winter"有可能在"apple"的前面。
1.4 全排序
全排序即把所給定范圍所有的元素按照大小關系順序排列。用于全排序的函數有template <class RandomAccessIterator> void sort(RandomAccessIterator first, RandomAccessIterator last);template <class RandomAccessIterator, class StrictWeakOrdering> void sort(RandomAccessIterator first, RandomAccessIterator last, StrictWeakOrdering comp);template <class RandomAccessIterator> void stable_sort(RandomAccessIterator first, RandomAccessIterator last);template <class RandomAccessIterator, class StrictWeakOrdering> void stable_sort(RandomAccessIterator first, RandomAccessIterator last, StrictWeakOrdering comp); 在第1,3種形式中,sort 和 stable_sort都沒有指定比較函數,系統會默認使用operator< 對區間[first,last)內的所有元素進行排序, 因此,如果你使用的類型義軍已經重載了operator<函數,那么你可以省心了。第2, 4種形式,你可以隨意指定比較函數,應用更為靈活一些。來看看實際應用:
班上有10個學生,我想知道他們的成績排名。
#include <iostream> #include <algorithm> #include <functional> #include <vector> #include <string> using namespace std;class student{public:student(const string &a, int b):name(a), score(b){}string name;int score;bool operator < (const student &m)const {return score< m.score;} };int main() {vector< student> vect;student st1("Tom", 74);vect.push_back(st1);st1.name="Jimy";st1.score=56;vect.push_back(st1);st1.name="Mary";st1.score=92;vect.push_back(st1);st1.name="Jessy";st1.score=85;vect.push_back(st1);st1.name="Jone";st1.score=56;vect.push_back(st1);st1.name="Bush";st1.score=52;vect.push_back(st1);st1.name="Winter";st1.score=77;vect.push_back(st1);st1.name="Andyer";st1.score=63;vect.push_back(st1);st1.name="Lily";st1.score=76;vect.push_back(st1);st1.name="Maryia";st1.score=89;vect.push_back(st1);cout<<"------before sort..."<<endl;for(int i = 0 ; i < vect.size(); i ++) cout<<vect[i].name<<":\t"<<vect[i].score<<endl;stable_sort(vect.begin(), vect.end(),less<student>());cout <<"-----after sort ...."<<endl;for(int i = 0 ; i < vect.size(); i ++) cout<<vect[i].name<<":\t"<<vect[i].score<<endl;return 0 ; } 其輸出是: ------before sort... Tom: 74 Jimy: 56 Mary: 92 Jessy: 85 Jone: 56 Bush: 52 Winter: 77 Andyer: 63 Lily: 76 Maryia: 89 -----after sort .... Bush: 52 Jimy: 56 Jone: 56 Andyer: 63 Tom: 74 Lily: 76 Winter: 77 Jessy: 85 Maryia: 89 Mary: 92 sort采用的是成熟的"快速排序算法"(目前大部分STL版本已經不是采用簡單的快速排序,而是結合內插排序算法)。 注1 ,可以保證很好的平均性能、復雜度為n*log(n),由于單純的快速排序在理論上有最差的情況,性能很低,其算法復雜度為n*n,但目前大部分的STL版本都已經在這方面做了優化,因此你可以放心使用。stable_sort采用的是"歸并排序",分派足夠內存是,其算法復雜度為n*log(n), 否則其復雜度為n*log(n)*log(n),其優點是會保持相等元素之間的相對位置在排序前后保持一致。1.5 局部排序
局部排序其實是為了減少不必要的操作而提供的排序方式。其函數原型為: template <class RandomAccessIterator> void partial_sort(RandomAccessIterator first, RandomAccessIterator middle, RandomAccessIterator last);template <class RandomAccessIterator, class StrictWeakOrdering> void partial_sort(RandomAccessIterator first, RandomAccessIterator middle, RandomAccessIterator last, StrictWeakOrdering comp);template <class InputIterator, class RandomAccessIterator> RandomAccessIterator partial_sort_copy(InputIterator first, InputIterator last, RandomAccessIterator result_first, RandomAccessIterator result_last);template <class InputIterator, class RandomAccessIterator, class StrictWeakOrdering> RandomAccessIterator partial_sort_copy(InputIterator first, InputIterator last, RandomAccessIterator result_first, RandomAccessIterator result_last, Compare comp); 理解了sort 和stable_sort后,再來理解partial_sort 就比較容易了。先看看其用途: 班上有10個學生,我想知道分數最低的5名是哪些人。如果沒有partial_sort,你就需要用sort把所有人排好序,然后再取前5個。現在你只需要對分數最低5名排序,把上面的程序做如下修改: stable_sort(vect.begin(), vect.end(),less<student>()); 替換為: partial_sort(vect.begin(), vect.begin()+5, vect.end(),less<student>()); 輸出結果為: ------before sort... Tom: 74 Jimy: 56 Mary: 92 Jessy: 85 Jone: 56 Bush: 52 Winter: 77 Andyer: 63 Lily: 76 Maryia: 89 -----after sort .... Bush: 52 Jimy: 56 Jone: 56 Andyer: 63 Tom: 74 Mary: 92 Jessy: 85 Winter: 77 Lily: 76 Maryia: 89 這樣的好處知道了嗎?當數據量小的時候可能看不出優勢,如果是100萬學生,我想找分數最少的5個人......partial_sort采用的堆排序(heapsort),它在任何情況下的復雜度都是n*log(n). 如果你希望用partial_sort來實現全排序,你只要讓middle=last就可以了。
partial_sort_copy其實是copy和partial_sort的組合。被排序(被復制)的數量是[first, last)和[result_first, result_last)中區間較小的那個。如果[result_first, result_last)區間大于[first, last)區間,那么partial_sort相當于copy和sort的組合。
1.6 nth_element 指定元素排序
nth_element一個容易看懂但解釋比較麻煩的排序。用例子說會更方便:班上有10個學生,我想知道分數排在倒數第4名的學生。
如果要滿足上述需求,可以用sort排好序,然后取第4位(因為是由小到大排), 更聰明的朋友會用partial_sort, 只排前4位,然后得到第4位。其實這是你還是浪費,因為前兩位你根本沒有必要排序,此時,你就需要nth_element: template <class RandomAccessIterator> void nth_element(RandomAccessIterator first, RandomAccessIterator nth, RandomAccessIterator last);template <class RandomAccessIterator, class StrictWeakOrdering> void nth_element(RandomAccessIterator first, RandomAccessIterator nth, RandomAccessIterator last, StrictWeakOrdering comp); 對于上述實例需求,你只需要按下面要求修改1.4中的程序: stable_sort(vect.begin(), vect.end(),less<student>()); 替換為: nth_element(vect.begin(), vect.begin()+3, vect.end(),less<student>()); 運行結果為: ------before sort... Tom: 74 Jimy: 56 Mary: 92 Jessy: 85 Jone: 56 Bush: 52 Winter: 77 Andyer: 63 Lily: 76 Maryia: 89 -----after sort .... Jone: 56 Bush: 52 Jimy: 56 Andyer: 63 Jessy: 85 Mary: 92 Winter: 77 Tom: 74 Lily: 76 Maryia: 89 第四個是誰?Andyer,這個倒霉的家伙。為什么是begin()+3而不是+4? 我開始寫這篇文章的時候也沒有在意,后來在 ilovevc ?的提醒下,發現了這個問題。begin()是第一個,begin()+1是第二個,... begin()+3當然就是第四個了。
1.7 partition 和stable_partition
好像這兩個函數并不是用來排序的,'分類'算法,會更加貼切一些。partition就是把一個區間中的元素按照某個條件分成兩類。其函數原型為: template <class ForwardIterator, class Predicate> ForwardIterator partition(ForwardIterator first, ForwardIterator last, Predicate pred) template <class ForwardIterator, class Predicate> ForwardIterator stable_partition(ForwardIterator first, ForwardIterator last, Predicate pred); 看看應用吧:班上10個學生,計算所有沒有及格(低于60分)的學生。你只需要按照下面格式替換1.4中的程序: stable_sort(vect.begin(), vect.end(),less<student>()); 替換為: student exam("pass", 60); stable_partition(vect.begin(), vect.end(), bind2nd(less<student>(), exam)); 其輸出結果為: ------before sort... Tom: 74 Jimy: 56 Mary: 92 Jessy: 85 Jone: 56 Bush: 52 Winter: 77 Andyer: 63 Lily: 76 Maryia: 89 -----after sort .... Jimy: 56 Jone: 56 Bush: 52 Tom: 74 Mary: 92 Jessy: 85 Winter: 77 Andyer: 63 Lily: 76 Maryia: 89 看見了嗎,Jimy,Jone, Bush(難怪說美國總統比較笨? ?)都沒有及格。而且使用的是stable_partition, 元素之間的相對次序是沒有變.2 Sort 和容器
STL中標準容器主要vector, list, deque, string, set, multiset, map, multimay, 其中set, multiset, map, multimap都是以樹結構的方式存儲其元素詳細內容請參看: 學習STL map, STL set之數據結構基礎 . 因此在這些容器中,元素一直是有序的。
這些容器的迭代器類型并不是隨機型迭代器,因此,上述的那些排序函數,對于這些容器是不可用的。上述sort函數對于下列容器是可用的:
- vector
- string
- deque
對于list容器,list自帶一個sort成員函數list::sort(). 它和算法函數中的sort差不多,但是list::sort是基于指針的方式排序,也就是說,所有的數據移動和比較都是此用指針的方式實現,因此排序后的迭代器一直保持有效(vector中sort后的迭代器會失效).
3 選擇合適的排序函數
為什么要選擇合適的排序函數?可能你并不關心效率(這里的效率指的是程序運行時間), 或者說你的數據量很小, 因此你覺得隨便用哪個函數都無關緊要。
其實不然,即使你不關心效率,如果你選擇合適的排序函數,你會讓你的代碼更容易讓人明白,你會讓你的代碼更有擴充性,逐漸養成一個良好的習慣,很重要吧??。
如果你以前有用過C語言中的qsort, 想知道qsort和他們的比較,那我告訴你,qsort和sort是一樣的,因為他們采用的都是快速排序。從效率上看,以下幾種sort算法的是一個排序,效率由高到低(耗時由小變大):
- 若需對vector, string, deque, 或 array容器進行全排序,你可選擇sort或stable_sort;
- 若只需對vector, string, deque, 或 array容器中取得top n的元素,部分排序partial_sort是首選.
- 若對于vector, string, deque, 或array容器,你需要找到第n個位置的元素或者你需要得到top n且不關系top n中的內部順序,nth_element是最理想的;
- 若你需要從標準序列容器或者array中把滿足某個條件或者不滿足某個條件的元素分開,你最好使用partition或stable_partition;
- 若使用的list容器,你可以直接使用partition和stable_partition算法,你可以使用list::sort代替sort和stable_sort排序。若你需要得到partial_sort或nth_element的排序效果,你必須間接使用。正如上面介紹的有幾種方式可以選擇。
4 小結
討論技術就像個無底洞,經常容易由一點可以引申另外無數個技術點。因此需要從全局的角度來觀察問題,就像觀察STL中的sort算法一樣。其實在STL還有make_heap, sort_heap等排序算法。本文章沒有提到。本文以實例的方式,解釋了STL中排序算法的特性,并總結了在實際情況下應如何選擇合適的算法。
總結
以上是生活随笔為你收集整理的STL sort()函数详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Python和OpenCV检测图片上
- 下一篇: 浅谈傅立叶变换