【转】5亿个数找中位数
生活随笔
收集整理的這篇文章主要介紹了
【转】5亿个数找中位数
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
原文鏈接:http://www.cnblogs.com/qianye/archive/2012/11/29/2794533.html
找中位數最容易想到的方法就是,先對序列進行排序,取中位數,然而5億個數要想全部讀入內存需要將近2GB空間。
一種想法是采用外部排序的方法,在排序的過程中記錄數據個數,找到中位數。首先采用hash() % 100,把數據分到100個文件中,然后對每個文件分別在內存中進行快速排序,再將100個小文件進行合并,并在合并過程中尋找中位數,時間復雜度是O(nlogn)
?
另外一種方法是,將數據按照數據空間分為0-9999999,10000000-999999999, ……大概50個部分,每一部分存入一個小文件,統計每個小文件中的元素個數,由于文件之間相對有序,可以容易得出中位數是位于哪一個文件之中,并可以得出中位數在該小文件中的排序次序,用相同的方法對小文件進行處理,當文件內容比較小的時候可以直接在內存中進行找中位數操作,對于n個隨機數找k小元素的時間復雜度是O(n),所以總的時間復雜度為O(n)
?
5億個數找不存在的元素
想法是:將這5億個數據按照大小分為50部分,0-9999999, 10000000-99999999…并分別存入文件中,對于每一個文件,只用找出每個文件中不存在元素即可
轉載于:https://www.cnblogs.com/qianye/archive/2012/11/29/2794533.html
總結
以上是生活随笔為你收集整理的【转】5亿个数找中位数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++二维数组名的再探索
- 下一篇: C++如何限制对象在堆上或栈上生成