第1章 游戏之乐——快速找出故障机器
轉載:編程之美_1.5_快速找出機器故障
題目:假設一個機器只存儲一個標號為ID的記錄,假設每份數據保存2個備份,這樣就有2個機器存儲了相同的數據。其中ID是小于10億的整數
問題1、在某個時間,如果得到一個數據文件ID的列表。是否能夠快速的找到這個表中僅出現一次的ID?即快速找出出現故障的機器存儲的數據ID。
問題2、如果有兩臺機器死機呢?(假設同一個數據的倆個備份不會同時丟失,即列表中缺少的是兩個不等的ID)
擴展題、如果所有的機子都有三個備份,也就是說同一ID的機子有三臺。而且同時又有三臺機子死機,還能用上面的方法解決嗎?
如果有N臺備份,又同時有N臺機器死機呢?
~~~~~~~~~~~~~~~~分割線~~~~~~~~~~~~~~~~~~~~~~
問題重新闡述:
問題1、已知一個數組,數組中只有一個數據是出現一遍的,其他數據都是出現兩遍,我們要把這個數據找出來
問題2、已知一個數組,數組中有兩個不同的數據都出現一遍,其他數據都是出現兩遍,我們要把這兩個數據找出來
問題3、已知一個數組,數組丟失了三個數據,我們要把這三個數據找出來
????????????? 之后可以擴展到N個
~~~~~~~~~~~~~~~~~分割線~~~~~~~~~~~~~~~~~~~~~
問題1、已知一個數組,數組中只有一個數據是出現一遍的,其他數據都是出現兩遍,我們要把這個數據找出來
方法一、使用計數排序(借助map)
思想:遍歷整個ID列表,使用Map記錄每個ID出現的次數。之后,只出現一次的ID為所求
時間復雜度O(N),空間復雜度O(N)
注:不用map,而用數組的話,空間復雜度會大于N(N表示有N個數),應該是10億(ID的最大值可能為10億)
缺點:空間復雜度太大,對已經出現過兩次的ID仍要保存,但它已經不可能是出故障的機器了
方法二、仍使用計數排序,但是對已經出現過兩次的ID不在存儲
思想:遍歷列表,對于每一個ID,先檢查hash表中是否有與之相同的ID
?????若有,則從Hash表中刪除該ID;
????? 否則,將該ID加入到hash表中。
????? 這樣,遍歷完列表后,hash表中剩下的那一個元素即為所求ID。
時間復雜度O(N),空間復雜度最好為O(1),最壞為O(N)
方法三、利用異或運算(推薦使用)
思想:將列表中的所有ID異或,之后得到的值即為所求ID。
利用異或運算可以得到
?X^X=0?? X^Y=Z? X^0=X
X ⊕ X = 0 X ⊕ Y = Z X ⊕ 0 = X 比如說ID為 2 1 2 3 1 要找的ID為3 2的二進制為010,1的二進制為001 3的二進制為011 則2 ⊕1 = 010⊕001= 011 011 ⊕2 = 011⊕010=001=1(2⊕1⊕2 = 1) 1⊕3 = 001⊕011=010 010⊕001=011 = 3 最終的結果仍然是那個只出現一次的數?
時間復雜度為O(N),空間復雜度為O(1)。在時間和空間上,基本已經達到最優。
缺點:前提是只有一個ID出現一次,若出現多次,則不適合
方法四、利用 "不變量" (推薦使用)
思路:這里,所有ID的和為一個不變量,對現在剩下ID求和。所有ID的和與剩下ID的和之差即為所求ID。
時間復雜度:O(N)時間,空間復雜度O(1)
總結:使用異或 和 不變量 都已經很優化。均能在只遍歷一次列表,只需一個變量的條件下解決。
~~~~~~~~~~~~~~~~~分割線~~~~~~~~~~~~~~~~~~~~~
問題2、已知一個數組,數組中有兩個不同的數據都出現一遍,其他數據都是出現兩遍,我們要把這兩個數據找出來
題里面是丟失的是兩個不同的數據,我們這里兩種情況都考慮下
如果缺少的兩個數字不相同,
方法:進行異或操作
思路:由于缺少的數不同,則最后異或的結果不為0。
(1)對數組中所有的ID進行異或,結果為a (2)我們找到a的二進制表示中,最低一位為1的位置b (3)根據b位是否為1,將ID數組中的數分為兩個數組,其中一個數組中的b位為1,另一個隊列中的b位為0。 (注意,每個數組中,除了那個只出現一次的數外,其他數都是出現兩次的,此時就可以在數組內使用異或操作) (4)然后對兩個數組,分別進行異或操作,則將得到兩個不為0的數字。即為所丟失的兩個ID。?
如果缺少的兩個數字相同
(此時數組中所有ID都是成對出現,異或值還是為0,不能使用異或實現)
方法:可以使用不變量實現。丟失兩個,生成兩個方程,聯立求值
此時我們采取的方法如下:
(1)首先計算出初始未丟失之前,所有ID之和。 (2)然后計算出丟失之后的ID之和,然后(1)(2)結果進行相減操作,得到方程x+ y = a。 (3)利用丟失前后平方和之差,來與(2)進行聯立,得到方程x * x + y * y = b。 (4)對兩方程進行聯立,即可以求出最終的結果。?
~~~~~~~~~~~~~~~~~分割線~~~~~~~~~~~~~~~~~~~~~
問題3、已知一個數組,數組丟失了三個數據,我們要把這三個數據找出來,之后可以擴展到N個
方法一:我們需要建立三/N個方程,求出這些都是的數
此時,當方程為N時,要求N個方程可不好求
方法二:使用計數排序 +?計數值達到A時Map不在存儲
這時,最終可以得到這幾個數
~~~~~~~~~~~~~~~~~分割線~~~~~~~~~~~~~~~~~~~~~
相關題目
給你一副雜亂的撲克牌(不包括大小王),任意從其中抽出一張牌,怎樣用最簡單的方法來知道抽出的是1~13中的那一張?(不要求知道花色)
方法:利用不變量
事先算好所有牌的和(1+...+13) x 4 = 364
然后分別減去留下的牌點數,最終得到的就是抽出的那一張
總結
以上是生活随笔為你收集整理的第1章 游戏之乐——快速找出故障机器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【LeetCode】LRU Cache
- 下一篇: RHEL7 - 从命令行管理文件