蓄水池抽样算法 Reservoir Sampling
生活随笔
收集整理的這篇文章主要介紹了
蓄水池抽样算法 Reservoir Sampling
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
2018-03-05 14:06:40
問題描述:給出一個數據流,這個數據流的長度很大或者未知。并且對該數據流中數據只能訪問一次。請寫出一個隨機選擇算法,使得數據流中所有數據被選中的概率相等。
問題求解:如果是長度已知或者有限的問題,那么可以使用樸素的方法,先遍歷一遍得到的長度。然后在得到長度后可以使用隨機算法得到一個隨機的index。
但是本題已經明確指出數據流長度很大或者未知,也就是說只能遍歷一次,而且要保證每個數被挑選的概率相等。
標準解法是使用Reservoir Sampling算法,該算法由Knuth的學生在斯坦福讀計算機博士時想出來。
算法描述:
相關問題:
-
382. Linked List Random Node
問題描述:
問題求解:
public class Solution {ListNode head;Random rand;/** @param head The linked list's head.Note that the head is guaranteed to be not null, so it contains at least one node. */public Solution(ListNode head) {this.head = head;this.rand = new Random();}/** Returns a random node's value. */public int getRandom() {int k = 1;ListNode cur = head;List<Integer> reservoir = new ArrayList<>();int i = 0;while (i < k && cur != null) {reservoir.add(cur.val);cur = cur.next;i++;}i++;while (cur != null) {if (rand.nextInt(i) < k) {reservoir.set(rand.nextInt(k), cur.val);}i++;cur = cur.next;}return reservoir.get(0);} }- 398. Random Pick Index
問題描述:
問題求解:
如果僅存在一個數,那么將之index返回,如果存在多個數,其index的返回值需要是等概率的,也就是說對于k個相同的數,我們需要每個index的返回概率為1/k。根據蓄水池算法,我們首先要建立一個大小為1的池子,然后對每個出現的target的index以當前出現個數的概率選擇他,然后從池中隨機挑選一個數來與它交換,由于池中僅有一個值,因此只需要將res的值變為挑選值即可。
public class RandomPickIndex {int[] nums;Random ran;public RandomPickIndex(int[] nums) {this.nums = nums;ran = new Random();}public int pick(int target) {int res = -1;int cnt = 0;for (int i = 0; i < nums.length; i++) {if (nums[i] != target) continue;if (ran.nextInt(++cnt) == 0) res = i;}return res;} }?
轉載于:https://www.cnblogs.com/TIMHY/p/8508759.html
總結
以上是生活随笔為你收集整理的蓄水池抽样算法 Reservoir Sampling的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java项目:JSP网上零食销售系统
- 下一篇: Hibernate完全自学手册