关于年会抢红包游戏的一个思考
1. 游戲介紹
0x1:游戲規(guī)則
該游戲名叫紅包接龍,規(guī)則如下:
年會會場內(nèi)所有人都通過釘釘群的方式參與該游戲,會場人數(shù)一般為200~300人(大部分能時(shí)候是超過紅包最大拆分份數(shù)):
1. 由老板發(fā)出第一個(gè)種子紅包,金額 b = 500,紅包分成100份,每份金額是隨機(jī)的,紅包發(fā)到釘釘群后,大家可以由兩種選擇:搶 or 不搶; 2. 如果選擇不搶,則本輪無損失也沒有收益。 3. 如果選擇了搶,還需要拼手速,因?yàn)榇蟛糠謺r(shí)候選擇搶的同學(xué)個(gè)數(shù)依然大于紅包最大拆分份數(shù); 4. 所有紅包拆分份數(shù)都被搶完之后,由本輪搶的最大金額的同學(xué)發(fā)下輪的紅包,每輪的紅包金額需要在之前的基礎(chǔ)上增加200; 5. 游戲循環(huán)進(jìn)行,直到達(dá)到5000元上限結(jié)束;0x2:游戲策略分析
1. 伯努利實(shí)驗(yàn)抽象建模
先拋開影響是否能搶到的網(wǎng)速問題,每次搶紅包只有兩種結(jié)果:
p=0.99:不是搶到最大的那份紅包; p=0.01:搶到最大的那份紅包;按照伯努利實(shí)驗(yàn)的三準(zhǔn)則,這個(gè)游戲可以抽象為伯努利實(shí)驗(yàn)。因此我們可以二項(xiàng)分布或者泊松分布來對是否搶到那份最大紅包進(jìn)行數(shù)學(xué)建模。
但是問題沒有這么簡單,玩家還需要思考一個(gè)最重要的問題,這個(gè)游戲有”前景“嗎?我們知道,賭博是一個(gè)”沒有前景“的游戲,這是從數(shù)學(xué)期望的角度分析得到的。
2. 基于數(shù)學(xué)期望分析游戲的損失風(fēng)險(xiǎn)
從收益的角度來看,單次紅包游戲的收益期望為:
(搶到非最大那份紅包的概率 * 收益 -?搶到最大那份紅包的概率 * 損失 )* 本輪的紅包金額 = (99 / 100 * 1 / 100 - 1 / 100)* (500 + 200n)= 1 / 10000 * (500 + 200n)
因?yàn)榧t包是被分成100份的,因此收益要 * 1/100;同時(shí),隨著輪數(shù)的增大,越到后面,n越多,本輪的紅包金額就越多。
從上述公式可以看到,從期望角度來看,玩的越多,損失的就越多。
但是!!有一點(diǎn)要注意,就是函數(shù)的導(dǎo)數(shù)趨勢是很低的,我們將公式在圖像中表示:
換句話說,這個(gè)公式主要受到 1/10000 的影響,后面的乘積因子受到了壓制。再換一個(gè)通俗的說法就是,玩1次和玩100次,最終的損失期望在絕對數(shù)值上不會差很多(0.07 ~ 2.05),盡管翻了100倍。
所以,從期望的角度看,多玩幾輪損失也還好,當(dāng)然不能無限擴(kuò)大n次數(shù),畢竟從期望上看,玩的越多,虧的就越多,當(dāng)滿足大數(shù)定理的時(shí)候,虧就成為必然的了。
3. 基于幾何分布的角度分析游戲的損失風(fēng)險(xiǎn)
從上個(gè)小節(jié)分析數(shù)學(xué)期望的過程中,我們其實(shí)發(fā)現(xiàn)這個(gè)游戲隱藏了一個(gè)很大的策略前提,在這場游戲中,只要抽中一次最大的紅包份,基本上整場游戲就是虧本了,即一次失敗,就前功盡棄。
所以,我們要分析的是,玩的游戲輪數(shù)和首次出現(xiàn)負(fù)結(jié)果的概率的關(guān)系。顯然,幾何分布是最適合對這個(gè)場景進(jìn)行數(shù)學(xué)建模的工具。
幾何分布(Geometric distribution)是離散型概率分布。它定義為:在n次伯努利試驗(yàn)中,試驗(yàn)k次才得到第一次成功的機(jī)率。詳細(xì)地說,是:前k-1次皆失敗,第k次成功的概率。這里我們定義n為參與游戲的次數(shù),成功概率定義為抽中最大紅包的概率。
p = 1/100:出現(xiàn)負(fù)結(jié)果,即抽中最大紅包; k=隨機(jī)變量,表示參與游戲的次數(shù);P(X = k)=?,k=1,2,3...N.
這個(gè)函數(shù)是一個(gè)單調(diào)遞減的函數(shù),最大值是當(dāng)k=1時(shí),P(x=1)= 0.01,隨著x的增加,概率逐漸減小。
通俗地說就是,隨著你玩的次數(shù)k增多,”玩了k次才碰到前功盡棄的最大紅包的概率是逐漸下降的“,玩的次數(shù)越多,危險(xiǎn)也就越大,玩的次數(shù)越少,危險(xiǎn)越小,最小的危險(xiǎn)就是只玩1次,風(fēng)險(xiǎn)為1%。
4. 基于泊松分布的角度分析游戲的收益風(fēng)險(xiǎn)
前兩小節(jié)分析了游戲的風(fēng)險(xiǎn),接下來來分析下游戲的收益前景。
我們將問題轉(zhuǎn)化為泊松分布的框架內(nèi)進(jìn)行思考和計(jì)算:
1. n:游戲的次數(shù); 2. p=99/100:盈利的概率; 3. λ = np = 0.99n:泊松分布參數(shù);從上圖可以看到,n越大,λ也就越大,整體泊松分布的均值中心就越大,收益的整體期望也就越大。
所以從這個(gè)角度來說,單純看搶到紅包的收益,肯定是玩的次數(shù)越多,收益越多。
0x3:從極值角度得到一個(gè)理論最優(yōu)策略
如果我們將收益函數(shù)和損失函數(shù)整合起來,得到一個(gè)最終的成果函數(shù),對其求極值,會發(fā)現(xiàn)最優(yōu)點(diǎn)是k=1的時(shí)候,因?yàn)樵酵笸?#xff0c;損失的整體風(fēng)險(xiǎn)是不斷提高的。
也就說,只玩一次就收手!!
這可以看成是一個(gè)理論最優(yōu)值,可惜這不符合我們的”賭徒心理“,而且在實(shí)際生活中,我們也沒必要這么保守,畢竟紅包也沒幾個(gè)錢,就算真的抽中了要發(fā),損失也還好,這種情況下,人們常常傾向于冒一定的風(fēng)險(xiǎn),去獲得更高的收益。但問題是具體要玩多少次呢?
0x4:畫出泊松分布累計(jì)概率分布圖
畫出泊松分布的概率分布圖:
# -*- coding:utf-8 -*-from scipy.stats import poisson import matplotlib as mpl import matplotlib.pyplot as plt import numpy as npN = 20 p = 0.99 # mu = N * p data = poisson.rvs(mu=p*N, loc=0, size=N) print "Mean: %f" % np.mean(data) print "SD: %f" % np.std(data, ddof=1)plt.figure() plt.hist(data, bins=1, normed=True, histtype='stepfilled') plt.xlim(0, N * 1) plt.xlabel("Rounds") plt.title("Rea Packge Game") plt.show()從圖中可以看出,13次左右的時(shí)候(其實(shí)也就是靠近期望均值中心的次數(shù)),我們已經(jīng)能夠獲得”大部分“的收益了,再往后的收益成本比就會越來越低。而且,次數(shù)越多,風(fēng)險(xiǎn)也在不斷提高。
因此,選擇參與13次游戲,是一個(gè)比較明智的選擇。
同時(shí),我們也可以計(jì)算一下此時(shí)的損失風(fēng)險(xiǎn):
1. P(參與了13次,一次都沒有抽中最大紅包)= 0.99^13 = 0.877521022999:概率還是相比比較高的; 2. E(損失)= 1 / 10000 * (500 + 200 * 13)= 0.31;?
2. 紅包游戲該怎么玩呢??
經(jīng)過上面的分析,讀者朋友可能要蒙了,這個(gè)游戲看起來是一個(gè)風(fēng)險(xiǎn)與收益并存的游戲,那我們到底應(yīng)該采取什么樣的策略呢?是盡量多的參與搶,還是盡量少的參與搶呢?
首先一點(diǎn)筆者要強(qiáng)調(diào),世界上的所有事情都這樣的,沒有非黑即白的分界線,我們所要做的是,在黑白之間的灰色地帶,找到一個(gè)最佳的平衡點(diǎn),在盡可能少的損失情況下,得到盡可能多的收益。另一方面,每個(gè)人對風(fēng)險(xiǎn)的承受能力都是不同的,有的人可以接受高風(fēng)險(xiǎn)高回報(bào),有的人是低風(fēng)險(xiǎn)低回報(bào)。
貝葉斯推斷要做的就是將所有未知因素柔和起來,得出一個(gè)風(fēng)險(xiǎn)與收益的綜合概率分布函數(shù),接下來就是推斷的環(huán)節(jié),至于如何進(jìn)行決策,就看使用者自己的策略和選擇了。
0x1:最終的策略
這里筆者給出幾點(diǎn)建設(shè)性建議:
1. 首先,根據(jù)大老板給出的種子金額以及封頂金額進(jìn)行一個(gè)估算,得到 N 的最大值,例如本文的20; 2. 然后,計(jì)算【0,N】之間的95%正態(tài)區(qū)間的負(fù)區(qū)間,也就是左區(qū)間的整數(shù)MIN值,例如本文的13; 3. 將13作為我們整晚游戲的參與上限,同時(shí)建立止損機(jī)制,如果在13輪內(nèi)都沒有抽中最大紅包,則繼續(xù),但是最多只參與13次,如果在這之前不小心抽總了一次最大紅包,立即停止,及時(shí)止損;筆者需要強(qiáng)調(diào)的是,上述的策略是一種偏向保守的策略,即:在盡可能多獲得收益情況下,盡可能少損失。
在實(shí)際的生活中,我們可以繼續(xù)提高風(fēng)險(xiǎn),來獲得更高的收益,這取決于你對風(fēng)險(xiǎn)的承受能力,其實(shí)貝葉斯推斷的核心思想也就在這里,損失的函數(shù)的計(jì)算不只是純數(shù)學(xué)上的計(jì)算,對風(fēng)險(xiǎn)的承受能力也應(yīng)該被考慮在損失函數(shù)的計(jì)算之中。
關(guān)于這個(gè)思想的討論,讀者朋友可以參閱我另一篇博文。
that's it!!
?
轉(zhuǎn)載于:https://www.cnblogs.com/LittleHann/p/10427132.html
總結(jié)
以上是生活随笔為你收集整理的关于年会抢红包游戏的一个思考的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 双向循环链表:字母表实现前后移动
- 下一篇: 树:二叉链表的实现