为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比
生活随笔
收集整理的這篇文章主要介紹了
为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
? ? ?當前,問題優(yōu)化常用的測試方法是使用A/Btest, 即使用隨機的相同規(guī)模的流量分別進行A組結(jié)果或B組結(jié)果測試。
? ? ?那么我們來看下A/Btest 的組成:
- 一個短時間的純探索階段,你需要找相同數(shù)量的用戶進入A,B組。
- 一個長時間的利用階段,即所有用戶進入結(jié)果更好的實驗組,然后不再回退。
? ? ?為什么說這是一個有缺點的策略:
- 這是一個探索與利用完全分離的策略,要么純探索要么純利用,但是你其實可以在這兩個階段平滑過度。
- 在純探索階段,其實存在一定的資源浪費,就是你一定要拿到相同量級的結(jié)果數(shù)據(jù),但是當一個實驗組的結(jié)果顯著的非常差的時候,你其實不需要那么多數(shù)據(jù)來證明結(jié)果。
? ? 賭博機算法可以為以上兩個問題提供解決方案:算法可以平滑的進行兩個階段的過度。算法會用資源去探索更好的結(jié)果,而不是浪費在顯著差的實驗中。
? ? ?
總結(jié)
以上是生活随笔為你收集整理的为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 默纳克万能协议服务器图片,默纳克MDKE
- 下一篇: 什么是前端缓存