【代码开发】neuron_poker安装及简单使用
文章目錄
- 引子
- 安裝Anaconda
- 安裝環(huán)境及相關(guān)依賴
- 運(yùn)行代碼
引子
最近調(diào)研了蠻多能跑德州撲克的平臺(tái),但有些代碼太老,有些太過(guò)復(fù)雜,很難找到開(kāi)源的、方便的代碼供研究。最近發(fā)現(xiàn)neuron_poker,考慮安裝的復(fù)雜程度、代碼閱讀難度、運(yùn)行效率等因素,綜合來(lái)看算是不錯(cuò),而且還帶有GUI界面,唯一的遺憾就是里面Keras和torch.keras混用,而我pytorch用的比較多,所以沒(méi)有深入研究。
本文簡(jiǎn)單介紹一下neuron_poker的安裝及使用。這是一個(gè)用于強(qiáng)化學(xué)習(xí)研究德州撲克的環(huán)境,主要用于學(xué)術(shù)研究。github鏈接:https://github.com/dickreuter/neuron_poker。
雖然readme里面的內(nèi)容已經(jīng)足夠了,但對(duì)于完全的小白來(lái)說(shuō)可能比較不友好,于是我決定寫一篇保姆級(jí)別的使用教程。順帶一提,我的操作系統(tǒng)是win10。
安裝Anaconda
順便還可以安裝一下pycharm。這部分網(wǎng)上的教程非常多,能看見(jiàn)這篇博文的同學(xué)搜索引擎隨便搜,點(diǎn)開(kāi)前幾個(gè)鏈接看看準(zhǔn)沒(méi)錯(cuò)。
可以用conda -V 和python -V來(lái)檢查自己有沒(méi)有安裝好。
安裝環(huán)境及相關(guān)依賴
主要分為三步:git clone , conda create env 和pip install
選擇一個(gè)文件夾,命令行進(jìn)入。
命令行輸入git clone https://github.com/dickreuter/neuron_poker.git,回車運(yùn)行。
如果報(bào)錯(cuò)提示缺少git就用 pip install git這個(gè)命令安裝一下,如果沒(méi)有辦法訪問(wèn)github就用國(guó)內(nèi)的鏡像。
安裝好neuron_poker.git后,運(yùn)行cd neroun_poker-master進(jìn)入對(duì)應(yīng)的文件夾。
運(yùn)行指令 conda create -n neuron_poker python=3.7,創(chuàng)建一個(gè)虛擬環(huán)境,neuron_poker就是環(huán)境名稱,如果是第一次創(chuàng)建的話可能需要自動(dòng)下載一些第三方拓展包,等待一會(huì)兒之后conda activate neuron_poker打開(kāi)虛擬環(huán)境。
我直接使用的環(huán)境是base。
然后運(yùn)行指令pip install -r requirements.txt就可以自動(dòng)安裝需要的第三方依賴庫(kù)了。
現(xiàn)實(shí)Requirement already satisfied 就說(shuō)明安裝第三方依賴完成了。
運(yùn)行代碼
直接在命令行輸入指令。
python main.py selfplay random --render
用隨機(jī)決策的電腦玩家自博弈。
命令行會(huì)有輸出,并且會(huì)自動(dòng)跳出游戲界面:
如果到了這一步,恭喜你,代碼已經(jīng)可以正常運(yùn)行了!
后面補(bǔ)充一些其它的指令:
python main.py selfplay keypress --render
用鍵盤按鍵與電腦AI交互博弈。
python main.py selfplay equity_improvement --improvement_rounds=20 --episodes=10
用遺傳算法與自我改善訓(xùn)練一個(gè)agent。
python main.py selfplay dqn_train -c
使用 c++ 蒙特卡洛訓(xùn)練DQN agent。
里面這些參數(shù)的含義就要具體在main.py里面找了。
上面顯示的自博弈是只有2個(gè)agent。這部分是在main.py的第106行修改玩家人數(shù)為6就可以了。
這是6個(gè)agent的的界面。
如果想深入細(xì)節(jié)更改源碼,就需要進(jìn)一步閱讀源碼和項(xiàng)目文檔了,也就是代碼的doc文件夾及readme.rst等文件。開(kāi)啟neuron_poker的探索之旅吧!
祝好!
總結(jié)
以上是生活随笔為你收集整理的【代码开发】neuron_poker安装及简单使用的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 无法导入android 工程--提示项目
- 下一篇: 机房收费系统之退卡