强化学习在出行行业的应用等
生活随笔
收集整理的這篇文章主要介紹了
强化学习在出行行业的应用等
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、公司要做一個模擬推演系統希望通過模擬得出幾個結論
一個城市到底需要多少個車才能滿足客戶需要并且能夠控制每個車的流水
如何做到智能調度
個人覺得這個是個典型的強化學習的方法
比如每個司機其實是個智能決策個體 肯定希望能夠更多的接到單 也就是他的行駛路線會向乘客較多的地方靠近
每個司機隨著開車的時間變久 就會發現哪里乘客比較多 什么時候應該到哪里去等單
這個時候 他們就要判斷自己往哪個方向開車
如果我們取 value = 在某個地方某個時刻接到了單 也就是通過不斷迭代 建立每個司機的經驗值 就能讓司機自我選擇逐漸合理運營
這個時候將司機運行的數據取出來就作為運營的依據
暫時考慮DQN實現該方法
2、目標檢測算法如何能夠快速識別目標 尤其是較小的目標
現階段采用的是SSD方法,但是ssd 包括 yolo 這一類 one stage的方法 都存在不能識別較小目標的問題
看到一個RSSD方法 可以實現樣本較大 測試目標較小的識別
我們實現了自動打標記 來做訓練數據集合 yeah
3、配單速度如何加快
空間索引 注意 空間索引有邊界上跨區的問題 要結合周圍區域的索引值 進行判斷
轉載于:https://blog.51cto.com/yixianwei/2094299
總結
以上是生活随笔為你收集整理的强化学习在出行行业的应用等的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 敏捷宣言和企业Scrum作者Mike B
- 下一篇: curl获取结果乱码的解决方法之CURL