滴滴 KDD CUP 2020 赛题详解
由滴滴主辦的 KDD Cup 2020 強化學習挑戰賽正式開賽,邀請全球算法高手共同挑戰共享出行領域優化難題。本次比賽由數據競賽網站 biendata.com 提供評測支持。
?
KDD Cup(國際知識發現和數據挖掘競賽)由美國計算機協會知識發現與數據挖掘專委會(ACM SIGKDD)發起,從 1997 年開始,每年舉辦一次,是國際公認的數據挖掘領域的最高水平的賽事。該比賽同時面向企業界和學術界,每年都會吸引世界數據挖掘界的頂尖專家、學者、工程師、學生等參加,也被譽為是數據挖掘領域的「世界杯」。每年都有很多杰出的學術組織及科技申請承辦 KDD Cup,但最終只有擁有深厚的學術積累和行業實踐的機構能夠脫穎而出。
?
今年 KDD Cup 2020 的 RL Track(強化學習賽道)最終由滴滴舉辦。在這一挑戰賽中,滴滴邀請全球參賽團隊聚焦按需出行平臺,嘗試應用機器學習解決方案來提出智能策略,在確保用戶體驗的基礎上,進一步提高出行效率和司機收入。此次比賽滴滴共設計了訂單分配和車輛調度兩個任務,在派單分配任務中,參賽團隊需設計開發算法來指定在派單窗口內的訂單和司機的匹配;而在車輛調度任務中,參賽團隊需設計開發調度算法指引一批空閑司機開往指定目的地。兩個任務既可分別開發,也有聯動的空間。
?
比賽將主要基于滴滴蓋亞數據開放計劃脫敏數據集,該數據集包含一定時間內滴滴平臺專車和快車在成都市部分區域內的脫敏軌跡數據,此外還新增加了其他比賽輔助數據。參賽團隊提交的方案會在測試環境中進行評估打分。
01
比賽背景
隨著智能手機在我們日常生活中的普及,按需出行(MoD)或網約車平臺已成為一種可行的解決方案,可以提供更及時和更個性化的運輸服務。這樣的平臺包括滴滴、優步和 Lyft。這些平臺可以把潛在的出行需求與合適的司機聯系起來,從而更有效地利用空置車輛,滿足日益增長的運輸需求。高效率的按需出行系統可以為司機和乘客提供更好的用戶體驗:司機可以通過減少空轉時間獲得更高的收入,乘客等待時間會更短,滿意度也會更高。
?
按需出行系統的效率取決于時空中供需分布的協調程度。如果想要調整供給分布來更好地協調需求,從而優化運營效率,有兩個重要的問題:車輛調度(vehicle repositioning)和訂單分配(order dispatching)。訂單分配負責把空閑的車輛分配給等待中的出行訂單,并把乘客(和司機)運輸到訂單終點。車輛調度是一種更主動的策略,可以把閑置的車輛部署到預計未來會產生需求的特定位置。
02
比賽任務
比賽參賽者需要同時解決按需出行平臺上訂單分配(order dispatching)和車輛調度(vehicle repositioning)問題。參賽團隊可以解決這兩個問題或其中之一。參賽者的算法將在一個模擬出行平臺環境中進行評估。
比賽環境
測試環境中有所有車輛和出行訂單的狀態。每輛車同時只能為一個訂單提供服務,即不考慮拼車。訂單分配算法可以根據車輛和訂單的狀態,把閑置車輛分配給等待中的訂單。車輛和訂單都可以處于未被分配的狀態。測試環境每兩秒會調用一次訂單分配算法并執行分配任務。被指派的車輛會根據分派指引接到訂單乘客,并運輸到目的地。如果某個訂單沒有在當前時間窗口內匹配到車輛,會被認為丟失。如果等待的時間過長,乘客可以取消訂單。在乘客下車后,司機和車輛重新進入空置狀態。在這種狀態下,司機可以接受訂單匹配。
?
參賽者還可以在測試環境中控制一組匿名車輛(5 輛)的重新定位。如果車輛的空置時間超過 L=5 分鐘的閾值,就有資格接受調度。測試環境會定期向調度算法發送選中車組內可用車輛的狀態信息,而調度算法會讓司機把車開到某個特定的目的地。如果司機即將在當前位置附近逗留,他們會停留 L 分鐘,直到另一個重定位請求被觸發。在選中車組之外的車輛會依據一組通用轉移概率完成空置移動。被重新定位的車輛的沿球面(也就是大圓距離上的)速度被設置為三米每秒。
任務1:訂單分配
參賽團隊會設計開發算法來指定在 2 秒窗口內的訂單-司機匹配。在這個窗口內的所有未接訂單和空閑車輛的狀態信息會被傳給算法。此算法模塊會在一天模擬中的每個窗口被調用。評估模擬會跑多天,日均司機總收入(按獎勵單元計算)會作為本任務的得分。
任務2:車輛調度
參賽團隊會設計開發調度算法給一小部分( 5 輛)事先設定的車輛。這些車輛的身份對于調度算法是未知的,所以調度算法不應依賴于調度車輛的身份。這些車輛在連續空閑 5 分鐘后,會接受調度。模擬環境周期性的調用調度算法來指引這些空閑司機開往指定目的地。本任務的得分計算為受調度車輛司機的人均收入效率(單位時間的獎勵單元收入)。
參賽團隊的算法將在模擬環境中被評估分數,但參賽者無法訪問模擬環境。參賽團隊可以選擇同時開發兩個算法或其中的一個算法(比賽組織者會提供一個分數較低的樣例代碼)。
比賽的兩個任務策略有相關性(即在同一個環境中測試),但是仍然是非常不同的任務,所以只專注一個任務并一定顯著影像另一任務的得分。
本次比賽的設置貼近真實的業務應用場景。而在真實業務場景中,因為操作和財務上的風險,所以通常不可能直接在生產系統中直接訓練模型,探索數據。不過,歷史操作記錄通常可以提供充足的數據。我們可以搭建模擬器來評估各種算法,但很難照顧顯示生產系統中的所有細節。
03
比賽流程
開發階段
比賽提供給每個參賽團隊一個開發包,包括公開數據集,樣本代碼,和其他需要的信息。開發比賽任務算法并不一定需要開發模擬器,但評估環境動力學描述會提供給參賽團隊參考使用。任務提交方式為代碼提交,模塊接口需符合任務要求。團隊可在比賽論壇里討論技術和支持問題。
方案驗證
方案提交通過 zip 文件從平臺提交,zip 文件內的文件夾結構需符合指定要求。每個團隊每天最多可以提交 1 次到評估環境。評估會離線進行。每個成功的提交會得到兩個得分,對應訂單分配和車輛調度的評估指標。得分會在排行榜上更新。
決賽評估階段
在開發階段兩個指標上的任意一個排名前 25 的團隊會進入決賽評估階段。開發階段的最后一次提交代碼會在一個不同的(開發階段未見過的)測試評估環境中進行評估。在最終總得分中,開發階段的最后得分占 40%,決賽評估階段的得分占 60%。所有決賽隊伍會在兩個指標上分別排名。
04
參賽方式
本次比賽的參賽頁面如下,或點擊“閱讀原文”報名參賽:
https://biendata.com/competition/kdd_didi/
?
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的滴滴 KDD CUP 2020 赛题详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全球首次,国星宇航完成卫星在轨运行 AI
- 下一篇: 镜子可以对着卧室门吗