解读 | 滴滴主题研究计划:机器学习专题+
解讀 | 滴滴主題研究計劃:機器學習專題(上篇)
2018年7月31日 管理員微信分享
復制頁面地址 復制成功滴滴主題研究計劃
滴滴希望通過開放業務場景,與學術界發現與定義問題,合作共贏解決領域難題,構建高水平跨境知識與研究網絡,構筑產學研合作共同體。
?
2018年秋季期主題研究計劃包含機器學習、計算機視覺、語音信號處理、地理信息技術和能源與汽車五大研究方向的15個來自滴滴真實業務場景。誠邀全球頂尖的學者與滴滴研究員共同探討前沿技術在出行領域的落地應用,以真實場景驅動技術革新。
?
2018年秋季期提交申報書截止日期8月19日。請您關注項目關鍵時間節點,選定申報命題后提前完成申報工作。
?
主題研究計劃官方網址:
?
https://outreach.didichuxing.com/RFP
?
本期我們將介紹機器學習方向課題,希望大家可以找到與自己研究方向匹配的申報方向。
?
機器學習
一. 供需預測
1.技術方向
時空數據 人群轉移分析 城市出行
?
2.課題背景
出行領域的核心在于連接司機和乘客。如何有效利用這些信息通過大數據和機器學習的技術方案,對供給和需求進行描述和建模,實現高頻出行下的供需平衡,是提升整個平臺效率和服務的關鍵。通過建立一個統一的供需實時預測系統,通過基礎能力的建設和打磨,能賦能訂單分配、司機調度、導流、定價、產品策略等業務場景,提升整個出行平臺的效率。
?
3.研究目標
針對上述關鍵問題,研究目標包括不限于:
?
1. 時空數據預測
構建出行場景下時空數據預測能力,其中涉及數據集組織、特征工程、模型訓練和驗證。對于時空數據的分析和研究一直是業界熱議的方向之一,而時空數據預測也一直是業界的一大難題,我們擬建立科學的評估體系,對輸出的預測能力提出以下要求:提供實時預測能力,達到數據可用性,適配節假日、極端天氣、突發事件等異常情況。
2. 人群轉移分析
出行場景的根本是人群的轉移,只有深入挖掘人群屬性及行為特征,才能對城市出行規律做出更加科學的解讀。
?
二.拼車算法研究
1.技術方向
研究拼車合乘算法,提升拼車系統的效率
?
2.課題背景
網約車的快速發展和普及,極大地提升了出行服務的體驗和效率。同時,車輛共享使得交通擁堵得到緩解,基于大數據的供需匹配與優化技術也助力于智慧城市的建設。其中拼車通過行程共享,致力于進一步提升車輛利用效率,以提供低價、高效、綠色的出行服務產品。
?
在更少的體驗損失下,將更多的訂單組合在一起,也將極大提升拼車效率。拼車效率的實現依賴于定價能力, 需求結構及分單能力, 且各部分作用相互耦合。定價模型靈活支持不同業務目標下的基礎定價及補貼發放策略。出行需求結構在不同城市差異巨大: 在相似體驗約束下,達到同等效率所需的訂單數量在不同時空域上迥異。給定供需集合,分單模塊負責將需求與需求,供給與需求進行實時匹配,并通過匹配算法及時序決策的優化提升拼車效率。
?
三個部分的綜合影響最終決定了拼車效率的實現,而各獨立部分影響面的量化及相互作用關系的描述,對整體策略能力進化必不可少。
?
針對上述關鍵問題,研究目標包括不限于:
1. 拼車分單時序決策優化
實時拼車業務的一個主要特征是分單系統對出行需求的即時響應,意味著匹配決策需要在極短的時間內完成。對某一訂單來說,在其生命周期中往往能參與多個訂單組合,且該訂單組合的集合隨時間變化并決定了此訂單匹配效率的優化空間。因此,匹配決策需在當前輪次的優化力度及未來需求的隨機性之間做權衡。即不僅提升每一輪次的匹配效率,同時需考慮訂單在時序上所能參加的匹配輪次組合并決策最佳分配點。
?
2. 需求結構與分單耦合關系建模
分單框架中的各要素如基礎匹配算法,時序決策優化,體驗參數控制等,在不同的需求結構下,對于拼車效率的影響也相應變化。因此,在不同的需求結構下,需靈活地根據相適應關系調整分單框架,從而使各要素的組合能更好地實現拼車效率。
?
3. 需求結構建模
在同一城市中需求結構是異質化的,而基于業務目標,去有向地調整需求結構十分重要。為不同時空域內的需求建立屬性,可增強對輸入訂單集合的把控能力。如動態泛線路的挖掘,及線路間影響關系的建模等 。
?
4. 繞路識別
拼車繞路的實時識別,包括拼車子單內送駕繞路,拼友接駕繞路,全拼單整體繞路,相鄰單繞路等的識別。一般來說,這個過程涉及異常問題定義,用戶反饋收集和清洗,特征數據集構建,模型訓練和驗證。其中,問題的拆解和建模是最困難的。拼車繞路場景有著豐富的內涵,完成機器學習建模應該滿足以下三個要求:
?
1)內聚性
每個子問題場景都有一個清晰的定義,任何兩個子場景之間的邊界盡可能清晰。每個子場景的拆分定義具有較強的內聚性。
?
2)全局性
各子問題場景間的相關性及子場景與總場景的關系,對問題的發現和早期問題的及時解決有較強的影響,需要統籌考慮。
?
3)模型指標
模型需要通盤考慮準確率、召回率對成本和用戶體驗的平衡,同時兼顧模型判責的可解釋性。
?
5. 成單調度
根據訂單時間、費用、里程、路況、空余座位、司機屬性、乘客屬性等特征,結合成本收益體驗等建設基于深度學習、強化學習的拼單調度策略,從而提升資源利用率和司乘體驗。
?
1) 多目標優化
充分考慮司機、乘客利益和約束,實現司乘體驗的優化,體驗和效率、平臺長期增長的均衡。
?
2) 模型指標
在充分理解業務和數據的基礎上,分場景建設通用的靈活可配置的調度模型。實現拼成率、順路率等核心業務指標的明顯提升。
?
三 . 派單算法研究
1.技術方向
組合優化、強化學習、多目標優化、在線系統
?
2.課題背景
網約車服務在近年來得到了廣泛的普及和長足的發展。與傳統的巡游出租車相比,網約車的優勢之一在于其存在中心化的決策機制,可按需在線地撮合乘客和司機間的匹配,從而達到提升平臺效率和司乘體驗的效果。訂單分配(或派單)算法作為連接司機和乘客的橋梁,是網約車平臺中最核心的問題之一。
?
在實際應用中,一個可用的訂單分配算法需要滿足幾下幾個要求:
?
1. 實時計算、運行效率高
以滴滴平臺為例,每天平臺日訂單3000萬,這對算法的實時性和復雜度有了很高的要求;
?
2. 平衡效率、體驗等多個目標
在訂單分配算法中,平臺不僅要考慮整體的匹配效率,還需要滿足司乘體驗的要求、公平性、可解釋性以及平臺長期增長的訴求。如何將這些目標有機地結合在一起是一大難題。
從上述分析可知,派單任務無法簡單地由人工配置進行,其對機器算法有著很強的依賴。從另一個角度來說,派單算法也是人工智能、機器學習、運籌優化等研究領域很好的實驗土壤。綜上,派單問題可以作為學術和工業界結合的重要應用之一。
?
3.研究目標
針對上述關鍵問題,研究目標包括不限于:
?
1. 匹配算法框架
在訂單分配問題中,一個重要的特性是其存在網絡效應和時序效應。具體來說,網約車為一個司乘的雙邊市場,司乘間的匹配皆不是互相獨立的,其在時間和空間上組成了一個網絡狀的結構。同時,派單中需要考慮平臺效率、司乘體驗、公平性等多種因素,形成了多目標優化的問題。因此,設計一個可滿足以上條件的匹配框架,平衡優化目標和約束,并綜合時間序列和空間匹配要求,非常有研究價值。
?
2. 個性化派單
根據用戶實時狀態以及用戶特性的不同,進行個性化的分單,以提升司乘和效率。
?
3. 派單公平性和可解釋性
滴滴的線上分單系統每天為大量的司機和乘客服務,其服務對象均為有感情有訴求的個體,故算法的可解釋性和公平性往往與平臺效率、體驗處于同樣重要的作用。如何把公平性引入優化目標或約束中,并生成可解釋可回溯的匹配標準,也是算法必須要考慮的問題。
?
注意
更多項目信息
請關注主題研究計劃官方主頁:
https://outreach.didichuxing.com/RFP
?
本文來自 滴滴學術合作 微信號。
總結
以上是生活随笔為你收集整理的解读 | 滴滴主题研究计划:机器学习专题+的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AAAI 2018经典论文获奖者演讲:本
- 下一篇: 一个完整的算法开发