车主因眼睛小被自动驾驶误判?——智能座舱CV体验的经典corner case剖析 by 资深AI产品经理@方舟...
前言:最近兩天,“車主因眼睛小被自動駕駛誤判”沖上熱搜、順勢破圈,而咱們“AI產品經理大本營”微信群里,不僅有很多PM在激烈討論,還有一位智能座艙CV領域的資深AI產品經理@方舟,用心分享了自己的一線實戰心得。關于這個問題,本文可能是目前全網最具實戰價值的產品視角干貨了。
大家好,我是方舟。前天突然發酵的一個熱搜引爆朋友圈——“車主因眼睛小被自動駕駛誤判”。由于智能座艙的DMS(駕駛員監控系統,driver monitoring system)恰好也是我的工作研究范圍,今天特別想就聊一聊相關的一些問題,比如
“識別小眼睛”到底難不難?
有沒更好辦法判別“司機疲勞”?
DMS到底是不是剛需?
1
話題破圈
小鵬汽車CEO何小鵬轉發了一個用戶對DMS的吐槽:
這個話題在AI產品經理大本營的微信群內迅速升溫(相關聊天精華詳見:https://shimo.im/docs/uMOIisCTj6wriojs )
作為從業者,DMS是我們耳熟能詳的名詞,不過由于當前量產車的搭載率和使用率并不高,所以對普通老百姓而言,DMS仍是一個陌生功能。這次事件以“小眼睛誤識別”作為爆點,讓DMS乃至智能座艙應用都得到了破圈的關注度,對智能汽車行業可能也是好事。
接下來,結合個人對DMS產品的設計和落地經驗,我從不同的角度淺談一下相關體會和思考。
2
“識別小眼睛”到底難不難?
小眼睛的司機被DMS系統誤檢為閉眼,看似是一個荒唐的corner case,實際上確實是業界難題。這里不僅有算法模型本身的難度,同時還有硬件和策略問題。
1、硬件問題
1)攝像頭
目前汽車艙內攝像頭的像素,完全無法和手機的相比。
目前消費級的手機攝像頭,像素1000W都算低的,但市面上已穩定量產的車內攝像頭,像素超過100W都很難;最新待量產或者少量剛剛上市的最新DMS攝像頭,像素普遍200W。
“像素少”帶來的后果就是,能夠給AI提供的信息輸入源就少,這樣,就會帶來算法難度和算力需求的提升。
上圖中聊天記錄中,小鵬內部人員所說“眼睛占用像素太小了”,也正是這個意思。車內攝像頭像素本來就很弱了,眼睛再要小到像李榮浩一樣的話,確實有點難為AI不是。
除此之外,某些“座艙內飾設計”導致攝像頭安裝位置不理想,或者“駕駛員眼鏡度數較高”導致眼部關鍵點偏移等,這些不可抗的外部因素,都有可能帶來原子能力的識別異常。
座艙內攝像頭的成像質量、預處理能力、像素值提高,有待整個產業鏈一起努力(包括camera sensor、lens、isp廠家等);按照蓋世汽車的結論,到2025年,艙內攝像頭的像素目標會奔向500W(這個結論,也基本上與國外相關研究機構的報告吻合)。
2)芯片
除了攝像頭硬件,DMS功能也依賴座艙域算力硬件,也就是芯片。
當前智能座艙的應用程序五花八門、琳瑯滿目,但座艙域控制器芯片的算力卻還遠不如手機,幾年前DMS剛上車的時候,高通820A或者瑞薩等已經算比較好的芯片,但是勻給DMS功能的算力,有的還不到1K Dmips,雖然現在隨著8155以及后續8295的快速迭代和上車,算力問題稍有改善,但其他需要大量算力的應用(如地圖渲染、全車語音等)也會有越來越多的增量算力訴求,就好像有一塊大蛋糕,需要各個模塊battle來分。有過AI開發經驗的人都明白一個道理,拋開算力談性能,和拋開劑量談療效是一個道理。
3)智能汽車的前裝模式限制了改裝的便捷性
汽車不像電腦,游戲太卡就加裝個GPU,再綜合考慮到各種硬件的車規級要求,以及功能安全等復雜的開發流程,很難在已量產的功能上進行硬件疊加,特別DMS這種保命功能,涉及到汽車安全性,需要嚴密的測試和質量流程。
2、策略問題
汽車DMS功能和人體生理疲勞的研究,是歐美國家最先開始的。他們發現,在人的所有面部信息當中,與疲勞相對關聯性比較高的特征是眼部特征,例如閉眼、眨眼頻率、眼部開合度(perclos)等。
歐美人種眼睛天生又圓又大(小眼睛情況非常罕見),如果基于perclos方法的定義來判斷,大多數歐美人都能夠有比較均衡的眼部開合度情況,實操下來可能效果還行。
但是,這類研究結論生搬硬套到中國后,出現了水土不服:亞太人種中,小眼睛占比高,文中所提到的corner case就會更加常見。可以說,類似的corner case看似是一個戲虐的意外,但在我們實際工作中(特別是國產車、日韓系車等),幾乎是每個交付案例中都會遇到和需要解釋的情況(李榮浩每次躺槍,每次都拿他舉例)。
因此,通常在國內量產車的業務實現中,對于眼睛小到一定程度的駕駛員,我們往往會在策略中進行定向過濾,這是對當前業界算法能力和硬件條件下的一種妥協權衡。
總的而言,DMS對小眼睛的識別效果確實是一個業界難題。基于我自己以往的研究和交付經驗,雖然小鵬明確表示要優化這個問題,但是要從原子能力層面徹底根治這個corner case,肯定還需要較長的時間以及行業共同努力。但是在業務策略層面,優化對于小眼睛人群的DMS使用體驗,相信能夠很快出一套應急方案。
3
有沒更好辦法判別“司機疲勞”?
為了解決駕駛過程中的司機疲勞判斷,過去幾十年,國內外學術界和產業界都做了非常多的研究和嘗試。研究方向大體可以分為三類:基于車輛信息(車控)、基于生物傳感信息(心率、血壓、腦電波等)、基于視覺傳感器(人體面部特征)。
除了基于視覺攝像頭的DMS系統之外,國外也有很多車企是將車輛的動態數據作為判斷駕駛員分心和疲勞判定依據(比如寶馬、大眾、奧迪等),并且,人家是幾十年前就開始做這樣的嘗試了。但是,正如大家目前所感受到的,在行車運動場景下準確的判斷駕駛員的實時狀態,在全球范圍內,我們依然找不出任何一款車做的有多好。
對人體疲勞生理研究稍有了解的朋友可能會問,很多研究機構用腦電波研究人體疲勞,是否可以采用到汽車的DMS系統中呢?
誠然,“腦電波”被認為是與疲勞關聯性的“金指標”,很多醫學機構或者研究機構,會用腦電波的監測儀器來監測人體的生理狀態,也有一些DMS檢測中心,會用腦電波來校準測試駕駛員的狀態。但是,相應的儀器價格昂貴(如果還要滿足車規,成本只會更貴),這樣的設備放在量產車中,從成本上考慮不現實。
當前,大眾對DMS功能接受程度普遍不高,不會有多少消費者愿意為此增加購車成本。因此,基于腦電波的DMS疲勞研究,目前也僅存在于學術研究機構中。
除此之外,基于方向盤嵌入芯片檢測人體阻抗、基于OMS攝像頭的PPG原理檢測心率等各種腦洞方法,都有人一本正經的研究過。那在量產車上,為何仍沒有產出更有效的監測方案呢?一句話概括就是:綜合成本、安全性、穩定性、座艙內飾、整車工程等各種角度的考慮,這些idea暫時都無法有效落地。所以目前看,國內外DMS的研究方向,似乎都殊途同歸、走向了艙內攝像頭。
當然,DMS領域也不會止步不前,無論OEM還是Tier 1 都在想著各種方法。有一些專家希望把車控、生理特征、面部特征等相關的各種因素融合在一起綜合判斷;理論上,當特征集足夠大時,單一特征對整體結果的影響權重就會降低,這樣即使某個駕駛員在單一特征有異常識別狀態,基于所有特征的校準后,也可以得到相對穩定的結果。
另外再多分享下,目前DMS功能有以下兩個特別明顯的趨勢:趨勢一 ,DMS與OMS融合為座艙監控系統,為座艙多樣功能提供技術基礎。趨勢二 ,車內外視覺與其他傳感數據融合,車內外安全一體化。
4
DMS到底是不是剛需?
可以明確的是,在智能汽車浪潮中,DMS的剛需程度將會越來越強(無論從法規層面還是需求層面)。
DMS的強制準入法規,在歐洲已立法通過(國內還沒有),駕駛員檢測系統行業標準在歐洲執行的更為激進。在智能汽車行業中,中國往往會緊跟歐標和聯合國規范的步調,不出意外,我國DMS功能的強制性上車只會是時間問題。
2021年,推薦性國家標準《駕駛員注意力監測系統性能要求及試驗方法》,由汽標委智能網聯汽車分標委完成審查;該標準主要對“基于視覺識別的駕駛員注意力監測系統”提出了明確的技術要求及測試方法。
2022年4月,作為中國最具影響力的第三方測評規程,CNCAP(中國新車評價規程)發布了2022-2028路線圖,并計劃于2025年版本中,增加駕駛員監測功能的測試要求,以加速駕駛員監測功能的普及。
另外,歐盟EU-771法規,將駕駛員疲勞分為9個等級、并要求系統應具備識別7級及以上疲勞狀態的能力。該法規計劃于2022年7月配合EU 2019/2144實施,并將要求歐盟上市車輛具備駕駛員疲勞監測的功能。和國內標準相比,歐盟發布的EU-771法規測試方法更偏向于主觀測試。
在業務層面,隨著高級輔助駕駛在智能汽車中的逐步滲透(甚至到自動駕駛的落地),對駕駛員甚至乘客的監控要求都會適時發生變化。在這個產業浪潮遞進的過程中,DMS可能會陪伴智能汽車度過好幾十年。
很多互聯網出身的產品經理,在新產品中經常喜歡談論“創新”和“價值”,但是在汽車產業中,除了以上兩點,還有一個更重要的就是“底線”——DMS產品就是一個典型的以“底線”為前提的產品,首先守住安全的“底線”,才能談論體驗上的“創新”和“價值”。
5
寫在最后
這次“小眼睛誤識別”事件,既是DMS模塊一個典型的corner case,也是整個智能汽車產業現階段疑難問題的一個縮影。
對我個人而言,看到自己正在做的事情破圈到大眾視野中,我是非常興奮和激動的;同時也非常確信,在這個產業鏈中各個玩家的努力下,一個又一個corner case都將被一一解決。
最后,我突然想到前幾天一位同行說的話:當下這個行業,很多人都在做創新,但是這其中,也有很多人在做無效創新;當基本問題、基本體驗都還沒解決好的情況下,對消費者而言,是否需要更多的創新呢?
我希望我會一直帶著這個問題投入到行業探索中。
ps,希望和作者直接交流的朋友,可以關注其公眾號——
以上內容,來自知識星球“AI產品經理大本營”,識別下圖二維碼,即可加入。
下面,是hanniman讀者們的專屬福利時間啦——
----39個近期AI產品經理JD(可內推)----
【投遞簡歷方式】
直接加我微信號(hanniman721)溝通,備注請寫:“求職-姓名-職位編號”,例如“求職-張三-G5-001”。
【覆蓋城市】
8個:北京、上海、杭州、蘇州、深圳、廣州、成都、武漢。
【近期重點新增JD in 北京】
1)G23,北京,某創業板上市公司,Iot PaaS產品總監
負責IoT平臺及IoT APP產品的迭代工作,需要帶團隊。
要求:必須有Iot相關經驗,5年以上產品經驗,英語要熟練。
2)G24,北京,某獨角獸公司,云服務產品高級總監
負責公司云平臺基礎服務建設(大數據服務|OTA服務、知識庫服務等)以及相關SAAS云服務(運維服務、運營服務、培訓服務、開放平臺等)產品的全生命周期;帶6-10人。
要求:5-8年以上互聯網產品工作經驗,3年TOB SAAS產品|IOT服務、TOC用戶服務平臺、售后運維系統等相關工作經驗。
3)G25,北京,某納斯達克上市公司,云原生產品經理Leader
負責內部云產品方向(包括但不限于容器、DevOps、多租戶、CI/CD、運維自動化、監控分析、服務治理、分布式計算、數據庫和存儲等)產品設計工作,帶11~20人。
要求:了解云原生、云計算、大數據相關技術領域,有相關經驗者優先;具備一定的英語閱讀能力,能夠使用英語進行工作交流。
4)G18,北京,某AI上市公司,高級產品經理(元宇宙數字人方向)
職責概述:負責元宇宙數字人的產品戰略、方向、規劃、需求工作,涉及數字人客服/助理/直播/偶像等,以及相關的平臺化工具產品。
要求概述:有數字人行業經驗優先。有3D游戲、動畫、圖像視覺、語音交互/多模態交互經驗,對模型效果有較好的審美優先。
所有39個JD詳情可見
https://shimo.im/sheets/hUL9JPAKxegIm5lo/MODOC?(或點擊最后的“閱讀原文”)
-END-
--?hanniman往期精選?--
一、AI產品分析
【重點】大B公司自己做AI,都是九死一生——To B AI 平臺的1.0 模式,已幾乎宣告失敗?
【重點】AI產品方法論之“由用戶來完成AI產品設計的最后一公里”
【重點】如何從“品類”角度做AI產品(2C)的需求定位
【重點】大B公司自己做AI,都是九死一生——To B AI 平臺的1.0 模式,已幾乎宣告失敗?
【重點】產品視角看智能客服
【重點】一文了解四足機器人
【重點】智能音箱上的語音技能市場,能否對標手機上的應用市場?
【重點】AI產品經理視角下的AI翻譯機?in?旅游場景
【重點】進擊的人工智能:產品視角解析“對話機器人”
【重點】如何從零開始搭建智能外呼系統
一文了解“教育+AI”方向通識(場景、產品、公司、商業模式、短期風險及機會)
二、AI產品經理
【重點】重磅發布:《AI產品經理的實操手冊(2021版)——AI產品經理大本營的4年1000篇干貨合輯》(PDF)
【重點】正式介紹“AI產品經理大本營”
【重點】人工智能產品經理的新起點(200頁PPT)(注:后臺回復“200”,可獲取PPT下載鏈接)
【重點】AI產品經理的定義和分類
【重點】AI產品經理的價值和未來|?學習俞軍老師分享有感
【重點】最新AI產品經理求職動態:卡年齡、卡學歷,這么卷,怎么辦?_2022年3月
AI產品經理能力模型的重點素質:人文素養和靈魂境界
最新“AI產品經理”求職動態及建議
深度報告|?AI新職位“人工智能訓練師”
三、AI技術
【重點】AI產品經理需要了解的語音交互評價指標
【重點】語音合成TTS|?AI產品經理需要了解的AI技術概念
【重點】一文看懂“語音識別ASR”?|?AI產品經理需要了解的AI技術概念
【重點】值得收藏|?關于機器學習,這可能是目前最全面最無痛的入門路徑和資源!
【重點】用最通俗語言來聊聊“什么是機器學習”
【重點】DIY面試題?for?AI產品經理?|?“智能音箱半夜詭異笑聲”的原因分析及建議方案
【重點】“AI芯片”通識_AI產品經理看這一篇就夠了
【重點】人臉識別產品設計,AI產品經理需要了解的實戰干貨都在這里了_團員分享_@陽春柏樰
【重點】一文看懂“聲紋識別VPR”?|?AI產品經理需要了解的AI技術概念_團員分享_@cony
NLP基本功-文本相似度|?AI產品經理需要了解的AI技術通識
看AI產品經理如何介紹“計算機視覺”(基于實戰經驗和案例)
人臉識別|?AI產品經理需要了解的CV通識(二)
多目標跟蹤|?AI產品經理需要了解的CV通識(三)
填槽與多輪對話|?AI產品經理需要了解的AI技術概念
AI產品經理需要了解的數據標注工作入門
語音識別類產品的分類及應用場景
四、AI行業及個人成長
【重點】現在的BAT,就是曾經的外企
【重點】【深度】工作5年以上,到底要不要進AI創業公司?
【重點】深度|?人工智能讓我們失業?不,這取決于我們自己
【重點】我們還沒準備好和AI共生——柯潔和AlphaGo大戰之觀后感
【重點】AI產品經理視角下的V2X、車聯網和自動駕駛
如何成長為高頂級產品經理的3個關鍵點
新技術帶來產業格局周期波動的3個階段(以智能汽車領域為例分析)
“人工智能與法律”對AI產品經理有何實際借鑒意義
稻盛和夫的這些話,是雞湯還是干貨?
跨過這十個誤區,提前2年告別職場小白
【重點】如何分辨明師并遇到他|?周日換頻道(7)
---------------------
黃釗hanniman,前騰訊產品經理,前圖靈機器人-人才戰略官/AI產品經理,10年AI背景,13年互聯網經驗;垂直于“AI產品經理”的第一社群(知識星球“AI產品經理大本營”,已運營5年)和第一自媒體(微信公眾號/知乎ID“hanniman”,已運營8年);作品有《AI產品經理的實操手冊》(AI產品經理大本營的4年1000篇干貨合輯)、200頁PPT《人工智能產品經理的新起點》。
總結
以上是生活随笔為你收集整理的车主因眼睛小被自动驾驶误判?——智能座舱CV体验的经典corner case剖析 by 资深AI产品经理@方舟...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: maven pom.xml解析、命令说明
- 下一篇: One Card Poker——AtCo