[科研笔记] 关于人工智能与算法项目的思考
原鏈接:https://blog.csdn.net/walilk/article/details/77131929
前言
[科研筆記] 系列是我在科研道路上的隨筆和思考,內容不加以局限,是一個開放的文章系列,這也是給自己一點自由的空間。
本文是我結合自身經驗給的一些出關于人工智能技術和算法項目管理方面的思考。歡迎大家批評指正,提出寶貴的意見。
文章小節安排如下:
1. 人工智能技術火爆引發的問題
1.1 盲目崇拜人工智能
1.2 試圖借助人工智能進行跨越式發展
2. 人工智能技術帶來的項目管理難題
2.1 算法項目合作需要理性與務實
2.2 算法系統與業務系統對接成本較高
2.3 算法系統的成本和預期效果難以評估
2.4 算法研究員的工作難以管理
3. 結語
一、人工智能技術火爆引發的問題
隨著人工智能技術的突飛猛進以及實用化水平越來越高,大量的工程項目開始引入人工智能技術并將其作為重要的組成部分,人工智能技術可以顯著提高系統的運行效率、性能和靈活性,甚至解決之前無法解決的業務難題。人工智能技術崛起的如此迅速,甚至如果立項時候不加入點人工智能概念,都不好意思發布出去,但與此同時,我們也應該清醒的認識到智能技術存在的不足,以及在項目中引入人工智能技術引發的個各類問題。
1.1 盲目崇拜人工智能
個人、社會與國家應該理性認識人工智能,避免泡沫與資源浪費,避免虎頭蛇尾。
媒體的過度鼓吹導致很多人對人工智能盲目崇拜,覺得人工智能可以解決所有的問題。在這種狂熱的氛圍下,很多創業團隊都以人工智能技術作為基礎,構建自己的商業模式和創業項目。很多大公司的項目經理也依賴人工智能技術設計業務系統。這是一個好現象,大家充分擁抱人工智能,但這也是一個需要警惕的現象,人們崇拜著人工智能技術,將項目的成敗完全寄托于人工智能技術的成敗,缺少對人工智能技術發展水平的清晰認識,一旦智能技術的研發沒有達到預期,項目就會宣告死亡,這是應該極力避免的。
我經歷了太多高調立項卻草草收尾的人工智能項目,立項之初各參與單位慷慨激昂、熱鬧非凡,真的是敢想敢吹敢拍著胸脯保證,似乎一切問題都可以利用人工智能技術分分鐘搞定。可是到項目結題的時候呢?各個單位相互推卸責任,實驗的指標作假,師范系統的數據作假,甚至直接耍無賴說做不出來愛咋咋地,參會現場一片狼藉,爭吵不斷。
1.2 試圖借助人工智能進行跨越式發展
智能化一定是未來,但工業化仍然是我國現在的主要技術戰略方向,現階段的人工智能應服務于國家工業化戰略。
人工智能技術的發展階段已經有很多專家大牛在討論,我就不多說了,這里我結合自身的人工智能技術研發經驗和工程項目經驗,談一談在我的認知里,現階段人工智能的發展方向是什么。
在我看來,現階段的人工智能技術解決的比較好的是重復性的、規則性的任務,例如圖像分類,視頻打標簽,人臉檢測和識別等等,可以解放人類勞動力,這本質上是一個自動化的過程。我們國家仍處在工業化階段,工業控制和自動化技術是現階段發展的第一戰略方向,這點從我們國家政府制定的制造強國戰略《中國制造2025》行動綱領就可以看出來,而目前的人工智能技術,也應該以解決工業化和自動化問題作為重點研究方向,提高我國工業生產的自動化程度。
從提高自動化程度的角度來研究人工智能技術往往能取得比較好的應用效果,例如幫助直播公司做自動內容審核,例如幫助博物館構建數字圖像數據庫來提高圖像查找速度,例如工廠中的各類工業機器人(也許只是一個機械臂)等等。而從其他角度研發的人工智能產品效果卻較差,例如市場上各種家庭陪伴/對話機器人,以及各種主打人類與人工智能交互的產品,實際價值并不大。原因在于現階段的人工智能技術并不具備任何創造性,才剛剛進入工業應用的階段。
二、人工智能技術帶來的項目管理難題
如果一個項目中包含有人工智能技術的研發內容,我將其稱為“算法項目”。
2.1 算法項目合作需要理性與務實
科技領域的健康的、可持續的合作模式,應該建立在對科技發展有理性清晰認識的基礎上。
作為人工智能技術的廠商和服務提供商,應該對客戶坦誠,避免過度包裝自己的產品,應告訴客戶現階段的人工智能技術能幫助解決什么問題,存在哪些不足,哪些可以作為合作后的研究重點,研發中存在的風險是什么樣的。
作為有人工智能技術需求的客戶,在尋找人工智能技術方案時候也要保持理性的認識,以及合理的預期,哪些問題可以交給人工智能技術來解決,哪些仍需要傳統技術和人工輔助,以及如何應對研究性項目的不確定和高風險。
算法項目的合作需要甲乙雙方的密切、深入、持續合作,才可以充分發揮人工智能的作用。
2.2 算法系統與業務系統對接成本較高
人工智能技術存在一定的門檻,傳統系統開發工程師缺少人工智能技術的相關知識,因此在業務系統與算法系統對接的時候,或者說業務系統開發人員在調用算法的時候,總會有這樣的疑問:
為什么算法需要設置這么多的參數?為什么算法運行效率這么低?算法的輸出是不是正常的?算法出錯的提示信息到底在說什么???
我在這幾年的項目經歷中遇到過無數的啼笑皆非的案例,比如總是有工程師不明白為什么一串數字(特征向量)可以代表一副圖像?分類算法的輸出0-1和0-100有什么區別?一幅圖像經過低俗檢測模型后輸出的0.75到底是什么意思?
這些問題直接導致了項目中的溝通成本極高,進度緩慢,甚至發生問題后相互推諉責任。然而這個問題卻很難在短時間內得到解決,一方面,很難要求算法研究人員花時間精力去琢磨業務,搞科研的總是很高冷覺得業務需求什么的弱爆了;另一方面,也很難要求業務系統開發人員花時間精力去研究算法,因為這需要花費大量時間復習概率、矩陣和圖的知識。我認為可以在項目團隊中設立一個介于算法和業務中間層次的職位,建立起兩者之間的溝通橋梁。
2.3 算法系統的成本和預期效果難以評估
1)為什么說算法系統的成本難以預估?
一個數學公式值多少錢?一個算法模型值多少錢?一手調參技巧值多少錢???論文里的公式和理論晦澀難懂,訓練的參數模型看不見摸不著,當你的公司試圖引入一套智能算法系統,請問你該如何評估項目難度,以及如何做預算?
這是一個很難評估的問題,我認為很大一部分原因在于人工智能技術市場剛剛興起,很多市場規范和價格體系還沒有形成,加上媒體的肆意鼓吹,因此仍處在混亂的狀態。很多公司想渾水摸魚趁火打劫,也有很多公司借著資本力量不惜成本的鋪市場,當然也有很多想要踏實做事的人工智能技術公司。于是作為公司主管也許會在市場看到有人說50w,有人說30w,還有人數15w,更甚者說8w就可以合作!!!那么該如何評判各家的方案和報價呢?
市場是在無數的浪費和騙局中成熟完善起來的,站在企業的角度,我認為對企業來說最好的辦法應該是組建具有人工智能技術能力的團隊(至少是相關專業具備基礎知識),這樣一方面可以在各種天花爛墜的智能技術方案中選出最可靠的最實用的,另一方面也能夠在合作中減少與算法團隊的溝通障礙,提高項目推進效率。同時,也可以逐步幫助企業構建智能化方案,進行企業轉型升級。
作為人工智能領域的從業人員,雖然已經參與了很多國家項目,也跟企業合作了很多項目,但我們也并沒有特別規范的報價依據,缺少對科研工作和智能技術成果的價值評價標準,這也是需要深刻反思和迫切解決的問題。
2)為什么說算法系統的預期效果難以評估?
事實上人工智能技術現階段仍然只能解決針對性的問題,針對具體的場景,具體的數據集等等,同樣的模型在不同的場景下的效果可能就大相徑庭。
例如我們的圖像低俗內容審核算法,在互聯網圖片數據集上訓練的參數模型,具有99.9%的準確率和0.1%的誤檢率,那么猜猜看這個參數模型在直播視頻場景下的識別效果如何呢?答案是不好,有機器學習背景的同學都知道原因,互聯網圖片數據和直播視頻數據的分布是不同的,所以訓練的模型也就無法相互適用。最后我們通過在直播視頻數據上重新優化參數模型,才達到客戶的指標要求。
這樣的問題存在于任何一個與人工智能有關的項目中,就說我們常見的人臉識別算法,face++、商湯科技、百度、騰訊等等,公布的算法性能都接近100%,但這只是在某個數據集上的結果,騙騙外行人還可以。如果放到實際業務場景下,比如國家最迫切需要的公安監控視頻場景(視頻質量參差不齊,畫質可能嚴重不足),那算法的性能就直線下降,甚至慘不忍睹。上述公司的小伙伴們看到這段話不用找我argue,大家都是圈內人,國內很多公安和國安的項目競標我們也都參與過,大家的技術水平應該是彼此心知肚明O(∩_∩)O~
在封閉的數據環境下,即數據分布相對比較穩定的情況下,可以通過各種奇技淫巧將算法性能優化到一個比較高的水平,此時算法的效果是相對穩定并且可以預判。
在開放的數據環境下,即數據分布不穩定,隨時可能變化的情況下,就很難訓練算法了。學習型算法確實更加靈活(不用顯示的定義計算規則),但依然遵循著規則,而這些規則就來自于數據,不同的數據集合對應著不同的規則,因此開放環境的算法訓練極具挑戰,運行效果往往不穩定。
2.4 算法研究員的工作難以管理
1)科研人員每天到底在干什么?
試想一種場景:你的算法研究人員每天看paper,跑實驗,在紙上涂涂畫畫,搞得熱火朝天卻遲遲拿不出幾行代碼,并且永遠也無法確定交付日期。作為企業管理人員可能都無法容忍這樣的工作模式,但事實上這些科研工作者們的工作模式真的就是這樣,而且他們真的非常努力在研究算法方案,只是圈外人很難看懂罷了。
搞研究的人往往喜歡獨自戰斗不喜協作,并不是他們缺乏團隊精神,而是思考這件事本身就很難多人協作,也很難量化考核。所以說做研究需要相對寬松的環境和時間計劃,工業生產中每天產出考核的方式并不適用于研究工作。
另一方面,實驗室的東西到實際應用往往都有非常長的路要走,很可能興致勃勃的研究了很久的算法方案拿到實際場景中完全不好使,甚至推到重來。這都是有可能發生的,而且不是小概率。
2)企業如何實施人工智能戰略
我認為最佳模式是企業與科研院所和高校展開深度合作,企業有實實在在的問題和數據,科研院所有算法理論的積累,各自發揮自身的優勢并緊密合作,才能一方面提高企業智能化程度,另一方面提高實驗室的科技成果轉化能力。在這方面,我們國家還有很長的路要走。
三、結語
人工智能技術仍處在非常初級的階段,仍有很多問題沒有解決甚至不知道怎么解決,我們應該理性認識人工智能,使其更好的為工業生產,為居民生活服務。
————————————————
版權聲明:本文為CSDN博主「WangBo_NLPR」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/walilk/article/details/77131929
總結
以上是生活随笔為你收集整理的[科研笔记] 关于人工智能与算法项目的思考的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言再学习 -- 关闭/启动
- 下一篇: C语言再学习 -- Ubuntu 12.