扎克伯格预言即将成真:计算机可解读图片内容
從心靈感應到對疾病完全免疫,社交網絡Facebook首席執行官馬克·扎克伯格(Mark Zuckerberg)曾對未來做出過許多大膽預言。現在,扎克伯格的夢想之一即將成為現實,即計算機可用通俗易懂的英語向用戶解讀圖片中的內容。
扎克伯格認為,這種機器將對人機交互產生深遠影響,特別是對那些存在視力障礙的人來說更是如此。他說:“如果我們能夠制造這樣一種計算機:它能夠理解圖片中的內容,并且向看不到圖片的盲人進行描述,這是相當驚人的。而這也是我們正在追求的目標,我希望能夠在10年內實現。”
但在過去一年中,來自多倫多大學、蒙特利爾大學、斯坦福大學以及谷歌的研究團隊已經在開發人工智能項目上取得重大進展,他們研發的人工智能程序可以觀察圖片,確定哪些東西最重要,并用精確而清楚的預言描述它。
這種進展建立于圖片識別算法之上,這些算法現在已經被廣泛應用,比如Google Images和其他面部識別軟件。這個領域正不斷取得進步。它不僅可識別物體,也能將這個物體置入周圍環境中,并對其進行描述。
圖一:本希奧等人研發的機器可正確識別和描述圖片中的內容,其中白色區域參照區,劃線部分為正確匹配的詞匯。
蒙特利爾大學人工智能研究員約書亞·本希奧(Yoshua Bengio)說:“最近我看到的最令人印象深刻的事情就是這些深度學習系統的能力大幅提高,它們可以理解圖片內容,并使用自然預言描述它。”本希奧及其同事最近開發出一臺機器,可以觀察和描述圖片。他們上周在國際機器學習大會山展示了自己的成果。
本希奧說,這臺機器可描述出圖片中相當精確的細節,通過在圖像中尋找關聯最密切的區域,從而生成相關語句。這聽起來似乎不像重大突破,因為即使小孩兒也能輕松描述出圖片上的內容。但是要取得這種成果實際上需要孩子掌握多種認知技能,包括看到物體、識別它們、了解物體與其周圍其他物體之間的關系、條理清晰地描述所看到的內容等。
對于人工智能來說,這是相當艱巨的任務,因為它需要將視覺和自然語言結合,不同于專門的人工智能研究。此外,機器需要了解什么是焦點。據美國驗光學會稱,嬰兒在5個月大的時候開始識別顏色和聚焦于小型物體。小孩子知道重點觀看小女孩,因為她是圖片中的主要角色。但是人工智能不一定具備這種能力,特別是涉及到平面、2D照片時,主要角色可能是相框內的任何東西。
為了幫助機器識別圖片中的主要角色,研究人員用數以千計的圖片訓練它們。本希奧和同事們用12萬張圖片訓練他們的機器,現在其已經可識別出圖片中的物體,同時在描述過程中對圖片中的相關部分進行聚焦。
圖二:在模擬中,當機器生成每個詞匯后,其注意力就會變化,從而反映出圖片中相關部分之間的關系。
可是,當機器聚焦于錯誤目標,或當圖片上有多個人物,抑或是圖像看起來十分復雜時,機器的表現就會直線下降。在下列圖片中,這臺機器描述頂部中間圖片為“一名女子手里抱著鐘”,因為它錯誤地將這名女子衣服上的圖標當成真正的鐘表。
圖三:機器也有犯錯的時候。
此外,這臺機器還可能錯誤識別對象。舉例來說,上面左側上圖中的長頸鹿被誤認為“站在森林中的白色大鳥”。
原文發布時間為:2015-07-31
本文來自云棲社區合作伙伴“大數據文摘”,了解相關信息可以關注“BigDataDigest”微信公眾號
總結
以上是生活随笔為你收集整理的扎克伯格预言即将成真:计算机可解读图片内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《C++面向对象高效编程(第2版)》——
- 下一篇: 找到 mysql 数据库中的不良索引