吴恩达:大数据终将帮助机器拥有自主智慧
福布斯網(wǎng)站對(duì)加盟百度人工智能實(shí)驗(yàn)室的吳恩達(dá)進(jìn)行了專訪。文章指出,招納吳恩達(dá),體現(xiàn)了百度希望通過研發(fā)世界一流技術(shù),將自身打造為世界前列的創(chuàng)新型公司的愿景。在以下訪談中,吳恩達(dá)透露了他將如何幫助百度實(shí)現(xiàn)這一愿景。
以下為文章主要內(nèi)容:
今年5月百度在硅谷創(chuàng)立了人工智能實(shí)驗(yàn)室,并將吳恩達(dá)納入麾下,任命為百度首席科學(xué)家。作為斯坦福大學(xué)計(jì)算機(jī)科學(xué)教授,吳恩達(dá)曾是Google Brain項(xiàng)目的負(fù)責(zé)人,并聯(lián)合創(chuàng)建了在線教育初創(chuàng)企業(yè)Coursera。讓百度成為國際化企業(yè)的發(fā)展規(guī)劃中,吳恩達(dá)不失為核心人物。
問:你是如何對(duì)人工智能產(chǎn)生興趣的?
答:過去我只是認(rèn)為,讓機(jī)器具備人工智能是再酷不過的事。高中暑假期間,我在新加坡國立大學(xué)做人工智能方面的實(shí)習(xí)生,任務(wù)是編寫神經(jīng)網(wǎng)絡(luò)。它是深度學(xué)習(xí)算法的雛形。我覺得編寫出能夠自我學(xué)習(xí)并做出預(yù)測(cè)的軟件是很有意思的。
如果我們能夠讓電腦更加智能,并更好地理解這個(gè)世界和環(huán)境,我們可以讓許多人的生活變得更美好。正如同工業(yè)革命把我們從體力勞作中解放,我認(rèn)為人工智能也存在巨大潛能,未來能夠讓我們擺脫大量單調(diào)重復(fù)的腦力勞動(dòng)。
問:曾經(jīng)有段時(shí)間,由于進(jìn)展不順,你對(duì)人工智能喪失了興趣,是嗎?
答:人工智能的遠(yuǎn)大前景是,機(jī)器總有一天將演變成像人類那樣,能夠完成一些具有自主智慧的任務(wù)。我剛進(jìn)入斯坦福大學(xué)時(shí),并不認(rèn)為這種前景是可行的,因此當(dāng)時(shí)有點(diǎn)困惑。人類的智慧或許是依賴某種學(xué)習(xí)算法,這是有據(jù)可依的。因此,我認(rèn)為或許我們可以模仿人類大腦,建立更像人腦的智能,從而迅速取得進(jìn)展。這些理念存在已久,但人工智能專家和人腦啟發(fā)軟件商N(yùn)umenta的聯(lián)合創(chuàng)始人杰夫?霍金斯(Jeff Hawkins)為普及這些理念做了不少貢獻(xiàn)。
問:真正實(shí)現(xiàn)這些設(shè)想,你當(dāng)前的進(jìn)展如何?
答:我們與真正的成功距離遙遠(yuǎn)。我們面臨很多問題。其中之一就是達(dá)不到應(yīng)有的規(guī)模。當(dāng)前我們對(duì)圖像的處理規(guī)模遠(yuǎn)遠(yuǎn)不足。其二,我很肯定我們還未摸索出正確的算法。
問:但為什么近幾年人們又重新燃起了對(duì)人工智能的興趣和關(guān)注?
答:大約在四年前,2010年底,我們已經(jīng)摸索出了許多算法,并意識(shí)到要推動(dòng)人工智能技術(shù)更上一層樓的最大瓶頸是規(guī)模。如果我們使用現(xiàn)在的電腦運(yùn)行20世紀(jì)80年代編寫的軟件,效果比使用那個(gè)年代的電腦要好很多。
因此2010年年底,我在硅谷尋求可能擴(kuò)大算法規(guī)模的途徑。谷歌擁有很多電腦,因此我在谷歌啟動(dòng)了一個(gè)項(xiàng)目,利用這些算法打造了規(guī)模超乎以往的神經(jīng)網(wǎng)絡(luò)。現(xiàn)在回想起來,這個(gè)項(xiàng)目取得成功的關(guān)鍵在于研發(fā)團(tuán)隊(duì)所接受的指令很單純:建立盡可能大的神經(jīng)網(wǎng)絡(luò)。
問:你是指2012年Google Brain項(xiàng)目,當(dāng)時(shí)該項(xiàng)目的神經(jīng)網(wǎng)絡(luò)成功地識(shí)別出貓的圖像。
答:對(duì)。谷歌的神經(jīng)網(wǎng)絡(luò)竟然能夠自己發(fā)現(xiàn)貓的定義,非常了不起。從來沒有人告訴它什么是貓。那是機(jī)器學(xué)習(xí)的一個(gè)里程碑。這對(duì)許多公司,如Facebook、百度等等,都具有啟發(fā)作用。
問:對(duì)這些公司而言,這一項(xiàng)目引人注目之處體現(xiàn)在哪里?
答:大多數(shù)具有經(jīng)濟(jì)效益的應(yīng)用,到目前為止僅僅是從經(jīng)過標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。以語音識(shí)別為例。百度和谷歌已提高了語音的識(shí)別效果,他們依據(jù)的理論基礎(chǔ)是,深度學(xué)習(xí)算法可以接納海量的、轉(zhuǎn)錄為文本的語音數(shù)據(jù)。這就是經(jīng)過標(biāo)記的數(shù)據(jù)。由此我們可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。
從長(zhǎng)遠(yuǎn)來看,還有種不同類型的深度學(xué)習(xí),我對(duì)此感到很興奮。它被稱作無監(jiān)督學(xué)習(xí)(unsupervised learning),是指從未經(jīng)標(biāo)記的數(shù)據(jù)展開學(xué)習(xí),這更接近人腦的學(xué)習(xí)方式。Google Brain項(xiàng)目對(duì)貓的識(shí)別就是這方面的例子。我們?cè)?jīng)讓神經(jīng)網(wǎng)絡(luò)連續(xù)一星期觀看YouTube的視頻,并且不作任何提示。一周后,我們做了測(cè)試,看看它學(xué)會(huì)了什么。結(jié)果它學(xué)會(huì)了識(shí)別人臉、貓臉和其他一些事物。從某種程度上,這是人工智能的一項(xiàng)重大進(jìn)展。當(dāng)前,監(jiān)督學(xué)習(xí)是促使深度學(xué)習(xí)技術(shù)產(chǎn)生經(jīng)濟(jì)效應(yīng)的重要功臣。而無監(jiān)督學(xué)習(xí)與它不是同一概念。
問:你為什么看好無監(jiān)督學(xué)習(xí)?
答:原因之一是,無監(jiān)督學(xué)習(xí)最接近動(dòng)物和嬰兒的學(xué)習(xí)方式。如果想讓當(dāng)前的神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)識(shí)別汽車,我們的做法是尋找5萬張汽車圖片,并把他們標(biāo)記成汽車,再將這些標(biāo)記數(shù)據(jù)輸入到監(jiān)督學(xué)習(xí)算法中。而孩子如何學(xué)會(huì)認(rèn)識(shí)汽車呢?沒有哪對(duì)父母會(huì)弄來5萬輛汽車的圖片。大多數(shù)神經(jīng)科學(xué)家相信,大多數(shù)動(dòng)物和孩子的學(xué)習(xí)僅僅是通過融入世界、親身體驗(yàn)世界完成的。如果我們能在這方面取得進(jìn)步,就能讓神經(jīng)網(wǎng)絡(luò)系統(tǒng)更好地理解圖像。
第二個(gè)原因在于,對(duì)于某些依賴監(jiān)督學(xué)習(xí)的應(yīng)用,我們能夠提供的數(shù)據(jù)有限,從而限制了它的發(fā)展?jié)摿Α@?#xff0c;醫(yī)療成像方面,全國進(jìn)行的X射線掃描次數(shù)畢竟有限,因此能夠得到的圖像數(shù)據(jù)也受到限制。
問:現(xiàn)在就職于百度實(shí)驗(yàn)室,你關(guān)注的焦點(diǎn)是不是無監(jiān)督學(xué)習(xí)?
答:它是初期的重要事項(xiàng)之一。無監(jiān)督學(xué)習(xí)面臨更多困難,前人的成功經(jīng)驗(yàn)更少,而且不知道正確算法是什么。
問:如今存在一種趨勢(shì),即人們傾向于研究移動(dòng)設(shè)備的計(jì)算和通信。此外,感官數(shù)據(jù)也在呈現(xiàn)爆發(fā)之勢(shì)。這兩個(gè)因素是否引發(fā)了人們對(duì)人工智能的熱潮?
答:還有其他因素。大數(shù)據(jù)的發(fā)展源于兩個(gè)趨勢(shì)。第一,社會(huì)數(shù)字化的日益深入,衍生出電腦能夠處理的電子數(shù)據(jù)。第二,存儲(chǔ)和計(jì)算成本不斷降低,最終使存儲(chǔ)和處理所有這些數(shù)據(jù)的費(fèi)用降至可承擔(dān)的范圍內(nèi)。如果社會(huì)數(shù)字化持續(xù)發(fā)展,存儲(chǔ)和計(jì)算成本繼續(xù)下滑,大數(shù)據(jù)最終會(huì)發(fā)展成為一種潮流。
問:對(duì)于百度人工智能實(shí)驗(yàn)室,你短期或中期的具體規(guī)劃是什么?
答:百度擁有三個(gè)實(shí)驗(yàn)室,兩個(gè)北京的實(shí)驗(yàn)室已初具規(guī)模,而位于硅谷的人工智能實(shí)驗(yàn)室大部分是空蕩蕩的,才剛剛起步。我們招募新成員的速度很快,一周就招進(jìn)一名成員,到今天為止,我們已經(jīng)招了6個(gè)人。目前為止,他們都來自硅谷,而且都接受了我們發(fā)出的offer。我們還同硅谷以外的少數(shù)人接觸,這需要更多的時(shí)間。我們還有很多工作要做。
問:對(duì)硅谷人工智能實(shí)驗(yàn)室,你心中是否已畫好藍(lán)圖,例如,是否會(huì)效仿貝爾實(shí)驗(yàn)室、施樂帕克研究中心、谷歌或微軟?
答:此前我曾與這些實(shí)驗(yàn)室的主管交談過。今天早上我會(huì)見了SRI實(shí)驗(yàn)室的比爾?馬克,之前也與許多相關(guān)領(lǐng)域的人交談,如施樂帕克研究中心的前主管。我曾在Google X實(shí)驗(yàn)室工作。很久以前,本科期間和博士學(xué)位攻讀早期的每年夏天,我都在AT&T貝爾實(shí)驗(yàn)室中實(shí)習(xí)。不斷向他人學(xué)習(xí)、態(tài)度謙遜是很重要的。
問:一個(gè)成功的實(shí)驗(yàn)室最重要的因素是什么?
答:團(tuán)隊(duì)文化。
問:從一開始就要正確定位,這點(diǎn)很重要。如果一開始就走偏方向,要糾正是很困難的。你是怎么看?
答:初期過后,即使要做出些許改變也是很困難的。最關(guān)鍵在于,任務(wù)是什么。我所任職過的所有機(jī)構(gòu)都以任務(wù)為主要?jiǎng)恿Αoursera的使命是讓每一個(gè)人享受教育,因此我們決定要實(shí)現(xiàn)這一任務(wù)的最佳途徑是創(chuàng)建Coursera這家公司。現(xiàn)在,我面臨的任務(wù)是通過人工智能技術(shù)改變世界。而我有種強(qiáng)烈的感覺,要實(shí)現(xiàn)這一點(diǎn),最有效的方式是加盟百度。
問:為什么選擇百度?
答:百度已經(jīng)擁有非常先進(jìn)的深度學(xué)習(xí)技術(shù)。它的深度學(xué)習(xí)實(shí)驗(yàn)室負(fù)責(zé)人余凱是深度學(xué)習(xí)方面的專家。深度學(xué)習(xí)對(duì)百度的核心產(chǎn)品,如網(wǎng)頁搜索、廣告、語音識(shí)別、光學(xué)字符識(shí)別等等,具有重要意義。李彥宏對(duì)人工智能抱有很大的熱情。
我加入百度有三個(gè)原因。
其一,人工智能是一項(xiàng)資本密集型技術(shù)。要取得進(jìn)展,則需要數(shù)據(jù)和計(jì)算機(jī)資源的支持。數(shù)據(jù)比計(jì)算機(jī)資源更難獲得,但兩者缺一不可。
第二是靈活性。作為一個(gè)大企業(yè),百度擁有著令人難以置信的靈活性。舉個(gè)例子,余凱想要?jiǎng)?chuàng)建一個(gè)圖形處理器集群,在做完決定后,很快就付諸實(shí)踐了。
第三就是員工的積極性。百度的工程師工作非常賣力。
問:在百度你打算如何展開未來的工作?除了互聯(lián)網(wǎng)應(yīng)用以外,是否會(huì)投入對(duì)機(jī)器人、無人駕駛車等類似產(chǎn)品的研究?
答:最初,我們只打算把焦點(diǎn)放在技術(shù)上。通常我傾向于先以產(chǎn)品為立足點(diǎn),再考慮技術(shù)。縱觀硅谷,大多數(shù)失敗不是因?yàn)榻鉀Q不了困難的技術(shù)問題,而是因?yàn)樽罱K發(fā)現(xiàn),費(fèi)心費(fèi)力解決的問題其實(shí)根本無人問津。
深度學(xué)習(xí)這項(xiàng)技術(shù)很不同,它在百度的許多產(chǎn)品中都已得到應(yīng)用。人工智能對(duì)許多事物都具有重大意義。因此我不必?fù)?dān)心我們的研究?jī)?nèi)容對(duì)當(dāng)前或未來的產(chǎn)品是否具有實(shí)用性。
問:你將如何利用百度的技術(shù)基礎(chǔ)設(shè)施?是否需要建造一些新的設(shè)施?
答:我在摸索如何利用當(dāng)前的基礎(chǔ)設(shè)施和開發(fā)工具使深度學(xué)習(xí)團(tuán)隊(duì)能夠高效地產(chǎn)生新想法并進(jìn)行測(cè)試及學(xué)習(xí)。例如,許多語音識(shí)別實(shí)驗(yàn)的實(shí)施大約需要一周。如果一周后才能獲得結(jié)果反饋,就很難高效地進(jìn)行學(xué)習(xí)。如果將時(shí)間減半,就能使團(tuán)隊(duì)的效率翻一番。
問:未來可能會(huì)研發(fā)出什么樣的新技術(shù)?
答:我希望能夠使百度當(dāng)前的深度學(xué)習(xí)應(yīng)用得到持續(xù)改進(jìn),如搜索、廣告、語言翻譯、光學(xué)字符識(shí)別和語音識(shí)別。
技術(shù)的進(jìn)步分為兩種。一種是漸進(jìn)的,這種進(jìn)步會(huì)受到人們的歡迎。例如,如果我們能夠把網(wǎng)頁搜索的性能提升5%,許多用戶都將從中受益。
問:另一種呢?
答:另一種技術(shù)的進(jìn)步是突破性的,它將推進(jìn)前所未有的新應(yīng)用的誕生。例如,如果語音識(shí)別技術(shù)進(jìn)展到能夠無障礙識(shí)別人類語言的程度,那么它將創(chuàng)造一種全新的手機(jī)互動(dòng)模式。試想一下,如果我們?cè)陂_車,哪怕車內(nèi)很吵,我們?nèi)钥梢酝ㄟ^向手機(jī)輸入語音來向朋友發(fā)短信。這在現(xiàn)在根本無法實(shí)現(xiàn)。
如果我們能夠真正解決語音識(shí)別問題,我想圍繞語音界面對(duì)手機(jī)進(jìn)行重新設(shè)計(jì)。或許未來移動(dòng)設(shè)備上的email應(yīng)用只需兩個(gè)按鈕:回復(fù)和刪除。這只是我的想法,不一定可行。但這說明了,一些核心技術(shù)的突破將使人們的生活產(chǎn)生巨大的變化。
本文來源于"中國人工智能學(xué)會(huì)",原文發(fā)表時(shí)間""
總結(jié)
以上是生活随笔為你收集整理的吴恩达:大数据终将帮助机器拥有自主智慧的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《CCNP SWITCH 300-115
- 下一篇: 《易学C++(第2版)》——1.10 习