黄学东出任微软全球人工智能首席技术官!全面负责Azure云AI
【新智元導讀】日前,微軟語音識別技術 27 年老將、微軟首位華人技術院士黃學東擔任微軟全球人工智能首席技術官,他將領導新統一的 AI 認知服務工程和研究團隊,全面負責微軟 Azure 云人工智能的工作。
日前,微軟語音識別技術 27 年老將、微軟首位華人技術院士黃學東擔任微軟全球人工智能首席技術官,全面負責微軟 Azure 云人工智能的工作,包括語音、機器翻譯、計算機視覺、自然語言和人工智能認知服務。
根據最新任命,黃學東(技術 Fellow,現為 AI 認知服務首席技術官)將領導新統一的 AI 認知服務工程和研究團隊。黃學東最近領導了認知組織的語音和語言團隊,是 AI 領域全球頂尖專家之一。認知組織中的語音和語言以及計算機視覺團隊將移至 AI 平臺并向黃學東匯報,而 AI 平臺組織中現有的 Form Recognizer,Personalizer 和其他認知服務工程團隊也將向黃學東匯報。
首先我們要祝賀黃學東博士,我們期待微軟 AI 在黃學東博士的帶領下再創佳績!接下來先為大家介紹一下黃學東博士。
一、微軟語音技術創始人,微軟首位華人技術院士
微軟素有 AI 領域“黃埔軍校”的美譽,而微軟全球技術院士代表著技術人員的最高榮譽,到現在,全球也僅有 20 多人獲得這項殊榮,其中就包括黃學東,微軟首位華人技術院士、微軟首席語音科學家。
黃學東
1978 年,15 歲的黃學東進入湖南大學師資班(后來的電子工程系),成為當時校園里年齡最小的學生之一。他先后獲得湖南大學學士學位、清華大學碩士學位和英國愛丁堡大學博士學位。
1993 年,他作為高級研究員加入了微軟研究所并負責組建 Microsoft's 語音識別技術研究團隊。2000 年到 2004 年,他作為 Microsoft's語音識別技術研究團隊的總經理,負責微軟語音技術和產品的研究、開發和市場拓展。
作為微軟的首席語音科學家,黃學東率領團隊實現了 AI 超越人類水平的歷史性里程碑:
2016 年 10 月 18 日,由黃學東帶領的微軟語音團隊在產業標準 Switchboard 語音識別基準測試中,實現了對話語音識別詞錯率(word error rate, 簡稱 WER)低至 5.9% 的突破,首次達成與專業速記員持平而優于絕大多數人的表現。“這是人工智能領域突破性進展之一,意味著有史以來第一次有計算機能像人類一樣,識別對話中的每一個單詞。”黃學東說。
2017 年,在對話語音轉寫任務中,微軟語音識別系統的詞錯率降到 5.1%,準確率超過專業速記員。“可能表面上這個進展不大,但是在‘最后一英里’上,每 0.1 個百分點的進步都很艱難,必須保證系統沒有任何 bug。何況從相對錯誤率降幅角度, 5.9 到 5.1 是一個超過 10% 的相對進步。”
2018 年,在漢英新聞機器翻譯任務中,微軟機器翻譯系統達到了可與人工翻譯媲美的水平。
2019 年,在斯坦福對話式問答任務中,微軟機器閱讀理解系統刷新記錄,成為目前排行榜上唯一一個模型分數超過人類分數的團隊。
二、對話微軟黃學東:語音和語言技術是真正鑲在 AI 皇冠上的明珠
“只有掌握了核心的語音和語言技術,人工智能才有希望,否則其它都是在‘忽悠’。”黃學東認為,在人工智能發展的過程中,語音和語言是皇冠上的明珠。
去年,黃學東做客微軟播客節目,聊了聊他和團隊在語音和語言技術取得的幾個里程碑式的突破。(詳見:對話微軟黃學東:語音和語言技術是真正鑲在 AI 皇冠上的明珠)
黃學東解釋了掌握語音識別、翻譯和對話將如何讓機器從 “感知 AI” 進化到 “認知 AI”,更接近真正的人類智能。此外,黃學東也談到他如何走上語音研究之路,以及他在清華大學和在微軟的人生歷程。
主持人:您是微軟語音和語言組的 Technical Fellow,負責領導微軟的語音工作。我們將在稍后深入討論這些,但首先,作為公司的首席語音科學家,請概括地告訴我們你的工作內容是什么,以及為什么要做這些。你早上起來的動力是什么?
黃學東:我們所做的就是確保我們擁有最好的語音和語言技術,可以用于各種各樣的場景。我們有一整個團隊在做這件事情,因為對話不僅是人們最自然的交流方式,而且這是 AI 最大的挑戰。我們嘗試真正地推動這個領域的突破,在我們的云服務 Azure Services 上提供出色的服務,并確保我們能夠讓微軟內部和微軟之外的客戶滿意。如果你想厘清整個事情,主要有三個方面。
首先,我們有能力去真正提高語音識別的準確性,去驅動語音合成的自然性,以及確保機器翻譯的準確性,例如從英語翻譯成漢語或法語或德語。因此,這背后有很多科學,要確保準確性,自然度,延遲時間,這些技術都是世界級的。這是一方面。
第二方面是,我們不僅提供技術,我們還通過 Azure 提供服務。從 Office 到 Windows, Cortana,它們都依賴于相同的云服務。我們也有邊緣設備,比如我們的語音設備 SDK。我們想要確保在邊緣和云端的語音技術都是以現代的方式提供的,即云平臺和嵌入式平臺。這是第二方面:平臺是現代化的。
第三個方面,是向客戶表達我們的愛。因為我們在世界各地都有廣泛的客戶,我們想讓消費者滿意,并確保使用我們的語音翻譯的客戶體驗是一流的。
這就是我實際上在做的三件關鍵事情:提升 AI 能力,使我們在云端和邊緣設備的平臺實現現代化,以及愛我們的客戶。
三、在人類進化的長河中語音和語言起了決定性的作用,在 AI 的進化中也會如此
在 2018 年新智元產業·躍遷技術峰會上,黃學東分享了微軟在語音、自然語言和機器翻譯研究中不斷“開掛”的歷程和技術細節。黃學東說,人類進化的長河中語音和語言起了決定性的作用,在人工智能的進化當中語音和語言會起到同樣的作用。
黃學東
黃學東談到:達爾文的進化論已經說明,最新的科學驗證也再次證明,我們人和大猩猩 DNA 的相似度接近 99%,就那1% 的區別造就了我們是這個地球的主宰。為什么呢?因為我們更聰明嗎?還是漫長的進化過程當中有什么其他因素?計算機視覺非常重要,但動物的視力其實比人還厲害,晚上的夜貓子看得比人更厲害,但我們仍然是這個地球的主宰,最重要的原因之一是我們的語音和語言。(詳見:AI 翻譯能夠取代人類?微軟黃學東:我們仍在感知智能和認知智能的過渡期)
總結
以上是生活随笔為你收集整理的黄学东出任微软全球人工智能首席技术官!全面负责Azure云AI的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 美航天局关闭斯皮策太空望远镜:16年观测
- 下一篇: 拼多多向湖北捐百万只医疗口罩 半数运往武