由WMT机器翻译双向夺冠看搜狗语音交互布局
Alex Graves在《Neural Turing Machines》論文中提到的一句話一直讓陳偉印象深刻——“ What is possible in principle is not always what is simple in practice”。也正因此,“知易行難”成為鐫刻在陳偉行為模式中的一個準則。
陳偉是搜狗語音交互中心總監,他與搜狗語音團隊似乎一直恪守著低調準則:沒有準備好不發布、沒有成果不發聲。9月8日,WMT官方公布成績:搜狗語音交互技術中心-機器翻譯團隊提交的中英和英中系統,獲得了人工評價指標的雙向第一名。
1、
WMT——全稱Workshop on Machine Translation——是由來自歐洲和美國的高校、研究機構的研究人員聯合舉辦的業界公認的國際頂級機器翻譯比賽之一。9月7 日至8日,WMT2017會議于丹麥首都哥本哈根舉行,系全球范圍內最具權威的國際評測大賽。?
從2006年開始到2017年,WMT一共舉辦了12屆機器翻譯比賽,每一屆的角逐,都代表著全球翻譯最尖端水準的較量。今年不同于以往的地方在于,中譯英、英譯中的機器翻譯部分是今年新添加的項目,屬于WNT框架下的第一次。
9月8日,WMT官方公布成績:搜狗語音交互技術中心-機器翻譯團隊提交的中英和英中系統,獲得了人工評價指標的雙向第一名。同時,搜狗語音交互技術中心提交的中譯英系統在20個提交的系統中,獲得八項機器評價指標中的七項第一,并且獲得主要機器指標BLEU(Bilingual Evaluation Understudy)第一名。
據雷鋒網了解,搜狗語音識別團隊成立于2012年,機器翻譯團隊成立于2016年。2012年,陳偉剛剛加入搜狗。那時,團隊僅僅幾個人,主要研究語音識別技術。陳偉稱,從2012年到如今,語音能力一直是團隊重要的技術方向,圍繞語音識別、輸入法的結合,現在基本實現一天語音識別的請求次數高達3億次,屬于國內最大的語音APP。
語音之外,圍繞搜狗的整體戰略,研究自然交互與計算,也是團隊目前的重點?;诖?#xff0c;搜狗語音交互團隊的重心也會逐漸轉移到多模態輸入。“除了單獨的語音的聽、語音識別之外,我們還做了聽與說,也就是合成?!?/p>
另外,陳偉對雷鋒網表示,基于語音的聽說能力,搜狗還研發了一些個性化技術——例如聲紋識別,判斷你是誰,以及是哪類語種、哪種語言,語音分析的能力。
以及,隨著手機近場向遠場技術的發展,例如音箱、電視,搜狗也具備了自己的麥克風等硬件能力,正是在此基礎之上,搜狗考慮將輸入法作為人和人交流表達信息的產品,希望用戶去做跨語言的交流。
2、
一直以來,隨著搜狗語音交互技術的發展,相關硬件產品也逐漸落地,對于互聯網公司為什么要做硬件這一點,陳偉也談了一下他的看法。
-
?第一,看這款產品能夠帶來哪些價值,有鏈接就可以搶占更多入口。
-
第二,現在國內用戶對于軟件付費的意愿不是很強,通過銷售硬件的方式,盈利可能性更高。
-
第三,用戶對于軟件、硬件的遷移成本不一樣,例如用戶對一款智能手表的遷移成本就會比較高,相應的用戶黏性一般也也就較強,這是留住用戶的一種方式。
-
第四,當你的軟件做到一個非常好的效果情況下,你會發現你的頻率很多時候在硬件上,你怎么把體驗做得更好,你必須要對硬件有一定的把控能力。
陳偉對雷鋒網表示,搜狗語音技術的逐漸公開,內在來講,經歷過一段暗自成長的過程。
時間上,從2012年至2016年,這段時間,搜狗將重心放在服務內容產品、沉淀技術上面,從2016年至2017年,是搜狗語音交互技術密集落地的時間。原因上,陳偉對雷鋒網解釋稱,主要是因為經過足夠長時間的沉淀,搜狗語音技術的能力逐漸成熟,在國內已經屬于領先了,“于是我們認為有必要將落地產品拿出來。”
“搜狗一直是以技術為重的公司?!遍_始鉆研AI 技術的時間早于阿爾法狗概念火爆的時間,方向上一直盡量將重心聚焦在輸入法與搜索兩個主產品。
而搜狗將產品真正實現落地的前提之一,就是當時識別技術成熟,并被運用在輸入法上。陳偉介紹稱,搜狗輸入法剛上線時錯誤率達到了30%~40%,如今降至10%,流量也持續上漲。當語音質量穩定在安靜、沒有口音的情況下,準確率可以達到97%。
此外,搜狗圍繞公司戰略逐漸開始業務擴展,比如開始多模態研發、將手寫放到搜狗輸入法上、自研翻譯技術、逐漸圍繞交互形成自己的語音助手,以及目前與四維合作的車展設備、與小米電視、創維電視合作的語音交互技術等,都在逐步落地。
?
3、
技術成熟、產品落地,搜狗語音的下一步在哪里?
語音交互是一個場景非常明朗的狀態,搜狗既希望將這項技術能力輸出,也希望可以探索出語音交互的真實場景在什么地方。因此,搜狗將剛需場景鎖定在車載、智能家居以及可穿戴三個場景,通過與包括小米、創維能較好公司合作深度定制。
2016年8月4日,搜狗推出語音交互引擎“知音”,其后,搜狗打造出“知音OS”語音交互平臺,是一款面向手機、電視、可穿戴、車載設備等智能設備的語音交互平臺。目前,知音OS已經在小米、魅族、創維、海爾等產品中落地應用。
目前,據雷鋒網(公眾號:雷鋒網)了解,目前多家人工智能公司均致力于操作系統與開放平臺的研發與推廣,談到搜狗的獨特性,陳偉稱,相比而言,搜狗知音會更開放一些?!八压窌⒆陨砟芰εc合作方做更多的深入定制,包括經驗與能力層面的交流與交互。相反,其他公司或許相對封閉一些,更傾向于將定制借口掌握在自己手里,輸出封閉的解決方案?!?/p>
同時,目前真正有能力將語音交互做到閉環的公司少之又少,從前端硬件結構,到后端識別合成、語義理解,再加上翻譯,這些能力全部具備的公司并不多。但搜狗所具備的獨特優勢是,不斷進行的產品迭代,可以讓搜狗無論從搜索本身形成的知識積累、或是已有產品貢獻出的用戶數據,均積累成大規模的用戶資源,進而將整個交互場景搭建得更為完善。“要將語音交互做到通用是比較難的,更多還是要圍繞垂直層面發力?!标悅ケ硎?。
至于知音OS系統的推廣時間,陳偉稱,目前整個團隊正朝大規模推廣方向走,但細水長流,還沒有確定的時間點,需要等到整個團隊建立穩定的吞吐能力、標準化體系、以及最適合自己的場景。“大方向還是由搜狗搭建技能平臺,由用戶自己去自定義、自定制?!?/strong>
本文作者:呂倩 本文轉自雷鋒網禁止二次轉載,原文鏈接
總結
以上是生活随笔為你收集整理的由WMT机器翻译双向夺冠看搜狗语音交互布局的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网络语言C位意思,网络流行语“C位出道”
- 下一篇: PL3369C-ASEMI原边电源IC芯