谷歌采用神经网络驱动机器翻译,可离线翻译59种语言
?
內(nèi)容來源:ATYUN AI平臺
谷歌的在線翻譯自2016年以來一直由神經(jīng)機(jī)器翻譯(NMT)驅(qū)動,今天,該公司推出了其神經(jīng)網(wǎng)絡(luò)驅(qū)動的方法,以便谷歌翻譯的iOS和安卓應(yīng)用用戶能夠更準(zhǔn)確地實(shí)現(xiàn)59種語言的離線翻譯。
谷歌產(chǎn)品經(jīng)理Julie Cattiau表示,谷歌翻譯小組與谷歌大腦團(tuán)隊一起使用TensorFlow完成了離線NMT。與其他谷歌應(yīng)用不同,95%的谷歌翻譯用戶群不在美國境內(nèi),而在印度,巴西和印度尼西亞等國家。“所以我們從用戶那里得到很多高質(zhì)量的在線信息,但是他們中的很多人無法訪問互聯(lián)網(wǎng)連接,或者他們更愿意保存他們的數(shù)據(jù)計劃。所以我們在過去的一年半時間里把它作為一項重點(diǎn),將我們的NMT模型搭入人們的設(shè)備。”
與以前的機(jī)器學(xué)習(xí)方法通過掃描句子短語提供解釋相比,NMT的離線翻譯可以一次分析整個文本塊,從而允許更自然、更和條理的聲音,以及情境感知翻譯。
連接到互聯(lián)網(wǎng)時,谷歌翻譯應(yīng)用程序中的對話模式可以提供現(xiàn)場語音翻譯。但是,NMT離線翻譯是以純文本翻譯的形式發(fā)布,它不會擴(kuò)展到翻譯應(yīng)用程序中的功能,比如解釋拍攝的菜單或翻譯聲音。
為了使實(shí)時的語音翻譯成為可能,谷歌必須使AI的其他元素結(jié)合起來,才能在離線狀態(tài)下使用對話模式,比如語音識別以及將文字從文本合成到語音。
“這些部件中都需要在設(shè)備上進(jìn)行構(gòu)建,才能獲得完整的體驗,這絕對是我們想要推出的東西,”她說。“目前還沒有確定日期,但文本翻譯無疑是構(gòu)建語音端到端離線翻譯的基石之一。”
獲得離線神經(jīng)機(jī)器翻譯不需要更新程序。之前下載了離線翻譯軟件包的用戶將看到一條橫幅,點(diǎn)擊橫幅就可以離線翻譯,而新用戶必須先進(jìn)入該應(yīng)用并選擇他們想要離線使用的語言進(jìn)行下載。每種語言包大約需要35-45 MB,大小與之前的離線包相當(dāng),但質(zhì)量更高。
?
Cattiau說,“我們無法在低端手機(jī)上運(yùn)行這些耗費(fèi)大量計算能力的模型,因此需要工程師壓縮模型并使其在非常低端的安卓設(shè)備上運(yùn)行。這也是這次發(fā)布的挑戰(zhàn)。”
用戶應(yīng)該注意到這與之前的離線翻譯有所不同,但在線翻譯仍然比離線翻譯更準(zhǔn)確,因為減少了語言包的空間。
與以前使用的基于短語的機(jī)器學(xué)習(xí)方法一樣,NMT利用了數(shù)以億計的文章,書籍,文檔和搜索結(jié)果等示例翻譯。
谷歌的語言能力不僅僅改進(jìn)了翻譯應(yīng)用程序。Alphabet的子公司已承諾在今年年底前為谷歌智能助理提供30多種語言,這個數(shù)字遠(yuǎn)遠(yuǎn)超過支持4種語言的Alexa的和支持20種語言的Siri。
本文轉(zhuǎn)自ATYUN人工智能媒體平臺,原文鏈接:谷歌采用神經(jīng)網(wǎng)絡(luò)驅(qū)動機(jī)器翻譯,可離線翻譯59種語言
更多推薦
你現(xiàn)在可以通過Alexa控制其它設(shè)備
VMware和Nvidia推出用于機(jī)器學(xué)習(xí)的混合云
議員?罪犯?傻傻分不清楚
標(biāo)簽:
智能設(shè)備自然語言處理NLP谷歌
歡迎關(guān)注ATYUN官方公眾號
商務(wù)合作及內(nèi)容投稿請聯(lián)系郵箱:bd@atyun.com
總結(jié)
以上是生活随笔為你收集整理的谷歌采用神经网络驱动机器翻译,可离线翻译59种语言的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手撕神经网络(1)——神经网络的基本组件
- 下一篇: iOS ScrollView的使用教程