揭开《钢铁侠》AI管家贾维斯神秘面纱的扛鼎之作!
《鋼鐵俠》里的AI管家賈維斯,想必大家都不陌生,這樣可以像人一樣和自己對(duì)話的AI管家,我們是不是都想擁有一個(gè)?
賈維斯之所以可以像人一樣和我們對(duì)話,必然離不開(kāi)語(yǔ)音識(shí)別技術(shù)的加持。
如今,從語(yǔ)音輸入法到智能家居等,生活中到處都可以通過(guò)語(yǔ)音進(jìn)行人機(jī)交互。
擁有一個(gè)賈維斯的夢(mèng)想好像越來(lái)越近了!
為了讓這個(gè)夢(mèng)想更近一步,學(xué)習(xí)好語(yǔ)音識(shí)別技術(shù)勢(shì)在必行!
今天,博文菌就給大家推薦一本語(yǔ)音識(shí)別領(lǐng)域的扛鼎之作——《人工智能:語(yǔ)音識(shí)別理解與實(shí)踐(精裝版)》,該書(shū)被列入“國(guó)家出版基金支持項(xiàng)目”,并入選為《人工智能出版工程》系列叢書(shū)。
——?全新升級(jí)?——
2014-2019年,隨著工業(yè)界對(duì)自然口語(yǔ)交互系統(tǒng)的應(yīng)用熱情空前高漲,以及研究界在基于深度學(xué)習(xí)的語(yǔ)音和語(yǔ)言處理技術(shù)上的大幅進(jìn)步,一系列新的甚至顛覆性的理論、技術(shù)、算法應(yīng)用產(chǎn)生了,這使得語(yǔ)音識(shí)別系統(tǒng)在經(jīng)典大詞匯連續(xù)語(yǔ)音識(shí)別任務(wù)上的錯(cuò)誤率大幅下降,甚至逼近了人類水平。
同時(shí),基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù)也取得了長(zhǎng)足進(jìn)展,尤其是任務(wù)型口語(yǔ)對(duì)話系統(tǒng)的各個(gè)模塊都廣泛采用了深度學(xué)習(xí)技術(shù)并有了提升。
本書(shū)作為《解析深度學(xué)習(xí):語(yǔ)音識(shí)別實(shí)踐》的續(xù)作,在它的基礎(chǔ)上做了大量改寫(xiě),并對(duì)內(nèi)容有大幅補(bǔ)充,詳細(xì)總結(jié)了最新的語(yǔ)音識(shí)別算法及應(yīng)用技術(shù),以及在口語(yǔ)對(duì)話系統(tǒng)研究中基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù)。
——?第四代語(yǔ)音識(shí)別技術(shù)?——
作者在背景材料中充分證實(shí)了自20世紀(jì)90年代早期起,語(yǔ)音識(shí)別領(lǐng)域研究者提出的深度動(dòng)態(tài)生成模型(dynamic generative models)的豐富性,同時(shí)將其與最近快速發(fā)展的深度鑒別性模型在統(tǒng)一的框架下進(jìn)行了比較。
書(shū)中以循環(huán)神經(jīng)網(wǎng)絡(luò)和隱動(dòng)態(tài)模型為例,對(duì)這兩種截然不同的深度模型進(jìn)行了全方位有見(jiàn)地的優(yōu)劣比較。這為語(yǔ)音識(shí)別中的深度學(xué)習(xí)發(fā)展和其他信號(hào)及信息處理領(lǐng)域開(kāi)啟了一個(gè)新的激動(dòng)人心的方向。
以深度學(xué)習(xí)為主要內(nèi)容的第四代技術(shù)是本書(shū)所詳細(xì)闡述的,特別是DNN和深度生成模型的無(wú)縫結(jié)合,將使得知識(shí)擴(kuò)展可以在一種最自然的方式下完成。
總的來(lái)說(shuō),本書(shū)可能成為語(yǔ)音識(shí)別領(lǐng)域工作者在第四代語(yǔ)音識(shí)別技術(shù)時(shí)代的重要參考書(shū)。
全書(shū)不但巧妙地涵蓋了一些基本概念,使讀者能夠理解語(yǔ)音識(shí)別全貌,還對(duì)近兩年興盛起來(lái)的強(qiáng)大的深度學(xué)習(xí)方法進(jìn)行了深入地介紹。
讀完本書(shū),讀者將可以看清前沿的語(yǔ)音識(shí)別是如何構(gòu)建在深層神經(jīng)網(wǎng)絡(luò)技術(shù)上的,可以滿懷自信地去搭建識(shí)別能力達(dá)到甚至超越人類的語(yǔ)音識(shí)別系統(tǒng)。
——?兩個(gè)技術(shù)體系的梳理?——
雖然人類的語(yǔ)音感知與語(yǔ)言認(rèn)知天然地作為一個(gè)完整系統(tǒng)在工作,但我們?nèi)匀唤?jīng)常聽(tīng)到一種被廣泛傳播的錯(cuò)誤理解:語(yǔ)音識(shí)別與自然語(yǔ)言處理是兩個(gè)獨(dú)立的技術(shù)體系。
本書(shū)從完整的口語(yǔ)對(duì)話系統(tǒng)角度,梳理了語(yǔ)音識(shí)別與自然語(yǔ)言理解的相互關(guān)系,介紹了口語(yǔ)對(duì)話系統(tǒng)的基本概念、自然語(yǔ)言理解與口語(yǔ)理解的異同,以及對(duì)話狀態(tài)跟蹤與語(yǔ)義理解的異同等。
對(duì)于深度學(xué)習(xí)在理解和對(duì)話中的應(yīng)用,不僅介紹了基于純文本的理解和對(duì)話交互的深度學(xué)習(xí)技術(shù),還介紹了如何在帶有錯(cuò)誤的語(yǔ)音識(shí)別結(jié)果上做更好的語(yǔ)言理解和對(duì)話管理的相關(guān)處理框架與應(yīng)用技術(shù)。
這些深度學(xué)習(xí)技術(shù)是未來(lái)構(gòu)建認(rèn)知型口語(yǔ)交互系統(tǒng)的關(guān)鍵。
我們相信,本書(shū)對(duì)語(yǔ)音識(shí)別、語(yǔ)言理解和口語(yǔ)對(duì)話給出了一個(gè)更為完整的技術(shù)圖譜,它將促進(jìn)真實(shí)世界的人機(jī)智能口語(yǔ)交互系統(tǒng)的技術(shù)發(fā)展,也將有益于機(jī)器學(xué)習(xí)、智能語(yǔ)音及語(yǔ)言處理領(lǐng)域的研究者和實(shí)踐者。
▼
希望本書(shū)能夠帶你打開(kāi)語(yǔ)音識(shí)別的大門(mén),遇見(jiàn)未來(lái)世界!
關(guān)于本書(shū)作者
●?俞棟,電氣電子工程師學(xué)會(huì)會(huì)士(IEEE Fellow)、國(guó)際計(jì)算機(jī)學(xué)會(huì)杰出科學(xué)家(ACM Distinguished Scientist)。現(xiàn)任騰訊人工智能實(shí)驗(yàn)室副主任、騰訊公司杰出科學(xué)家,香港中文大學(xué)(深圳)、上海交通大學(xué)、浙江大學(xué)等多所高校的客座/兼職教授。在基于深度學(xué)習(xí)的語(yǔ)音識(shí)別和分離技術(shù)上進(jìn)行了一系列開(kāi)創(chuàng)性工作,極大地推動(dòng)了語(yǔ)音處理領(lǐng)域的發(fā)展。
●?鄧力,人工智能、機(jī)器學(xué)習(xí)和語(yǔ)音語(yǔ)言信號(hào)處理獲得者著名專家,曾任微軟首席人工智能科學(xué)家和深度學(xué)習(xí)技術(shù)中心研究經(jīng)理。研究方向包括自動(dòng)語(yǔ)音與說(shuō)話者識(shí)別、口語(yǔ)識(shí)別與理解、語(yǔ)音–語(yǔ)音翻譯、機(jī)器翻譯、語(yǔ)言模式、統(tǒng)計(jì)方法與機(jī)器學(xué)習(xí)、聽(tīng)覺(jué)和其他生物信息處理、深層結(jié)構(gòu)學(xué)習(xí)、類腦機(jī)器智能、圖像語(yǔ)言多模態(tài)深度學(xué)習(xí),商業(yè)大數(shù)據(jù)深度分析等,在相關(guān)領(lǐng)域做出了重大貢獻(xiàn)。
●?俞凱,上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系教授,思必馳公司創(chuàng)始人、首席科學(xué)家。清華大學(xué)自動(dòng)化系學(xué)士、碩士,劍橋大學(xué)工程系博士。
●?錢(qián)彥旻,上海交通大學(xué)計(jì)算機(jī)科學(xué)與工程系副教授,博士生導(dǎo)師,上海交大–思必馳聯(lián)合實(shí)驗(yàn)室副主任。華中科技大學(xué)學(xué)士、清華大學(xué)博士、英國(guó)劍橋大學(xué)工程系博士后,上海市青年英才揚(yáng)帆計(jì)劃獲得者。
▊《人工智能:語(yǔ)音識(shí)別理解與實(shí)踐(精裝版)》
俞棟 鄧力 俞凱 錢(qián)彥旻? 著
本書(shū)全面系統(tǒng)地展示了語(yǔ)音識(shí)別、語(yǔ)言理解和口語(yǔ)對(duì)話技術(shù)的完整技術(shù)圖譜,具有非常強(qiáng)的前瞻性,對(duì)促進(jìn)真實(shí)世界的人機(jī)智能口語(yǔ)交互技術(shù)的發(fā)展有積極的促進(jìn)作用;對(duì)于從事機(jī)器學(xué)習(xí)、智能語(yǔ)音及語(yǔ)言處理領(lǐng)域的研究人員和實(shí)踐人員而言,是一本非常有價(jià)值的案頭參考。
總結(jié)
以上是生活随笔為你收集整理的揭开《钢铁侠》AI管家贾维斯神秘面纱的扛鼎之作!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: C语言 冒泡排序
- 下一篇: 发电机变压器运行状态(温度电压电流)监控