距离语音交互技术的更大范围应用,还差点什么?
上一次大家對(duì)語(yǔ)音技術(shù)有這么濃厚的興趣還是在幾年前,關(guān)注的對(duì)象是手機(jī)上的語(yǔ)音助手,如 Siri、Google Now 等。一開(kāi)始大家對(duì)這種語(yǔ)音對(duì)話(huà)的形式感到很有趣,但嘗試一段時(shí)間后發(fā)現(xiàn),除了讓它講個(gè)笑話(huà)以及偶爾調(diào)戲一下逗逗樂(lè)子以外,再也想不到要喚醒它干嘛。終于,大多數(shù)人都漸漸遺忘了這個(gè)停留在角落里的虛擬語(yǔ)音助手。
這一次,一個(gè)新的帶有語(yǔ)音交互功能的產(chǎn)品再一次引起了人們的注意,并在實(shí)際體驗(yàn)兩年之后仍然興趣不減、好評(píng)不斷,這款產(chǎn)品就是 Amazon Echo。如果要用一句話(huà)來(lái)概括描述它,可以說(shuō)它是一款「能聽(tīng)懂你對(duì)它說(shuō)的話(huà)并在一定程度上給以有效反饋的智能助手」,如果浮夸一點(diǎn)宣傳或者更好理解,可以說(shuō)成它是真實(shí)版的的賈維斯(《鋼鐵俠》里的 JARVIS)。
國(guó)內(nèi)目前還沒(méi)有一個(gè)相對(duì)比較成功的同類(lèi)產(chǎn)品,所以不太清楚國(guó)內(nèi)用戶(hù)怎么看待語(yǔ)音交互技術(shù)以及會(huì)不會(huì)喜歡這類(lèi)產(chǎn)品。有一些分析類(lèi)的文章很正經(jīng)地解釋說(shuō),由于東西方的文化差異,這類(lèi)產(chǎn)品在國(guó)內(nèi)比較難流行開(kāi),因?yàn)槲覀儽容^含蓄,不太喜歡這樣直接地和一個(gè)硬件產(chǎn)品進(jìn)行語(yǔ)音對(duì)話(huà)。這顯然是想當(dāng)然了,西方的扎克伯格(Facebook CEO Mark Zuckerberg)表示,他在某些情況下也不喜歡使用語(yǔ)音給他自己開(kāi)發(fā)的人工智能助手賈維斯下指令,因?yàn)槿鄙倜孛苄砸约皶?huì)打擾到別人等。
可見(jiàn)在「跟機(jī)器人對(duì)話(huà)」這件事上無(wú)論東方西方大家都是一樣有心理「障礙」,關(guān)鍵在于正確認(rèn)識(shí)到「語(yǔ)音不是萬(wàn)能的」,找對(duì)語(yǔ)音的應(yīng)用場(chǎng)景并且把使用體驗(yàn)做到最好,對(duì)語(yǔ)音技術(shù)的應(yīng)用普及會(huì)有很有幫助。
所以 Echo 是怎么做的?
據(jù)彭博社的報(bào)道,Echo 團(tuán)隊(duì)最初在設(shè)計(jì)的時(shí)候并沒(méi)有考慮主打音樂(lè)功能,只是在內(nèi)測(cè)的時(shí)候發(fā)現(xiàn),大家常用的功能是用語(yǔ)音搜歌,所以就加強(qiáng)了音質(zhì)方面的特性,把產(chǎn)品的體積做大了。而在之后,一個(gè)工程師嘗試著把語(yǔ)音功能接入智能硬件的控制,更加深受用戶(hù)喜歡,成為引爆銷(xiāo)量和好評(píng)的一個(gè)刺激因素。
具體大家都用 Echo 來(lái)干嘛呢?可以在 Amazon 的官網(wǎng)上找到很詳盡的很用心寫(xiě)的評(píng)論和使用感受,例如——
「只要叫一聲她的名字然后說(shuō)出我們想要做的事情,Echo 都能用一種很美妙的聲音即時(shí)響應(yīng)然后幫你完成,無(wú)論你是坐在客廳還是在屋里走動(dòng)著,她一直在那里準(zhǔn)備著聆聽(tīng)?!?br />「我會(huì)讓她幫我在 Amazon 上下訂單購(gòu)買(mǎi)東西、查詢(xún)天氣和我的日程安排,調(diào)節(jié)室內(nèi)的溫度」
「Alexa,這首歌是誰(shuí)唱的?點(diǎn)贊,下一首,暫停播放,播放 Awolnation 的 Sail,把這首歌添加到我的播放列表,播放我 Spotify 里的某某播放列表」
「尤其是當(dāng)你在廚房做飯的時(shí)候,你就可以直接讓 Echo 幫你下訂單要買(mǎi)的東西,再也不用擔(dān)心忘記要買(mǎi)什么東西了」
「我不用再擔(dān)心忘記重要的事情了,她會(huì)提醒我吃藥,提醒我待會(huì)去看醫(yī)生」
「早上醒來(lái)跟 Alexa 說(shuō)早上好,她會(huì)說(shuō),早上好,今天是 Danny 的生日,記得準(zhǔn)備禮物~」
「每天會(huì)讀我選定的新聞簡(jiǎn)報(bào)給我」
「幫我朗讀我 Kindle 里的所有書(shū),不是機(jī)器的聲音,聽(tīng)起來(lái)很舒服」
Echo 能做的事情越來(lái)越多,包括音樂(lè)搜索和控制、控制智能硬件、設(shè)置鬧鐘、查天氣、查百科、設(shè)置提醒、讀新聞、日程提醒、語(yǔ)音購(gòu)物一鍵下單并支持查詢(xún)物流狀態(tài)……等等各種豐富且實(shí)用、使用體驗(yàn)很贊的功能。
之所以深受喜歡可能有這幾個(gè)原因:
1.合成音比較接近人聲,不是突兀的機(jī)器聲,聽(tīng)起來(lái)感覺(jué)很舒服;
2.技術(shù)足夠好,系統(tǒng)能快速響應(yīng),不用說(shuō)一段話(huà)之后傻等著;
3.數(shù)據(jù)全且更新即時(shí),總能提供令人出乎意料的服務(wù)。
其實(shí)兩年前,國(guó)內(nèi)就有類(lèi)似的嘗試,比如「小智音箱」,核心功能同樣是音樂(lè)及智能家居控制,但不是很成功,其聯(lián)合創(chuàng)始人李傳豐曾分享過(guò)這樣的思考為什么中國(guó)市場(chǎng)無(wú)法誕生Amazon Echo?
總結(jié)一下,大概有這些因素:
1、在國(guó)內(nèi),音頻產(chǎn)品的價(jià)格80%在200塊以?xún)?nèi),超過(guò)500塊的產(chǎn)品月銷(xiāo)量很難超過(guò)一萬(wàn)臺(tái)。
2、語(yǔ)音交互要做到好的使用體驗(yàn),快速響應(yīng)是最根本的需求,其他如合成音的質(zhì)感、更全的數(shù)據(jù)和算法,要做到這些成本低不了;
3、國(guó)內(nèi)音樂(lè)版權(quán)集中在幾大巨頭手中,對(duì)于創(chuàng)業(yè)公司來(lái)說(shuō),很難做到用戶(hù)想聽(tīng)什么就有什么,進(jìn)而影響用戶(hù)體驗(yàn);
4、國(guó)內(nèi)玩智能硬件的本來(lái)就不多,廠商和品牌倒是挺多,除非你自己做到足夠牛逼,否則沒(méi)人愿意跟你合作
5、需要一段很長(zhǎng)時(shí)間都看不到收獲的技術(shù)積累期(Echo 用了三年多時(shí)間)
如今兩年過(guò)去了,以上提到的這些狀況似乎并沒(méi)有多少改變。雖然人們?cè)谥饾u接受語(yǔ)音輸入這種形式,開(kāi)始有更多的人在嘗試使用語(yǔ)音輸入法,但在國(guó)內(nèi)「語(yǔ)音交互」這種和機(jī)器進(jìn)行對(duì)話(huà)的形式看似還比較遙遠(yuǎn)。
比如,目前來(lái)看,比較適合用語(yǔ)音交互的兩個(gè)場(chǎng)景——車(chē)內(nèi)導(dǎo)航和智能家居領(lǐng)域,已經(jīng)有很多支持語(yǔ)音交互的產(chǎn)品,但是真正使用的人很少。
產(chǎn)品的設(shè)計(jì)是很理想的——坐到車(chē)上系安全帶的時(shí)候順便說(shuō)一句「導(dǎo)航到XXX」,然后開(kāi)車(chē)就出發(fā)了,但事實(shí)是,人們寧愿掏出手機(jī)打字;在智能家居的宣傳中,有很多智能場(chǎng)景對(duì)大多數(shù)人來(lái)說(shuō)無(wú)感的,「這些智能場(chǎng)景看起來(lái)很贊,但我不知道對(duì)我有什么用」或者說(shuō)「這些場(chǎng)景看起來(lái)離我的生活很遠(yuǎn)」 。比如「說(shuō)句話(huà)就能開(kāi)燈」這對(duì)用戶(hù)會(huì)有多大吸引力?以及,對(duì)于大多數(shù)人來(lái)說(shuō),好像生活還沒(méi)有忙到需要一個(gè)「智能助理」來(lái)幫助做日程管理。
因此,語(yǔ)音交互技術(shù)在推廣上或許還要首先找到最適合的用戶(hù)群和真正有價(jià)值的使用場(chǎng)景。比如,對(duì)于語(yǔ)音操控的宣傳似乎要再弱化一點(diǎn),一方面是因?yàn)槟壳霸趪?guó)內(nèi)可以稱(chēng)得上智能家居的智能硬件在國(guó)內(nèi)并沒(méi)有很普及,另一方面語(yǔ)音操控在實(shí)際生活中真正使用頻率可能沒(méi)有那么高(Facebook 的 CEO 扎克伯格也分享過(guò)這方面的體會(huì))。舉例來(lái)說(shuō),「在門(mén)上加一個(gè)傳感器、回到家打開(kāi)門(mén)的瞬間燈就會(huì)自動(dòng)開(kāi)啟」這個(gè)功能比「回到家對(duì)著空氣喊一聲開(kāi)燈」顯然體驗(yàn)要更好一些。
而在語(yǔ)音問(wèn)答內(nèi)容的提供上,應(yīng)該是一個(gè)非常復(fù)雜而龐大的工作量。據(jù) Amazon 創(chuàng)始人 杰夫·貝索斯 2016 年在 Recode 大會(huì)上透露,Alexa 和 Echo 的研發(fā)團(tuán)隊(duì)已經(jīng)超過(guò)了一千人??梢?jiàn)要達(dá)到讓更大范圍人群滿(mǎn)意的效果,針對(duì)不同人群的各種細(xì)分領(lǐng)域,需要很長(zhǎng)時(shí)間的積累。
音樂(lè)、電臺(tái)、有聲讀物、訂閱領(lǐng)域的新聞等,是語(yǔ)音交互類(lèi)產(chǎn)品最適宜輸出的內(nèi)容,也是看似可以培養(yǎng)起來(lái)的用戶(hù)習(xí)慣。早間起床洗漱到出門(mén)上班和晚上睡前的這兩段時(shí)間,是智能音箱最有發(fā)揮空間的時(shí)間段。對(duì)于語(yǔ)音搜歌的形式,前幾年有一款產(chǎn)品叫 Jing,可以通過(guò)「自然語(yǔ)言」搜歌,是一款非常受歡迎的小眾產(chǎn)品,可以直接用語(yǔ)言描述來(lái)搜索歌曲,如「今天陽(yáng)光很好」、「外邊下雨了」、「我在閱讀」「想聽(tīng)西方古典輕音樂(lè)」等,個(gè)人覺(jué)得這是可供參考的一個(gè)模型。
除了場(chǎng)景和用戶(hù)群以外,最為關(guān)鍵的還是語(yǔ)音技術(shù)本身。比如要做到快速響應(yīng)、遠(yuǎn)場(chǎng)精準(zhǔn)識(shí)別等,這是良好用戶(hù)體驗(yàn)的根本,但應(yīng)該也是門(mén)檻比較高的事情,需要足夠的技術(shù)積淀。Echo 實(shí)現(xiàn)了一秒內(nèi)快速響應(yīng),使用熱詞喚醒之后基本不用再等系統(tǒng)響應(yīng)就能直接繼續(xù)對(duì)話(huà),這也在一定程度上避免了和機(jī)器進(jìn)行語(yǔ)音交互的尷尬。
但另一方面,智能音箱以及相應(yīng)領(lǐng)域的產(chǎn)品,也絕不是技術(shù)制勝的,考驗(yàn)的是團(tuán)隊(duì)對(duì)場(chǎng)景的把握及運(yùn)營(yíng)能力。畢竟它并不是一個(gè)可規(guī)劃的單一功能,也不是一家公司所能完全覆蓋得了,而更像是一個(gè)宏大的「生態(tài)」,有賴(lài)技術(shù)應(yīng)用領(lǐng)域的全面發(fā)展,互為依托,如物聯(lián)網(wǎng)、智能家居應(yīng)用的普及,各類(lèi)內(nèi)容源及場(chǎng)景規(guī)劃的合作等。
期待好產(chǎn)品。
https://zhuanlan.zhihu.com/p/25279998https://zhuanlan.zhihu.com/p/25279998
總結(jié)
以上是生活随笔為你收集整理的距离语音交互技术的更大范围应用,还差点什么?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 原子跨链交易
- 下一篇: EOS声称的每秒百万级的交易速度靠谱么?