人工智能在音频链中找到自己的声音
人工智能在音頻鏈中找到自己的聲音
AI finds its voice in audio chain
硅基silicon-based麥克風的出現重塑了音頻領域。但在未來幾年,市場研究公司Yole Dédevelopment堅信人工智能將引領市場的演變和變革。
對話是自然的,這就是為什么正在成為人機交互的主要界面。基于語音的個人助理(VPA)在智能手機、智能揚聲器、智能手表、無線耳機、汽車、智能電視及其遙控器等領域越來越受歡迎。現在甚至有垃圾桶集成了語音識別。采用曲線將在未來增長,真正的價值在于高音質和對話筒周圍環境的了解。
對于yoledédevelopement(法國里昂)來說,音頻是下一個被人工智能(AI)入侵的部分。
How AI has found its voice
人工智能如何找到自己的聲音
基于語音的VPA是當今音頻行業的主要驅動力。基于音頻系統的傳統組件,如音頻編解碼器、麥克風、微型揚聲器和音頻放大器,還使用人工智能來計算和分析語音數據。計算機支持復雜的音頻功能,如語音識別和源定位。可以在云端執行,也可以在消費者設備的邊緣執行。分析是在云端進行的,需要很高的處理能力和對大量數據的訪問。
“人工智能的附加值用于自然語言處理,”Yole光子學和傳感部門的技術和市場分析師Dimitrios Damianos說。“聲音是與機器互動的更自然的方式。不必使用鍵盤。不用用手。不過,要做到這一點,還需要做大量的處理才能理解用戶在說什么、語言以及意思。“人工智能正在增加解碼的價值,并幫助與設備進行通信。”
當被問及VPA的快速滲透時,Damianos將其歸因于其便利性和高效性。但是,當然,“相信并正在看到的是,像谷歌、蘋果、Facebook、亞馬遜和微軟(統稱為GAFAM)這樣的大型科技公司試圖推廣這些VPA,因為提取的數據具有真正的價值。”
對于用戶來說,音頻比圖像更容易被接受。Yole MEMS和傳感器部門的技術和市場分析師亞歷克西斯·德布雷(Alexis Debray)繼續說,認為音頻“干擾性較小,因此這是GAFAM(主要業務是數據)向人收集數據的好方法。”。“一些公司用數據做生意,而另一些公司則用隱私和技術來確保用戶的隱私。”例如,蘋果鼓吹隱私,并將其作為一種強大的營銷資產。
Damianos說,大型科技公司的實際價值在于從環境中盡可能多地提取信息,這意味著VPA不僅能傾聽用戶的聲音,還可以傾聽周圍的環境,了解環境。例如,“如果在廚房里,麥克風可以聽到刀架在柜臺上的聲音,并立即理解在廚房里并提出菜譜建議。”這就是會話式人工智能。
對話式人工智能之后的下一步很可能是全意識,虛擬助手,無論是智能揚聲器還是智能手表,都能像人類一樣與用戶進行交流。達米亞諾斯說,完全的意識是概念性的,并伴隨著問號。“還不知道時間表,但也許會在對話人工智能之后,在5到6年內到達。這將取決于人工智能的進步和該領域的公司(不斷發展)。”
雖然這些始終監聽的系統可以挽救汽車人機界面的生命,但也引起了對用戶隱私保護的擔憂。為了防止可能的誤用,德布雷強調,數據處理應盡快進行,并盡可能靠近麥克風。“越靠近麥克風進行治療,隱私泄露的可能性就越小。”
隱私包括多個維度,因為用戶可能希望隱藏其性別、年齡或情感。展望未來,德布雷說,相信麥克風、ASIC或應用處理器領域的玩家將開發出保證用戶隱私的技術。然后,麥克風可以消除聲音中的情緒,只呈現音頻數據。
Yole分析師預計,GAFAM將繼續占據主導地位,因為目前GAFAM對分析至關重要,但傳感器制造商顯然急于將人工智能納入邊緣領域,并將音頻分析業務從云端分流出去。達米亞諾斯說:“傳感器制造商希望增加收入,從音頻這塊蛋糕中分一杯羹。”。“這不是大公司方面的戰斗。這是傳感器公司的一場戰斗。”
傳感器公司確實在追求多元化的戰略,“試圖在價值鏈中移動,并更加整合,”亞歷克西斯·德布雷評論道。
在最近的一次采訪中,Vesper Technologies Inc.首席執行官馬特·克勞利(Matt
Crowley)表示,該公司正在尋求提高其壓電MEMS話筒的智能化程度。“相信,在未來,將在傳感器中嵌入一些人工智能配對的傳感器。將能夠學習人類和動物如何利用感官——不僅僅是視覺、聽覺、味覺、嗅覺和觸覺,還包括運動或溫度——來了解環境。長期愿景是,物體將使用多種生物感應傳感器來了解其環境,并盡可能以最佳方式做出響應。”
英飛凌公司(Infineon AG)也改變了自己的商業模式,從向歌爾泰克(Goertek)和AAC(AAC)等播放器銷售麥克風芯片,轉向銷售整套MEMS話筒。從MEMS麥克風制造商到從事制造、包裝、測試和銷售的集成播放器。“這是一個戰略上的改變,[…]這可能意味著看到了VPA的動向,希望在這個市場上占據一席之地。”
同樣,今天在MEMS麥克風市場占有39%份額的領導者Knowles最近從Ams AG收購了MEMS麥克風ASIC設計部門。這是引進混合信號電路設計知識產權的一種方式,同時也可以對抗來自中國公司(如Goertek和AAC)日益激烈的競爭。
MEMS microphones pump the volumes
MEMS麥克風可以泵送音量
全球音頻市場繼續增長。由于基于語音的vpa需要更好的信噪比(SNR)來準確捕捉噪聲環境中的人聲,MEMS麥克風迎來了新的市場機遇。
據Yole稱,全球麥克風、微型揚聲器和音頻IC的消費市場預計將以6.6%的復合年增長率健康增長,從2018年的141億美元增長到2024年的208億美元。由于價格便宜、體積小、易于集成,麥克風被廣泛采用并達到極高的音量。達米亞諾斯說:“使用大約60億個麥克風。麥克風市場目前占17億美元,預計2024年復合年增長率為3%,達到20億美元。
MEMS麥克風市場目前約占總量的70%,將從2018年的12億美元增長到2024年的16億美元。主要驅動市場包括智能手機、智能音箱和聽筒(如無線耳機)。“在過去的幾年里,智能音箱和聽得見的市場經歷了爆炸性的增長,”達米亞諾斯說。基本上,到2024年,智能音箱中的MEMS麥克風將以13%的復合年增長率增長到12億臺。在無線耳塞領域,將以29%的復合年增長率增長,到2024年達到13億部。
與此同時,據Yole稱,目前市場規模達91億美元的微型揚聲器市場預計2024年將以3%的復合年增長率增長至109億美元。
達米亞諾斯說:“這似乎是一個溫和的增長。”。但是,在2018年和2019年,智能手機市場放緩,可能是因為智能手機越來越貴,用戶在升級之前等待的時間更長。繼續說:“以前每1.5年更換一次手機,現在是每2.5年更換一次,而且還在增加。”。“預計麥克風和微型揚聲器市場會下降。”事實上,“聽筒和智能音箱的爆炸式增長抵消了這一差異。VPA正在推動所有這些設備中麥克風和微型揚聲器的集成。”
達米亞諾斯總結道:時間在變。
總結
以上是生活随笔為你收集整理的人工智能在音频链中找到自己的声音的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 边缘的人工智能可以满足许多需求
- 下一篇: 定制语音代理(智能体)的背后是什么?