Sceince子刊:利用AI+脑电波,锁定你想听的声音
新智元原創
來源:Medium
編輯:鵬飛
【新智元導讀】哥倫比亞大學的工程師們宣布一項實驗技術,該技術可模仿大腦檢測和放大許多聲音的天生能力。這種由大腦控制的助聽器由人工智能驅動,可作為自動過濾器,監控佩戴者的腦電波并增強他們想要關注的聲音。雖然仍處于早期開發階段,但該技術是邁向更好助聽器的重要一步,使佩戴者能夠無縫,高效地與周圍的人交談。
人類大腦具有非凡的能力,可以在嘈雜的環境中挑選出特定的聲音。比如,在嘈雜的酒吧里留意中意對象的說話、在車水馬龍的街道分辨身后來車等等。
這在人類來說很輕松就能做到,可連最先進的助聽器也無法實現。不過,哥倫比亞大學的工程師們正在改變這種情況。
他們宣布已經實現一項技術,可以模仿大腦天生具備的檢測并放大特定聲音的能力,并開發出一款由大腦控制的助聽器。
助聽器由 AI 驅動,可作為自動過濾器,監控佩戴者的腦電波并增強他們想要關注的聲音,從而能夠讓佩戴者無縫并高效地與周圍的人交流。
論文發表在 Science Advances 上。據悉,一作 Cong Han 在杭州科技大學獲得學士學位,在哥倫比亞大學獲得碩士學位。
雞尾酒會難題
哥倫比亞大學 Mortimer B. Zuckerman Mind Brain Behavior Institute 的主要研究員和該論文的資深作者 Nima Mesgarani 博士說,處理聲音的大腦區域非常敏感,也非常強大,可以毫不費力的放大一個特定聲音而不牽扯其他聲音,今天的助聽器卻做不到。
那么通過創造一種利用大腦本能的助聽設備,有望使全球數億聽障人士能夠像普通人一樣輕松地進行交流。
現代助聽器在降噪方面已經做的非常出色了,但實現的過程卻是通過提高特定種類的聲音,使其蓋過其它背景音。科學家稱之為雞尾酒會難題。
想象一下,我們在一個嘈雜的雞尾酒會,不僅每個人都在說話,大廳還放著 BGM。為了讓身邊的人聽清楚你不得不提高嗓門說話,而旁邊的人為了讓你聽清楚也不得不提高自己的音量。
哥倫比亞工程公司電氣工程副教授 Mesgarani 博士說:“助聽器會立刻放大所有人的聲音,你仍然無法將你的談話對象和其他人區分出來”
用腦電波來放大特定聲音
為什么會想到利用腦電波呢?Mesgarani 稱他們發現兩個人在交談的時候,講者的腦電波開始和聽著趨同。
于是該團隊將語音分離算法與神經網絡、以及模仿大腦自然計算能力的復雜數學模型相結合,開發了一款腦控助聽器,使用腦電波來判斷哪些聲音應該被放大,哪些聲音應該被抑制。
具體實現方式如下:
首先從一個組中分離出每個說話者的聲音。設備自動將多個揚聲器分離成單獨的流,然后將每個揚聲器與來自用戶大腦的神經數據進行比對。一旦某人的聲音模式與聽者的腦電波匹配度最高,他的聲音就會被放大。
其實團隊早在 2 年前就發布了這項技術的初代版本,但限于預訓練數據集,效果剛開始不是很理想。比如一旦出現不在數據集的聲音,比如來個路人問路,系統就凌亂了。
好在哥倫比亞科技風險投資公司的資助下,團隊對原始算法進行了改進,Mesgarani 博士、第一作者 Cong Han 和 James O'Sullivan 博士再次利用深度神經網絡,構建了一個更加復雜的模型,從而能夠識別任何人聲,從而解決了上述問題。
室內測試顯示,效果還不錯
為了測試該算法的有效性,研究人員與 Northwell Health Institute for Neurology and Neurosurgery 的神經外科醫生 Ashesh Dinesh Mehta 合作,找來志愿患者聽取不同的講者發言,研究人員利用植入患者大腦的電極直接監測他們的腦電波、
當患者專注于一個揚聲器時,系統會自動放大該聲音。當他們的注意力轉移到另一個揚聲器時,音量水平發生變化以反映這種轉變。
接下里,研究人員希望不用植入大腦這種太過簡單粗暴的方式,例如將其置于頭皮外部或耳朵周圍。
目前為止只在室內環境中進行了測試,Mesgarani 博士說未來有望在室外環境也實現相同的效果。
參考鏈接:
https://medium.com/predict/can-our-minds-live-forever-29105faf2d80
總結
以上是生活随笔為你收集整理的Sceince子刊:利用AI+脑电波,锁定你想听的声音的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 防碰撞功能升级:大疆新款消费级无人机将内
- 下一篇: 除了英国芯片商ARM,日本这4家公司也计