當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

最好用的音轨分离软件spleeter：处理一首歌仅几秒，上线一周收获2.4k星 | 附实测...

發(fā)布時間：2023/12/31 编程问答 182 豆豆

生活随笔收集整理的這篇文章主要介紹了最好用的音轨分离软件spleeter：处理一首歌仅几秒，上线一周收获2.4k星 | 附实测... 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

曉查發(fā)自凹非寺?
量子位報道 | 公眾號 QbitAI

喜歡自己用手機K歌？但K歌App里人聲往往清除得不夠干凈，錄制起來效果一般。

現(xiàn)在有個AI神器可以干凈地剝離歌曲里的樂器聲啦。

來自法國的音樂流媒體公司Deezer開源了一個音軌分離軟件spleeter，只需輸入一段命令就可以將音樂的人聲和各種樂器聲分離，支持mp3、wav、ogg等常見音頻格式。

這款軟件基于TensorFlow開發(fā)，效果拔群，有網友說自己曾經試過無數(shù)類似軟件，spleeter是最好用的一個。

量子位嘗試了周杰倫的新歌《說好不哭》，人聲軌道在開頭部分幾乎實現(xiàn)了靜音，聽不到任何樂器聲，直到26秒才開始出現(xiàn)周杰倫的歌聲：

而伴奏部分在整個過程中僅有極少量微弱的換氣聲：

spleeter還支持GPU加速。如果在GPU上運行，會比實時分解速度快100倍，也就是說分解一首5分鐘的歌曲只需要3秒。

spleeter在GitHub上線僅僅一周，就收獲了2.4K星，在Hacker News上也有1000+的熱度。

最多分離5個音軌

用戶可以根據(jù)自己的需求來訓練模型，Deezer還給出了在musdb數(shù)據(jù)集上的預訓練模型，因此能直接拿來使用。

在官方提供的預訓練模型里，spleeter可將人聲和樂器聲分為2個音軌，已經能滿足基本的要求。

此外它還能把樂器聲進一步分離為鼓、貝斯、鋼琴及其他樂曲，加上人聲，spleeter最多可以分離出5個音軌。

其中，2個音軌和4個音軌的模型在musdb據(jù)集上均具有最先進的性能。

使用方法

spleeter可以從conda或者pip安裝。

如果用conda安裝，可以選擇CPU或者GPU環(huán)境，以CPU環(huán)境為例：

git?clone?https://github.com/deezer/spleeter conda?env?create?-f?spleeter/conda/spleeter-cpu.yaml conda?activate?spleeter-cpu

如果想換成GPU環(huán)境，只需將上述代碼中的spleeter-cpu換成spleeter-gpu。

在分離音軌的命令中，加入選項-p spleeter:4stems來指定音軌數(shù)量，如果不加，系統(tǒng)默認分離為2個音軌。

spleeter?separate?-i?audio_example.mp3?-o?audio_output?-p?spleeter:4stems

最終樂器和人聲將以wav文件的格式保存在audio_output文件夾中。

分離過程可以在GPU或CPU上執(zhí)行。在GPU上運行，速度非常快，可以實現(xiàn)100倍的加速。

經過實測，在單個英偉達 GTX 1080上，spleeter只用了90秒就分解完了3小時27分鐘長度的musDB測試數(shù)據(jù)。

pip安裝更簡單，但是不支持GPU加速，一般分解一兩首歌已足夠使用：

pip?install?spleeter

傳送門

項目地址：

— 完 —

大咖齊聚！量子位MEET大會報名開啟

量子位 MEET 2020 智能未來大會啟幕，將攜手優(yōu)秀AI企業(yè)、杰出科研人員呈現(xiàn)一場高質量行業(yè)峰會！VIP票即將售罄，快掃碼報名吧~

榜單征集！三大獎項，鎖定AI Top玩家

2019中國人工智能年度評選啟幕，將評選領航企業(yè)、商業(yè)突破人物、最具創(chuàng)新力產品3大獎項，并于MEET 2020大會揭榜，歡迎優(yōu)秀的AI公司掃碼報名！

量子位?QbitAI · 頭條號簽約作者

?'?' ? 追蹤AI技術和產品新動態(tài)

喜歡就點「在看」吧 !

總結

以上是生活随笔為你收集整理的最好用的音轨分离软件spleeter：处理一首歌仅几秒，上线一周收获2.4k星 | 附实测...的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Java访问用户名密码验证的url
下一篇：我的第一个项目催生的前世今生（LAIS，