基于快速傅里叶变换实现的狗声识别器(人工智能)
開發(fā)背景
市場(chǎng)上很多寵物狗狗翻譯器,貓語(yǔ)翻譯器,動(dòng)物交流器,它們沒有采用正確的技術(shù)去實(shí)現(xiàn),從而讓動(dòng)物聲音翻譯器變成人們笑料的工具。本人為了改變現(xiàn)狀,剛好被裁員在家里休息,所以努力開發(fā)一款真正意義上能識(shí)別出動(dòng)物聲音的翻譯器。總計(jì)耗時(shí)1個(gè)月(算法折騰半個(gè)月,js折騰半個(gè)月),躺了幾次中醫(yī)推拿才初步開發(fā)完成。整體只完成夢(mèng)想的一小步,后續(xù)只能交給追夢(mèng)者繼續(xù)完善。
項(xiàng)目地址:https://github.com/windawake/dogsound
功能介紹
可以識(shí)別出包括狗狗在內(nèi)的所有動(dòng)物發(fā)出的聲音,前提是先錄音存到聲音檔案里面。
預(yù)覽網(wǎng)址
使用手機(jī)火狐瀏覽器訪問 https://app.jiajuren.net/ 同意開啟錄音和麥克風(fēng)權(quán)限。
運(yùn)行項(xiàng)目
運(yùn)行環(huán)境:nginx+ssl+php+mysql
創(chuàng)建bowwow數(shù)據(jù)庫(kù) CREATE DATABASE bowwow; 然后執(zhí)行根目錄bowwow.sql文件,接著把a(bǔ)pp copy.json修改為app.json并且配置mysql連接參數(shù)
在根目錄運(yùn)行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
參考配置
最后訪問https://127.0.0.1:3000 即可看到本地效果
實(shí)現(xiàn)原理
運(yùn)用了移位運(yùn)算,門閥檢測(cè)聲音,短時(shí)能量,短時(shí)過零率,短時(shí)快速傅里葉變換等技術(shù),請(qǐng)參考這本書《語(yǔ)音信號(hào)處理實(shí)用教程》
注意事項(xiàng)
必須要https才能開啟錄音和麥克風(fēng)權(quán)限
需要安靜室內(nèi)環(huán)境,錄音要自然,識(shí)別時(shí)的發(fā)音要跟錄音時(shí)的節(jié)奏一致。這樣子才能達(dá)到80%識(shí)別率。室外在噪音干擾下,識(shí)別率幾乎為0。
原文出處
https://learnku.com/articles/71608
總結(jié)
以上是生活随笔為你收集整理的基于快速傅里叶变换实现的狗声识别器(人工智能)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【uni-app】App实现二维码分享图
- 下一篇: JL杰理蓝牙发射方案开发