睡眠音频分割及识别问题(十)--Java读取wav文件
簡介
Waveform Audio File Format(WAVE,又或者是因為擴展名而被大眾所知的 wav),是微軟與 IBM公司所開發在個人電腦存儲音頻流的編碼格式。
由于項目需要從 wav 文件中讀取音頻數據,現有許多框架的 API 文檔參差不齊,學習成本過高且復用性不高,所以我們準備拋棄已有的API,利用java基礎io包構建自己的API。
wav文件格式
為了利用java 原生 io包中的字節流讀取文件數據實現睡眠音頻的操作,最終在 IOS 平臺復現的目的,我們首先要了解 wav 文件內容格式,充分理解wav文件管理音頻的原理。
wav文件遵守資源交換文件格式之規則,在文件的前 44(或 46)字節放置頭部(header),使播放器或編輯器能夠簡單掌握文件的基本信息,其內容以區塊(chunk)為最小單位,每一區塊長度為 4 字節,而區塊之上則由子區塊包裹,每一子區塊長度不拘,但須在前頭先宣告標簽及長度(字節)。頭部的前 3 個區塊記錄文件格式及長度;接著第一個子區塊包含 8 個區塊,記錄聲道數量、采樣率等信息;接著第二個子區塊才是真正的音頻資料,長度則視音頻長度而定。內容如下圖所示。
須注意的是,每個區塊的端序不盡相同,而音頻內容本身則是采用小端序。
wav文件的讀取(java)
目前已經實現數據的讀取,可以獲取音頻中的采樣點信息,以及音頻文件的相關描述信息。結果示例如下所示:
下一步工作
規范代碼格式,并嘗試閱讀重采樣原理,使用java源碼實現重采樣。
總結
以上是生活随笔為你收集整理的睡眠音频分割及识别问题(十)--Java读取wav文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 先生,要点单吗? (HTTP协议概览)
- 下一篇: java监听数据库操作_第十六篇——JD