独立成分分析ICA系列1:意义
生活随笔
收集整理的這篇文章主要介紹了
独立成分分析ICA系列1:意义
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1.前言
獨立成分分析思想和方法最早源于上世紀八十年代幾個法國學者的研究工作,盡管當時他們并沒有命名其為ICP;在1986年舉行的神經(jīng)網(wǎng)絡計算會議上,法國學者Heraull和Jutten提出了一個基于神經(jīng)網(wǎng)絡模型和Hebb學習準則的方法,來解決盲源分離問題,簡稱BSS. 混合信號是由相互統(tǒng)計獨立的源信號混合而成的。這篇文章提出的算法可以解決具有兩個源信號混合的盲源分離問題。他們的工作開創(chuàng)了信號處理領(lǐng)域的新紀元,從此盲源分離問題得到了各國學者的廣泛重視。但在當時,僅為法國學者所研究,在國際上的影響十分有限。八十年代國際神經(jīng)網(wǎng)絡會議上,當時少數(shù)有關(guān)的文章被埋沒于back-propagation網(wǎng)絡、Kohonen自組織網(wǎng)絡的研究熱潮中,并沒有引起各國學者足夠的重視。 進入到上世紀九十年代初期,某些學者開始了這方面的研究,他們擴展了八十年代有關(guān)盲分離問題的一些工作,其中,學者Cichochi和Unbehauen提出了當時較為流行的ICP算法。芬蘭學者Ojs,Ksrhunen,等提出了“非線性ICP ”方法,然而,直到九十年代中期,仍然只得到少數(shù)學者的關(guān)注,主要原因是這些學者提出的算法所能解決的問題是相當有限的。事實上,解決盲源分離問題是一個非常困難的任務,因為我們不知道源信號的任何信息,在Heraull和Jutten提出的算法中,只作了兩個假設(shè):一個是假設(shè)源信號是相互統(tǒng)計獨立的,另一個是假設(shè)己知源信號的統(tǒng)計分布特征。如果假設(shè)源信號是高斯分布的,則很容易看出這個盲源分離問題沒有一般的解,因為高斯分布的任何線性混合仍然是高斯。用Heraull-Jutten的網(wǎng)絡模型解決盲源分離問題,需要假設(shè)源信號是亞高斯信號,也就是說源信號的峰度值要小于高斯信號的峰度值!!! 直到1994年,法國學者Comon,Heraull和Jutten提出的獨立成分分析問題給出了一個較為清晰的數(shù)學上的框架,從此成為文獻中的正式用語。 ICP獲得廣泛的關(guān)注和持續(xù)增長的研究興趣歸功于美國學者Bell和Sejnouski在九十年代發(fā)表的里程碑式的論文,他們的方法基于信息極大化原理,這個算法進一步由日本學者和他的合作者用自然梯度完善,其本質(zhì)上是極大似然估計方法。 幾年以后,芬蘭學者Hyvarrinen和Oja提出Fixed-Point算法(不動點算法),或稱為FastICA。因為它對大規(guī)模問題特別有效,而得到了廣泛的應用。
解決標準的獨立成分分析只需假設(shè)源信號是相互統(tǒng)計獨立的,并且滿足非高斯性,到目前為止,標準的獨立成分分析算法己經(jīng)較為成熟,國際上使用最為廣泛的是信息極大化算法、FastICA算法、擴展的信息極大化算法和ECSI算法等。 標準的獨立成分分析的數(shù)學模型較為簡單,不同的獨立性判據(jù)所導致的算法在形式上也是基本相似的。形勢雖然簡單,但到目前為止,以實際的生物醫(yī)學信號處理為例,研究者大量使用的主要還是標準的算法,主要因為它發(fā)展的最為成熟,計算穩(wěn)定,較少有數(shù)值問題,并且網(wǎng)上有相關(guān)作者編制的通用軟件包可用于研究下載在真實數(shù)據(jù)的處理過程中,可盡量將所面臨的問題轉(zhuǎn)化為標準的問題,然后選用有效的算法來解決它因為真實數(shù)據(jù)往往規(guī)模比較大。 選擇在實算中收斂速度快,計算穩(wěn)定的算法是相當重要的,最初所希望解決的雞尾酒會問題是極為復雜和困難的,實際的盲源分離問題又是方方面面,需要將各種實際情況轉(zhuǎn)化為相應的數(shù)學模型來解決,現(xiàn)在人們重點研究的是擴展的獨立成分分析,其模型是標準的模型的擴展和補充,來進一步滿足實際需要,比如具有噪聲的獨立成分分析陣,稀疏和超完備表示問題,具有時間結(jié)構(gòu)的獨立成分分析問題,非線性的獨立成分分析和非平穩(wěn)信號的獨立成分分析等. 獨立成分分析己經(jīng)被廣泛應用于實際數(shù)據(jù)的處理中,諸如圖像處理、語音信號處理、生物醫(yī)學信號處理、模式識別、數(shù)據(jù)挖掘、通訊等。
2.ICA研究的意義
假設(shè)在一個房間內(nèi)有兩個人同時講話,在房間的不同位置有兩個麥克風,而每個麥克風記錄下來的是兩個人聲音信號的混合。我們的問題是如何僅利用麥克風的混合聲音信息來獲得每個講話者所說的話即源信號這就是著名的雞尾酒會問題。人類復雜的聽覺系統(tǒng)可以很好的解決這個問題,將注意力集中于一個說話者,人們可以聽出他所說的話但如何利用計算機,或利用機器,使其智能化,來模仿人類并有效的解決這個問題這個問題相當令人感興趣,它屬于智能信息處理的范疇。獨立成分分析就是解決雞尾酒會問題的有效方法,或者說解決盲源分離問題的有效方法。在上世紀九十年代之前,沒有獨立成分分析這個工具,解決此類問題是相當之難的。 解決盲源分離問題的一個主要困難在于,我們不知道源信號的任何信息,也不清楚信號的混合方式。但假設(shè)源信號是相互統(tǒng)計獨立的,就可以應用獨立成分分析這一工具很好的解決這個問題。在大量的實際問題中,這個假設(shè)是合理的,符合實際的情況,這樣,獨立成分分析被廣泛地應用于解決實際問題。標準的獨立成分分析需要的另一個假設(shè)是信號的非高斯性,現(xiàn)實世界的許多信號,諸如絕大多數(shù)的語音信號和圖像信號即是服從非高斯分布的這個假設(shè)的可應用性,帶來了獨立成分分析的重要特征,即實際信號的統(tǒng)計特性僅用普通的基于二階統(tǒng)計量方法是不能反映的,獨立成分分析追求的是信號的高階統(tǒng)計信息,應用上的廣泛性和技術(shù)上的更高要求,使得獨立成分分析成為國際上的研究熱點。 目前獨立成分分析己經(jīng)成功地應用在圖像處理、語音信號處理、生物醫(yī)學信號處理、模式識別、數(shù)據(jù)挖掘、通訊和金融等領(lǐng)域。信號處理及多元統(tǒng)計領(lǐng)域的基本問題是尋找信號,比如語音和圖像數(shù)據(jù)的一個恰當?shù)木€性表示、數(shù)據(jù)壓縮和數(shù)據(jù)的去噪聲等,獨立成分分析已經(jīng)成功的用于解決這些問題,與傳統(tǒng)的方法比如傅利葉基表示、小波基表示等相比較有許多優(yōu)點。在生物醫(yī)學信號處理領(lǐng)域,獨立成分分析發(fā)揮了巨大的作用,它比傳統(tǒng)的方法更優(yōu)越,比如相關(guān)性分析和主成分分析。ICA己經(jīng)成功地用于EEG、MEG、EPR等醫(yī)學信號的處理。具體以在功能磁共振成像fMRI數(shù)據(jù)分析中的應用為例來說明它的作用。人腦受到外界的任務刺激后,它的激活區(qū)域是各種可能存在的信號在腦內(nèi)的綜合反應,比如這些信號可能包括任務信號、心臟的跳動、肌肉的收縮、呼吸和機器噪聲等,把這些信號看作是相互統(tǒng)計獨立的,則獨立成分分析對fMRI數(shù)據(jù)分析的目的就是找出真正與腦激活有關(guān)的獨立成分,去除與其它干擾噪聲相應的獨立成分。眾所周知,對fMRI信號的研究大多是在假定己知事件相關(guān)時間過程曲線的情況下,利用相關(guān)性分析得到腦的激活區(qū)域.就像上面所提到的,將fMRI信號分析看作是一種盲源分離問題,在不清楚有哪幾種因素對fMRI信號有貢獻、也不清楚其時間過程曲線的情況下,用空間獨立成分分析方法對fMRI信號進行盲源分離,提取不同獨立成分得到任務相關(guān)成分、頭動成分、瞬時任務相關(guān)成分、噪聲干擾、以及其它產(chǎn)生fMRI信號的多種源信號。與主成分分析相比較發(fā)現(xiàn),獨立成分分析能得到更多的腦內(nèi)激活信號,并且在相同的閾值情況下,獨立成分分析的激活區(qū)域更大,可見獨立成分分析是一個比較優(yōu)越的數(shù)據(jù)處理方法,能夠廣泛的應用于數(shù)據(jù)分析,因此研究獨立成分分析具有重要的現(xiàn)實意義。
參考文獻:
Hyv?rinen A, Oja E. Independent component analysis: algorithms and applications.[J]. Neural Networks, 2000, 13(4-5):411-30.
史振威. 獨立成分分析的若干算法及其應用研究[D]. 大連理工大學, 2005.
總結(jié)
以上是生活随笔為你收集整理的独立成分分析ICA系列1:意义的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: XEIM_跨平台的网络通信产品
- 下一篇: 用CComPtr吧,COM接口指针很危险