计算机视觉的发展现状
計(jì)算機(jī)視覺(jué)領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。
這一領(lǐng)域的先驅(qū)可追溯到更早的時(shí)候,但是直到20世紀(jì)70年代后期,當(dāng)計(jì)算機(jī)的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí),計(jì)算機(jī)視覺(jué)才得到了正式的關(guān)注和發(fā)展。然而這些發(fā)展往往起源于其他不同領(lǐng)域的需要,因而何謂“計(jì)算機(jī)視覺(jué)問(wèn)題”始終沒(méi)有得到正式定義,很自然地,“計(jì)算機(jī)視覺(jué)問(wèn)題”應(yīng)當(dāng)被如何解決也沒(méi)有成型的公式。
盡管如此,人們已開(kāi)始掌握部分解決具體計(jì)算機(jī)視覺(jué)任務(wù)的方法,可惜這些方法通常都僅適用于一群狹隘的目標(biāo)(如:臉孔、指紋、文字等),因而無(wú)法被廣泛地應(yīng)用于不同場(chǎng)合。
對(duì)這些方法的應(yīng)用通常作為某些解決復(fù)雜問(wèn)題的大規(guī)模系統(tǒng)的一個(gè)組成部分(例如醫(yī)學(xué)圖像的處理,工業(yè)制造中的質(zhì)量控制與測(cè)量)。在計(jì)算機(jī)視覺(jué)的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來(lái)“泛用型”的計(jì)算機(jī)視覺(jué)應(yīng)用或許可以成真。
人工智能所研究的一個(gè)主要問(wèn)題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”?從而使之完成特定的技術(shù)動(dòng)作(例如:移動(dòng)一個(gè)機(jī)器人通過(guò)某種特定環(huán)境)。這一問(wèn)題便與計(jì)算機(jī)視覺(jué)問(wèn)題息息相關(guān)。在這里,計(jì)算機(jī)視覺(jué)系統(tǒng)作為一個(gè)感知器,為決策提供信息。另外一些研究方向包括模式識(shí)別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺(jué)有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺(jué)時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個(gè)分支。
物理是與計(jì)算機(jī)視覺(jué)有著重要聯(lián)系的另一領(lǐng)域。
計(jì)算機(jī)視覺(jué)關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見(jiàn)光與紅外線部分——遇到物體表面被反射所形成的圖像,而這一過(guò)程便是基于光學(xué)物理和固態(tài)物理,一些尖端的圖像傳感器甚至?xí)?yīng)用到量子力學(xué)理論,來(lái)解析影像所表示的真實(shí)世界。同時(shí),物理學(xué)中的很多測(cè)量難題也可以通過(guò)計(jì)算機(jī)視覺(jué)得到解決,例如流體運(yùn)動(dòng)。也由此,計(jì)算機(jī)視覺(jué)同樣可以被看作是物理學(xué)的拓展。
另一個(gè)具有重要意義的領(lǐng)域是神經(jīng)生物學(xué),尤其是其中生物視覺(jué)系統(tǒng)的部分。
在整個(gè)20世紀(jì)中,人類對(duì)各種動(dòng)物的眼睛、神經(jīng)元、以及與視覺(jué)刺激相關(guān)的腦部組織都進(jìn)行了廣泛研究,這些研究得出了一些有關(guān)“天然的”視覺(jué)系統(tǒng)如何運(yùn)作的描述(盡管仍略嫌粗略),這也形成了計(jì)算機(jī)視覺(jué)中的一個(gè)子領(lǐng)域——人們?cè)噲D創(chuàng)建人工系統(tǒng),使之在不同的復(fù)雜程度上模擬生物的視覺(jué)運(yùn)作。同時(shí)計(jì)算機(jī)視覺(jué)領(lǐng)域中,一些基于機(jī)器學(xué)習(xí)的方法也有參考部分生物機(jī)制。
計(jì)算機(jī)視覺(jué)的另一個(gè)相關(guān)領(lǐng)域是信號(hào)處理。很多有關(guān)單元變量信號(hào)的處理方法,尤其對(duì)是時(shí)變信號(hào)的處理,都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺(jué)中對(duì)二元變量信號(hào)或者多元變量信號(hào)的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計(jì)算機(jī)視覺(jué)中發(fā)展起來(lái)的方法,在單元信號(hào)的處理方法中卻找不到對(duì)應(yīng)版本。這類方法的一個(gè)主要特征,便是他們的非線性以及圖像信息的多維性,以上二點(diǎn)作為計(jì)算機(jī)視覺(jué)的一部分,在信號(hào)處理學(xué)中形成了一個(gè)特殊的研究方向。
除了上面提到的領(lǐng)域,很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問(wèn)題。例如,計(jì)算機(jī)視覺(jué)中的很多問(wèn)題,其理論基礎(chǔ)便是統(tǒng)計(jì)學(xué),最優(yōu)化理論以及幾何學(xué)。
如何使既有方法通過(guò)各種軟硬件實(shí)現(xiàn),或說(shuō)如何對(duì)這些方法加以修改,而使之獲得合理的執(zhí)行速度而又不損失足夠精度,是現(xiàn)今計(jì)算機(jī)視覺(jué)領(lǐng)域的主要課題。
總結(jié)
以上是生活随笔為你收集整理的计算机视觉的发展现状的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 计算机视觉,图像处理,图像分析,机器人视
- 下一篇: 学习Docker容器时,错误bash: