视觉研究的前世今生(上)王天珍(武汉理工大学)
視覺是人類最重要的知覺,沒有視覺人類很難定位,識別物體,了解壞境,得以生存發展。20世紀兩次世界大戰,使得西方各國,不論是為了飛機安全著陸,還是導彈精確制導,都對視覺研究有了非常大的興趣,系列的歐洲視知覺會議(ECVP,1978),雜志“視覺研”(vision research,1961)在上世紀的出現,都不同程度源于得到了各大基金和有關軍方的支持NASA,NIH NSF, officeof Navel, Air Force Research)。至今在西方各國視覺研究依然是一個熱門研究方向。
80年代,我在新華文摘上讀到錢學森關于人工智能的一篇講話,他提到計算機的出現改變了人類社會,計算機又快又準確,但就是在物體識別方面無論如何也趕不到人類視覺,這引起了我對物體識別的極大興趣。幾年后到美留學,學習數字圖像處理,這才知道物體識別屬于計算機視覺的研究范圍,知道至今為止不論是計算機視覺研究,還是人類視覺研究都沒有大的突破。
我是一個喜歡追根刨底的人,從小電影,電視劇,小說一定要知道結尾,于是就被套了進去,不論有錢沒錢,英文中文,凡是與視覺有關的雜志,書,都要找來看,各種會議自己花錢也要去參加,何況回國后主要工作也是圖像處理方面的教學和研究。近30年來還是有些成果:1,對視覺機理有了比較深的理解;2,知道了不少古今中外研究視覺的人和故事.于是就有了把這些故事說出來的愿望,在唯SCI的時代,和在職的年青教師研究生去搶飯碗,去投稿一級學報,爭取發表,沒有必要,就在博客上吹吹牛吧。
按照J Wade 在視覺的自然史中的劃分原則,和我自己的思路,我將視覺史的研究分為3個階段:1838年前,作為自然觀察研究時代;將Wheaston 發明立體鏡到1982年作為實驗研究時代;將1982年Marr的:“VISION”(中文譯為”視覺計算理論”)出版作為信息科學研究時代的開始。
最后談談我知道的國內有關研究。
?
視覺研究的前世今生(一)
王天珍
一,???從古希臘到18世紀的視覺研究
 
 
 §1-1視覺是什么:外射說和射入學之爭
 
狼和獅子等猛獸的眼睛在黑夜里閃閃發光,引起恐怖和神秘之感;檢閱時統帥們用眼角余光逼視著他的隊伍里的士兵,讓他們感到威嚴的壓力,如此等等使得古希臘一些學者認為視覺是人類眼中發出來的光作用到物體上產生的感覺。認為視覺是從眼睛里發出的光或者火,靈魂借以感知世界的學說被稱為外射學。外射學的提倡者和支持者有:柏拉圖(Plato,350 B.C.)歐幾里得(Euclid,300B.C.),托勒密(Ptolemy,150)。??
 
 
 圖1柏拉圖
 
歐幾里德是古希臘公認的大數學家,他依據光是直線傳播的事實,按照柏拉圖的等同光與視覺的思路,數學化了光學,寫了“光學”從而將視覺也幾何化了,他提出光線從眼里投射到物體,視覺被限制到視線形成的立體錐中,對著大角的物體被知覺為較大,這樣他不僅對光通過空間作了說明,他的光學是一種空間知覺幾何理論。科學研究不等于數學,但是只有有了數學,科學研究才能深入。美國資源委員會對科學研究的定義是:“科學研究工作是科學領域中的檢索和應用包括對已有知識的整理、統計以及對數據的搜集、編輯和分析研究的工作。要整理、統計以及對數據的搜集、編輯和分析非數學不可,因此任何一門學科的研究,只要有了數學家的加入,就特別有活力。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 圖2歐幾里德
??? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
?外射學從常識來看,好像不合理。反對外射學的亞里士多德(Aristotle)就質疑說,如果視覺真如燈籠一樣是從眼往外發射光,為什么在黑暗中,眼睛沒有看的能力呢?但就是因為歐幾里得等同視覺與光,從幾何的角度,說得頭頭是道,使得外射學流行了幾百年。
原子論的提倡者德莫克里特(Democritus,400 b.c.)認為從物體發射的原子壓縮空氣帶物體的影像到眼睛,引起視覺,這個觀點被伊畢鳩魯(Epicurus,300 b.c.)發揚光大,形成了另一個學派射入學派,射入學派經過亞里士多德的學生Theophrastus(300 ?b.c)的整理更接近現代光與視覺的概念:太陽發出的光被物體反射,通過透明,或者半透明的媒質被眼睛接受,反映亞里士多德意識到作為物質的光和作為媒質運動的光的區別,他們認為,這樣的運動是瞬間的,能同時被很多觀察者接受。但是這一學派當時并沒有被廣泛接受。
 圖3亞里士多德
 
托勒密一般堅持歐幾里德幾何光學理論,但是他認為視覺不是等同通過單個視錐,而需要雙眼視錐的結合。他更看重實驗,他對折射反射作了長期觀察,能夠準確的描敘這些現象,發現在兩種不同的透光物資界面上,光發生了彎曲,從折射角不等于入射角,而是有定量的關系。注意到建立物理和視覺的心理分析間的一致,這一點為后來的海桑(Ibn al-Haytham, Alhazen,1040)所發展 。但是他堅持外射學,。
解剖學介入視覺研究比較早,把視覺研究從古希臘的哲學家的清談和數學家的推演中走出來的,是古羅馬的醫生和哲學家蓋倫(Galen,129,199)他活體解剖過動物,尤其是臾猴,并由此推論人體的構造。他發現白內障致盲,但是移去白內障,能夠恢復視力,因此認為視線從晶狀體發出(晶狀體式視覺的基地)。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖4蓋倫
他混淆陽光中的光線和視線。他依據解剖和生理的結合,同意托勒密的雙眼單視。因為解剖他知道視神經在視交叉中結合,于是推測靈魂是從單一位置發出的。
世界科學的大發展有三個高峰,古希臘,羅馬,文藝復興。羅馬以后,歐洲因為戰亂,和黑死病流行對經濟的影響,大約有六百多年,科學研究受到壓抑,很多希臘文獻散失,學派消失。只是經過阿拉伯學者的努力,保留了大量的希臘學者的著作,并再翻譯為拉丁文,歐洲到文藝復興時,才能在希臘學術研究的基礎上再次繁榮。
在其中阿拉伯的學者海桑(Ibn al-haytham,Alhazen,965-1039)起了承前啟后的作用。他的巨作“光學”讓歐洲重新知道了古希臘的各種學說。利用自己設計的各種裝置,他有系統的研究光線的傳輸,反射與折射。他觀察到睜開眼睛就能使整個天空充滿陽光,而強的陽光會引起眼睛的疼痛,因而他相信外射學,他說眼睛是為感光而設計的。他還提出了后來認為是J.J.Gibson 提出的空間知覺理論,提出了被認為是Helmholtze最先提出的無意識推理。
?圖5開普勒 ? ?外射學和射入學之爭直到17世紀開普勒(Kepler,1571-1630)才算經緯分明。1611年,他在“折射光學”中提出人們能夠看見物體是因為物體發出的光通過眼睛的水晶體投射在視網膜上形成倒像,晶狀體不過是一個光線的折射裝置。1625年德國的物理學家沙伊兒(Christoph ?Scheiner,1575-1650)用牛眼驗證了他的說法。他在被摘出的牛眼后極部,切除鞏膜和脈絡膜,于是人們在視網膜上看見了倒置的景物。這樣大家才最后相信是物體發出的光進入眼睛,在眼底形成了倒置的景物影像,經歷了一千多年的歲月,射入說,終于得到了承認。 ? ? ? ?
? ? ? ?
§1-2眼睛的光學結構及調節現象的研究,眼鏡及照相機的發明。
從蓋倫開始,解剖學進入視覺研究,蓋倫主要通過對猴子的解剖和偶然對洪水漂來腐爛尸體研究,對眼睛結構有了一些初步的了解,在他的著作“身體各部分的用處”一書中,有一節是關于眼睛和它的附屬器官的,他描敘了玻璃體,捷膜,角膜,虹膜,晶體,脈絡膜和視網膜。蓋倫解剖過視神經,知道它的走向,并看見了視交叉得出視交叉是精靈進入腦時左右眼互相交換的地方。有兩只眼的原因是能看到更大的范圍,而且一只眼出了問題,還可以用另一只眼看。16世紀,意大利的天文學家F.Maurolico(1494-1575)研究了折射現象并企圖解釋彩虹,他描敘了小孔成倒象,并提出晶狀體相當折光棱鏡,光通過晶狀體折射。1619 德國天文學家,物理學家沙奈爾(C.Scheiner,1575-1650)第一個科學地繪出了人眼的示意圖,正是他用牛眼的斷層實驗,驗證了Scheiner 1619年繪制的眼調節圖Kepler的倒像論,他用各種光學實驗證明晶狀體和玻璃體的屈光率,測定了角膜的曲率和晶狀體的彎曲度,眼視光學從此登上科學的舞臺。他寫到,年輕人看東西清楚是因為他們的晶狀體適應性好,網膜能自由活動。能夠看遠也能看近。?
圖6.Scheiner 1619年繪制的眼調節圖。(引自A Natural history of vision)
 
 
?人類在對眼睛的結構進行研究的同時,發明了眼鏡和照相機。
眼鏡的發明改善了視力。據說眼鏡最早出現在1289年意大利弗羅倫薩,是叫阿爾馬托的光學家發明的。但馬可波羅在1260年寫到,中國老人為了清晰地閱讀而戴著眼鏡。說明眼鏡是從中國傳過去的。中國歷史博物館有一幅藏畫“南都繁會景物圖卷,中有一老者戴著眼鏡,說明早在明永樂年間中國就有眼鏡出現了。
照相機本身就是眼睛結構研究自然的產物。小孔成像的研究導致了暗箱的出現。水到渠成,經過了文藝復興,1829年法國的藝術家蓋達兒(Louis Daguerre,?1787 – 1851)發明了照相機。
圖7 ?蓋達兒 ? ?
?照相機的發明反過來又加深了對視覺的研究,因為與相機的對比,從開普勒到19世紀中,對視覺的研究很重要的一部分集中在對眼睛調節機理的研究上。人們推測是眼睛的哪一部分完成了調節作用使得人眼能在很大一個范圍內看清物體,而不是像相機只能在一個距離上聚焦。有三種猜測:1,角膜改變曲率完成調節,近處曲率變大;2,晶狀體在眼內前后移動,持這個觀點的是開普勒,Scheiner是他的支持者,但也考慮晶狀體形狀的改變;3,晶狀體改變形狀完成調節,托馬斯·楊(ThomasYoung,1773-1829),1793年從邏輯和生理的角度推出這個結論。他同時還解決了晶狀體本身的結構問題,假設晶狀體用肌肉的纖維組成。
眼睛調節在17世紀,被笛卡爾等作為知悉距離的線索,這成了柏克萊的肌肉調節是距離知覺的重要原因的空間視覺理論的重要依據。
網膜之后眼睛接受的圖像去了哪兒?下節談談古人對雙眼單視和視覺通道的解剖生理研究
? ? ? ? ? ? ? ? ? ? ? ?視覺研究的前世今生(二)
王天珍
?
§2?視覺通道,雙眼單視,和顏色視覺
§2-1視覺通道和雙眼單視
人都有長在頭前的兩只眼,但看見的物景卻是一個,這稱為雙眼單視。為什么雙眼單視,雙眼比一個眼看東西好,還是用一個眼好,自古以來就是學者們爭論不休的話題。
雙眼單視甚至在荷馬的史詩“奧德塞(Odyssey)”中反映出來,神王宙斯(Zeus)的雷神就是獨眼(cyclopine eye)。
亞里士多德(Aristotle)注意到復視,他說如果將手指壓迫一個眼睛,一個東西就會看為兩個,也就是說,從那時開始,人們就注意到雙眼單視了。
這被托勒密(Ptolemy)用實驗檢驗,較之Euclid只用光的投射解釋雙眼視覺,托勒密用控制觀察法確定了雙眼單視的條件,說明交叉和非交叉視差的差別。為現代雙眼視覺研究鋪平了道路。
托勒密的工作可能影響到幾乎同時代的解剖學家蓋倫(Galen),蓋倫不僅通過解剖了解眼睛的結構,也通過解剖,發現從兩眼到腦的神經通道。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖8?托勒密
J Wade?考證,在古時候,腦本身就不太被重視,視覺通道較之眼解剖更被忽視。希波克拉底(Hippocrates)認為愉快,感覺,思想在腦,但是心是感覺力的中心,雖然這一點,不為Aristotle贊同。通過解剖研究,Galen認為視覺通道起源于腦前室,在此,動物精神與視神經引起的視覺精神交互。視神經本身在視交叉聚合,但是每一方保留在自己這邊。這個錯誤被重復,并被笛卡兒(Descartes)整合進入他的視覺分析中。Galen的腦前室類似于丘腦。在笛卡兒的折光學中視神經從每個眼同側進入腦,在后面的松果體結合。他將此類比為盲人拄兩根拐杖去觸覺一個物體。P105圖,P250圖
對于雙眼和單眼的關系,亞里士多德考慮雙眼從一個單源移動,因此單眼視覺優于雙眼,他用眼動控制來解釋這一點。托勒密注意到雙眼和單眼的視方向不必一致,當兩眼視方向一致時,雙眼單視。而蓋倫的理論是視精神在視交叉交互,故他考慮一個眼在使用時比兩個眼視精神更集中。(Wade P240)
意大利自然哲學家波爾塔(Porta)則更激進,他認為因為競爭,每個時間只有一個眼在在工作。波爾塔的觀點得到法國的畫家,透視學教師LeClere的支持,他收集了一些實例,這些人每個眼分開比雙眼看的更清楚,以此為證,說明每次只有一個眼在工作。
笛卡兒推測從兩眼來的纖維(視神經)結?合在松果體,但是作為畫家和透視教師的
圖9 ?笛卡兒?? ??LeClere不同意他的觀點,LeClere用透視圖說明雖然兩眼得到的圖像來源于同一個物體,但是由于透視的原因兩者并不相等,以此來反對笛卡兒的雙眼融合論。P265圖
雙茼望遠鏡和顯微鏡的發明者Cherubin dOrieans認為雙眼視覺是優于單眼,在光度計被發明后,得到了證實。
§2-2顏色視覺
心理學家在什么是感覺,什么是知覺方面意見一貫不一致,但是他們一致同意顏色是感覺。但是為什么會有色盲,為什么我們會感覺到顏色,白光與顏色光的關系是什么,為什么會有彩虹這個問題一直到牛頓(Newton)才有了比較大的進展。牛頓在他的“光學”(1704)中說,我不是用假說解釋光的性質,我是用推理和實驗提出并證實它們。他用棱鏡將白光分解成了彩色光譜,他意識到光譜是連續的,但報告了七種顏色,紅,橙,黃,綠,藍,靛,紫。從此人們知道白光能夠分解成單色光,按一定比例,色光也能結合成白光。
圖10 ??牛頓 ?
?基于顏色混合的事實,湯姆士。楊(Young)在1807年提出三原色的假設。他設想視網膜上存在三種神經纖維,每種都引起一種原色的感覺,即紅,綠,藍色覺。到了1860年赫姆霍茨(Helmholtz)對三色學作了補充,提出光譜的不同成分引起三種纖維不同比例的興奮,他們有不同的興奮曲線?
(壽書P234),在顏色混合中混合色是三種纖維按比例同時興奮的結果。這就是后來有名的Young- Helmholtz三色學。三色說能很好的解釋顏色混合現象,但是不能解釋色盲現象。??
?色盲的概念是1844年由布律斯特(Brewester)提出來,但是在18世紀就已經有了紀錄。原子論的提出者道爾頓(Dalton)1794年就在曼徹斯頓的文哲協會上就報告自己不能從黑色中區分紅色,并引起了科學界極大的震驚(P137)。三色學認為色盲是因為缺乏一種(單色盲)和三種纖維(全色盲)造成的,按此學說至少應該有三種色盲:紅色盲,綠色盲,藍色盲,他們可以單獨存在。并且依此理論只有三種纖維同時興奮才有非彩色感覺,既然色盲缺乏一種或者幾種纖維,那么色盲都不應該有明度感(白色感覺)。但是事實上,幾乎所有的紅色盲也是綠色盲,而全色盲著也同樣有白色感覺。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖11赫姆霍茨
? 1864年赫林(hering)提出了對立色(拮抗)學說。認為視網膜中有三對視素,白-黑視素,紅-綠視素,黃-藍視素。每對視素對光照和黑暗呈相反的反映。色覺取決于視素的分解和還原。異化產生紅,黃,白,復原產生藍,綠,黑,在視覺研究史上稱為hering law。拮抗學能很好解釋色盲和負后像和同時對比。但是對三原色能產生光譜一切顏色沒有給以說明。(hering law?英漢醫學詞典)
一個多世紀以來兩種學說進行了長期,反復的爭論,好像互不相容。近幾十年來,尤其是微分光光度術的出現,色覺研究有了重大突破。現已證明人的視網膜上確實存在三種感色的錐細胞,而在從網膜向視覺中樞傳遞的過程中,顏色信息都是編碼為拮抗對的形式傳遞。從而解決了兩種理論之爭,美國著名生理學家Hartline?說,兩者都是對的。
??? ? ? ?圖12 海林
本文轉自:http://blog.sciencenet.cn/blog-1239700-853296.html
總結
以上是生活随笔為你收集整理的视觉研究的前世今生(上)王天珍(武汉理工大学)的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 魔兽世界WOW7.3全职业PVP套装外观
- 下一篇: 你觉得在《CS:GO》里倒卖箱子能发家致
