計算機視覺的理論框架探索論文
計算機視覺理論框架的新發(fā)展,可以以計算視覺理論為主,將基于知識的視覺理論和主動視覺理論結(jié)合到一起,從而使計算機視覺系統(tǒng)框架變得更加完善。今天學(xué)習(xí)啦小編要與大家分享的是 :計算機視覺的理論框架探索的論文;具體內(nèi)容如下,希望能幫助到大家!
計算機視覺的理論框架探索
引言
在計算機系統(tǒng)中,計算機視覺是通過模擬人類視覺,從而對不同事物進行相關(guān)描述,以獲得更全面的信息。隨著計算機視覺在文字識別、漫步機器人和導(dǎo)航中的成功應(yīng)用,計算機視覺的理論框架研究顯得越來越重要,對于促進我國計算機應(yīng)用技術(shù)水平不斷提升具有重要意義。
1 計算機視覺的理論框架
隨著計算機視覺的不斷研究和總結(jié),從二維景物圖像發(fā)展到三維景物圖像,計算機視覺的理論框架主要有如下三個:
1.1 計算視覺理論框架 在七十年代中期,有關(guān)研究人員提出了第一個計算機視覺理論框架,即計算視覺理論,將視覺過程看作是信息處理過程,并將信息處理過程分為三個不同的層次,它們分別是計算理論層次、數(shù)據(jù)結(jié)構(gòu)層次和硬件實現(xiàn)層次,從而對計算機視覺進行全面分析。根據(jù)相關(guān)數(shù)據(jù)和資料顯示,視覺是對圖像的位置、形狀和特征等進行描述,因此,計算理論層成為了研究的重點,進而將視覺過程看作是從二維圖像信息中對圖像進行重塑,從而將三維物體的形狀、位置和空間等反映出來,最終形成三維圖像。
由此可見,早期的視覺處理是從輸入的二維圖像中獲得二維要素圖,即圖像中強度變化較強時的位置和幾何分布情況、結(jié)構(gòu)等;中期的視覺處理是從二維要素圖中獲得二點五維圖,即以觀察者為中心,對表面的法向、深度和不連續(xù)的輪廓等進行觀測。雖然二點五維包含的深度信息比二維要多,但還不是真正意義上的三維表示,而僅僅是有多個相對獨立的視覺模塊組成的,在相關(guān)研究中被稱作是“shape from X”模型,將運動視覺、立體視覺等融入到其中;后期視覺處理是指從二點五維圖中獲取物體的三維描述,從而將場景中的物體識別處理,確定物體的確切位置和姿態(tài)。
1.2 基于知識的視覺理論框架 在計算機視覺理論中,基于知識的視覺理論框架,是圍繞感知特征群集來進行相關(guān)研究的,從而通過人類感知的經(jīng)驗來描述目標,最終確定物體在場景中的真正位置、形態(tài)等。相關(guān)研究人員認為,基于知識的視覺理論可以通過知識的引導(dǎo)來直接完成三維重建,以將相對應(yīng)觀察方向保持不變動二維特征稱作是非偶然性聚類,而人體中視覺識別發(fā)揮重要作用的一種感知組織,通過對非偶然性聚類的檢測,可以有效辨別出目標。
因此,首先是利用感知組織來提取圖像中相對于觀察方向大范圍變化,并且保持不變的分組和結(jié)構(gòu)等;然后,利用概率排隊的方法來進行模型匹配,從而縮小檢測空間;最后,通過對觀察點的未知求解和尋找模型參數(shù)對應(yīng)關(guān)系,使三維模型的投影和圖像得到最合適的匹配,最終完成三維重建。
1.3 主動視覺理論框架 第三種計算機視覺理論框架是中東視覺理論礦坑,是根據(jù)人類視覺的主動性特征提出的。由于人類視覺會根據(jù)自己的意識選擇視野范圍內(nèi)所看見的事物的主次,從而移動身體、轉(zhuǎn)向或者改變視角,因此,人們的視覺過程是與所在環(huán)境交互感知和動作的過程。在計算機視覺理論框架的主動視覺框架中,視覺行為不需要三維物體的相關(guān)精確信息,就可以完成物體重建。主動視覺系統(tǒng)根據(jù)所需的物體對象特征、分析結(jié)果和當前要求等,通過控制攝像機的相關(guān)操作,如取向、位置、焦距等,就可以完成相關(guān)處理任務(wù)和信息交換。與此同時,主動視覺還可以用改變攝像機的參數(shù)和處理攝像后的數(shù)據(jù)等,使圖像的時間、空間和分辨率等發(fā)生變化,從而增強圖像的感知效果。
2 計算機視覺理論框架存在的問題
現(xiàn)代發(fā)展中,計算機視覺理論框架的提出,是計算機視覺領(lǐng)域研究的重要突破,而在這個發(fā)展過程中,存在著如下一些問題,影響計算機視覺理論框架的更完善構(gòu)建。由于視覺過程是成像過程的逆過程,存在著混合、投影、噪音和畸變等干擾因素,使圖像三維重建存在不穩(wěn)定性和不確定性,因此,從一幅景象到多幅景象的重建存在很多困難,使三維圖像的準確性和通用性大大降低。并且,計算視覺理論認為輸入是被動的,整個視覺過程自下而上不存在反饋,處理目的沒有發(fā)生任何改變,因此,對物體的確切位置和形狀有一定要求。
另外,有關(guān)學(xué)者提出計算機視覺理論框架沒有充分運用知識,對知識表達沒有給以高度重視,從而忽略知識推理和知識庫的構(gòu)建,沒有對空間約束和場景假設(shè)進行充分考慮,從而使場景假設(shè)受到局限。并且,沒有進行多次的分析和試驗,致使計算機視覺理論框架構(gòu)建存在很多問題。
基于知識的理論框架忽略了計算視覺理論的重要性,認為人類視覺和重建無關(guān),然而,在進行物體尺寸判斷、物體距離估算等情況時,光靠識別是不夠的,必須要依靠三維重建,才能將物體的確切位置、形狀等準確地描述出來。
主動視覺理論沒有排除三維重建,通過改變攝像機的參數(shù)和角度等,來改變物體空間、時間和分辨率的感知效果,從而對圖像出來過程進行相關(guān)約束,使很多不穩(wěn)定和不合適的問題得到有效解決,最終完成三維重建。運用主動視覺理論框架,可以大大降低問題的難度,但主動視覺理論框架仍存在缺乏高層知識指導(dǎo)的問題,導(dǎo)致主動視覺框架還不夠完整,使計算機視覺理論框架構(gòu)建受到一定影響。
3 計算機視覺理論框架構(gòu)建的新發(fā)展
在計算機視覺理論框架的構(gòu)建過程中,計算視覺理論比較系統(tǒng)地解釋了從二維圖中獲取三維物體形態(tài)的方法和可能性,而基于知識的實際理論和主動視覺理論則對計算視覺理論進行了補充和進一步提升。因此,計算機視覺理論框架的新發(fā)展,可以以計算視覺理論為主,將基于知識的視覺理論和主動視覺理論結(jié)合到一起,從而使計算機視覺系統(tǒng)框架變得更加完善。
在實際應(yīng)用過程中,將早期視覺處理分為圖像分割、圖像預(yù)處理和二維模式識別等,以對二維圖像進行濾波降噪和圖像增強等,因此,不需要知識引導(dǎo)和控制視覺目的。在圖像分割、二維圖像模式識別、中期處理、后期處理和三維模式識別的過程中,沒有知識引導(dǎo)和模型匹配,最終得出的圖像效果會更好、更完整。在早期視覺處理和后期視覺處理中,二維模式和三維模式的識別,需要根據(jù)物體的實際情況來確定,由于特征、模型等各不一樣,所以,二維物體和三維物體的描述方式也各不相同。
由于二維信息的質(zhì)量會影響三維信息的效果,因此,在計算機視覺中,二維信息應(yīng)當給以高度重視。而模型庫和視覺目的的應(yīng)用,為計算機視覺理論框架構(gòu)建提供了更多的信息。由此可見,在計算機視覺系統(tǒng)中,通過視覺目的來進行物體形象、位置等的輸出判斷,同時,運用視覺目的可以對圖像分割和二維模式識別、中期視覺處理、后期視覺處理和三維模式識別等進行有效控制,最終使三維重建的圖像信息更加完整。
4 結(jié)束語
隨著高科技信息技術(shù)的不斷推廣,計算機視覺理論框架的研究已經(jīng)成為目前重點關(guān)注對象之一,雖然取得了一定的成績,但計算機視覺理論框架構(gòu)建還不夠完善。因此,計算機視覺理論框架未來的發(fā)展,需要對計算實際理論、基于知識的視覺理論和主動視覺理論進行更深層次的研究,將理論和實踐應(yīng)用緊密結(jié)合在一起,從而使計算機視覺理論框架研究的成果可以更加輝煌。