圖片檢索技術(shù)論文
圖片檢索技術(shù)論文
圖像檢索是網(wǎng)絡(luò)信息檢索中的重要的組成部分,小編整理了圖片檢索技術(shù)論文,歡迎閱讀!
圖片檢索技術(shù)論文篇一
Web圖像檢索技術(shù)綜述
【摘 要】多媒體技術(shù)的迅速發(fā)展,促進(jìn)了Web圖像檢索技術(shù)的創(chuàng)新和發(fā)展。針對(duì)目前的發(fā)展?fàn)顩r,本文對(duì)Web圖像檢索技術(shù)做了深入的分析和研究,包括基于文本檢索、基于內(nèi)容檢索、語義檢索以及個(gè)性化Web圖像檢索,并詳細(xì)介紹了這4種流行圖像檢索技術(shù)的技術(shù)特點(diǎn),最后指出了Web圖像檢索技術(shù)的發(fā)展趨勢(shì)和研究方向。
【關(guān)鍵詞】基于文本圖像檢索 基于內(nèi)容的圖像檢索 基于語義檢索 個(gè)性化Web圖像檢索
一、引言
目前,Web圖像檢索技術(shù)和模型層出不窮,可大致分為基于文本的檢索、基于內(nèi)容的檢索、語義圖像檢索和個(gè)性化的Web圖像檢索四種。下面分別對(duì)其進(jìn)行介紹。
二、基于文本的圖像檢索
20世紀(jì)70年代,基于文本的圖像檢索技術(shù)(TBIR)得以發(fā)展。目前,該技術(shù)發(fā)展較為成熟,但需要較多人工參與,耗費(fèi)大量的人力和時(shí)間,而且不同的人對(duì)同一張圖像的理解也不相同,這就導(dǎo)致對(duì)Web圖像標(biāo)注沒有統(tǒng)一標(biāo)準(zhǔn),因而檢索的結(jié)果不能很好地符合用戶的需求[1]。同時(shí)在互聯(lián)網(wǎng)環(huán)境中,Web圖像數(shù)據(jù)不斷動(dòng)態(tài)更新,采用人工方式對(duì)圖像進(jìn)行廣泛標(biāo)注也無法實(shí)現(xiàn)。
三、基于內(nèi)容的圖像檢索
上世紀(jì)90年代,基于內(nèi)容的圖像檢索(CBIR)技術(shù)產(chǎn)生。它主要采用圖像的視覺特征來表示圖像的內(nèi)容,然后通過特征匹配算法進(jìn)行圖像檢索。
(一)圖像特征提取
圖像的特征主要包括底層特征和語義特征。目前的CBIR系統(tǒng)主要使用圖像底層特征來檢索圖像。底層特征主要包括圖像的顏色、紋理、形狀等定量特征。目前,顏色特征主要有顏色直方圖、顏色矩和顏色相關(guān)圖等。紋理特征有Gabor變換、塔式小波變換、灰度共生矩陣等。而形狀特征表示主要有基于邊界表示法和基于區(qū)域表示法。此外,近些年許多學(xué)者也研究了基于文本和視覺兩種信息在內(nèi)的Web圖像檢索,如文獻(xiàn)[2]中提出一種融合文本關(guān)鍵詞和圖像視覺內(nèi)容的Web圖像檢索方法,在一定程度上提高了Web圖像檢索質(zhì)量。
(二)圖像相似性匹配
圖像檢索的匹配策略大致分為完全匹配和相似性匹配。完全匹配是指兩張圖像的特征完全相同時(shí)圖像匹配成功;而相似性匹配是指兩張圖像特征間的距離在某一閾值內(nèi)匹配成功。在基于內(nèi)容的圖像檢索中,圖像底層視覺特征對(duì)比的相似性檢索匹配占據(jù)著主導(dǎo)地位。
四、基于語義的圖像檢索
底層的視覺特征不能代表圖像豐富的內(nèi)涵,使得基于內(nèi)容的圖像檢索效果并不理想。因此,出現(xiàn)了基于圖像語義的檢索技術(shù),主要包括語義層次模型、語義的提取方法和語義表示方法三方面內(nèi)容。
(一)語義層次模型
圖像語義是有粒度的,即具有層次性,所以可采用多層結(jié)構(gòu)對(duì)圖像語義進(jìn)行分析。
一般,根據(jù)圖像內(nèi)容可將圖像分為特征語義、對(duì)象和空間關(guān)系語義、高層語義3個(gè)層次。特征語義利用圖像的視覺特征及其組合進(jìn)行檢索。對(duì)象與空間關(guān)系語義,是分析圖像中對(duì)象的視覺特征、空間關(guān)系、位置等信息,得到圖像的語義描述。高層語義涉及到圖像的場(chǎng)景語義、行為語義和情感語義,該層語義是根據(jù)人的知識(shí)理解而來,主觀性較強(qiáng),提取工作較復(fù)雜。
(二)語義提取方法
圖像語義的提取是由底層特征向高層語義映射的過程,但現(xiàn)今的技術(shù)水平,直接根據(jù)底層的視覺特征推理出圖像高層語義很困難,目前主要方法有基于知識(shí)語義提取、基于人工交互語義提取和外部信息的語義提取。
(三)語義表示方法
語義表示方法主要有文本表示法和基于人工智能知識(shí)表示法。文本表示法是用文本對(duì)圖像或圖像區(qū)域進(jìn)行解釋。基于人工智能的知識(shí)表示方法,如語義網(wǎng)絡(luò)、數(shù)理邏輯等,該方法能夠表達(dá)較為復(fù)雜的關(guān)系,具備較強(qiáng)的模糊匹配能力,但目前通用性的知識(shí)表示模型尚不存在。
五、個(gè)性化Web圖像檢索
隨著多媒體技術(shù)的飛速發(fā)展,圖像的數(shù)量急劇增加,為了得到更準(zhǔn)確的符合個(gè)人需求的檢索結(jié)果,個(gè)性化Web圖像檢索成為研究熱點(diǎn)。個(gè)性化的實(shí)質(zhì)是針對(duì)不同用戶采用不同策略來提供不同的服務(wù)內(nèi)容。個(gè)性化圖像檢索則是根據(jù)用戶對(duì)檢索結(jié)果的反饋主動(dòng)學(xué)習(xí)和記錄用戶的興趣信息,推測(cè)出用戶的興趣需求。用戶興趣模型(User Preference Profile)是個(gè)性化圖像檢索的核心,它用于存儲(chǔ)和管理用戶興趣信息,通過收集用戶的反饋信息,建立初始用戶興趣模型,經(jīng)過長(zhǎng)期地學(xué)習(xí),不斷更新用戶興趣模型,最終可以得到用戶的興趣傾向,針對(duì)不同用戶提供個(gè)性化服務(wù)。
由于獲取用戶興趣面臨低層特征和高層語義之間的“語義鴻溝”問題,一些學(xué)者作了研究,如HE等人[3]提出了一種應(yīng)用于個(gè)性化圖像檢索的用戶興趣模型的構(gòu)建方法,以彌補(bǔ)語義鴻溝。QIU等 [4]提出基于用戶多媒體數(shù)據(jù)管理模型的個(gè)性化圖像檢索,建立用戶多媒體數(shù)據(jù)管理模型為用戶提供個(gè)性化圖像檢索。文獻(xiàn)[5]為了在個(gè)性化搜索過程中能夠準(zhǔn)確地挖掘到用戶的潛在興趣并進(jìn)行相應(yīng)的聚類分析,提出采用潛語義空間的Zipf分布的特性,并結(jié)合PLSA(概率潛在語義分析)來獲取全文的語義。
六、總結(jié)和展望
圖像檢索從基于文本的檢索發(fā)展到語義檢索,經(jīng)歷了簡(jiǎn)單到復(fù)雜、低級(jí)到高級(jí)的過程?;趫D像語義檢索,充分利用了圖像的語義信息,提高了圖像檢索的速度和質(zhì)量,應(yīng)用前景廣泛,但仍存在如何改進(jìn)語義提取方法以及語義描述方式等難題。目前,個(gè)性化Web圖像檢索成為主要研究熱點(diǎn),但如何更好地解決語義鴻溝,建立和改善用戶興趣模型成為一個(gè)值得深入研究的問題。
參考文獻(xiàn):
[1]魯珂,趙繼東,曾家智.一種適合Web圖像檢索的圖像降維算法研究.計(jì)算機(jī)科學(xué).2006,33(5):255~260
[2]黃鵬,陳純,王燦,卜佳俊,陳偉,仇光.使用加權(quán)圖像標(biāo)注改進(jìn)Web圖像檢索.浙江大學(xué)學(xué)報(bào)(工學(xué)版).2009,43(12):2129~2135
[3]賀琳,張菁,沈蘭蓀.個(gè)性化圖像檢索中用戶興趣模型的構(gòu)建方法.計(jì)算機(jī)工程與應(yīng)用.2009,45(31):168~171
[4]邱兆文,張?zhí)镂?基于用戶多媒體數(shù)據(jù)管理模型的個(gè)性化圖像檢索.電子學(xué)報(bào).2008,36(9):1749~1749
[5]陳冬玲,王大齡,于戈,于芳.基于PLAS方法的用戶興趣聚類.東北大學(xué)學(xué)報(bào)(自然科學(xué)版).2008,29(1):53~56
點(diǎn)擊下頁還有更多>>>圖片檢索技術(shù)論文