圖片檢索技術(shù)論文

時(shí)間：2017-03-08 17:04:05 家文952由分享

圖片檢索技術(shù)論文

　　圖像檢索是網(wǎng)絡(luò)信息檢索中的重要的組成部分，小編整理了圖片檢索技術(shù)論文，歡迎閱讀!

　　圖片檢索技術(shù)論文篇一

　　Web圖像檢索技術(shù)綜述

　　【摘要】多媒體技術(shù)的迅速發(fā)展，促進(jìn)了Web圖像檢索技術(shù)的創(chuàng)新和發(fā)展。針對(duì)目前的發(fā)展?fàn)顩r，本文對(duì)Web圖像檢索技術(shù)做了深入的分析和研究，包括基于文本檢索、基于內(nèi)容檢索、語義檢索以及個(gè)性化Web圖像檢索，并詳細(xì)介紹了這4種流行圖像檢索技術(shù)的技術(shù)特點(diǎn)，最后指出了Web圖像檢索技術(shù)的發(fā)展趨勢(shì)和研究方向。

　　【關(guān)鍵詞】基于文本圖像檢索基于內(nèi)容的圖像檢索基于語義檢索個(gè)性化Web圖像檢索

　　一、引言

　　目前，Web圖像檢索技術(shù)和模型層出不窮，可大致分為基于文本的檢索、基于內(nèi)容的檢索、語義圖像檢索和個(gè)性化的Web圖像檢索四種。下面分別對(duì)其進(jìn)行介紹。

　　二、基于文本的圖像檢索

　　20世紀(jì)70年代，基于文本的圖像檢索技術(shù)(TBIR)得以發(fā)展。目前，該技術(shù)發(fā)展較為成熟，但需要較多人工參與，耗費(fèi)大量的人力和時(shí)間，而且不同的人對(duì)同一張圖像的理解也不相同，這就導(dǎo)致對(duì)Web圖像標(biāo)注沒有統(tǒng)一標(biāo)準(zhǔn)，因而檢索的結(jié)果不能很好地符合用戶的需求[1]。同時(shí)在互聯(lián)網(wǎng)環(huán)境中，Web圖像數(shù)據(jù)不斷動(dòng)態(tài)更新，采用人工方式對(duì)圖像進(jìn)行廣泛標(biāo)注也無法實(shí)現(xiàn)。

　　三、基于內(nèi)容的圖像檢索

　　上世紀(jì)90年代，基于內(nèi)容的圖像檢索(CBIR)技術(shù)產(chǎn)生。它主要采用圖像的視覺特征來表示圖像的內(nèi)容，然后通過特征匹配算法進(jìn)行圖像檢索。

　　(一)圖像特征提取

　　圖像的特征主要包括底層特征和語義特征。目前的CBIR系統(tǒng)主要使用圖像底層特征來檢索圖像。底層特征主要包括圖像的顏色、紋理、形狀等定量特征。目前，顏色特征主要有顏色直方圖、顏色矩和顏色相關(guān)圖等。紋理特征有Gabor變換、塔式小波變換、灰度共生矩陣等。而形狀特征表示主要有基于邊界表示法和基于區(qū)域表示法。此外，近些年許多學(xué)者也研究了基于文本和視覺兩種信息在內(nèi)的Web圖像檢索，如文獻(xiàn)[2]中提出一種融合文本關(guān)鍵詞和圖像視覺內(nèi)容的Web圖像檢索方法，在一定程度上提高了Web圖像檢索質(zhì)量。

　　(二)圖像相似性匹配

　　圖像檢索的匹配策略大致分為完全匹配和相似性匹配。完全匹配是指兩張圖像的特征完全相同時(shí)圖像匹配成功;而相似性匹配是指兩張圖像特征間的距離在某一閾值內(nèi)匹配成功。在基于內(nèi)容的圖像檢索中，圖像底層視覺特征對(duì)比的相似性檢索匹配占據(jù)著主導(dǎo)地位。

　　四、基于語義的圖像檢索

　　底層的視覺特征不能代表圖像豐富的內(nèi)涵，使得基于內(nèi)容的圖像檢索效果并不理想。因此，出現(xiàn)了基于圖像語義的檢索技術(shù)，主要包括語義層次模型、語義的提取方法和語義表示方法三方面內(nèi)容。

　　(一)語義層次模型

　　圖像語義是有粒度的，即具有層次性，所以可采用多層結(jié)構(gòu)對(duì)圖像語義進(jìn)行分析。

　　一般，根據(jù)圖像內(nèi)容可將圖像分為特征語義、對(duì)象和空間關(guān)系語義、高層語義3個(gè)層次。特征語義利用圖像的視覺特征及其組合進(jìn)行檢索。對(duì)象與空間關(guān)系語義，是分析圖像中對(duì)象的視覺特征、空間關(guān)系、位置等信息，得到圖像的語義描述。高層語義涉及到圖像的場(chǎng)景語義、行為語義和情感語義，該層語義是根據(jù)人的知識(shí)理解而來，主觀性較強(qiáng)，提取工作較復(fù)雜。

　　(二)語義提取方法

　　圖像語義的提取是由底層特征向高層語義映射的過程，但現(xiàn)今的技術(shù)水平，直接根據(jù)底層的視覺特征推理出圖像高層語義很困難，目前主要方法有基于知識(shí)語義提取、基于人工交互語義提取和外部信息的語義提取。

　　(三)語義表示方法

　　語義表示方法主要有文本表示法和基于人工智能知識(shí)表示法。文本表示法是用文本對(duì)圖像或圖像區(qū)域進(jìn)行解釋。基于人工智能的知識(shí)表示方法，如語義網(wǎng)絡(luò)、數(shù)理邏輯等，該方法能夠表達(dá)較為復(fù)雜的關(guān)系，具備較強(qiáng)的模糊匹配能力，但目前通用性的知識(shí)表示模型尚不存在。

　　五、個(gè)性化Web圖像檢索

　　隨著多媒體技術(shù)的飛速發(fā)展，圖像的數(shù)量急劇增加，為了得到更準(zhǔn)確的符合個(gè)人需求的檢索結(jié)果，個(gè)性化Web圖像檢索成為研究熱點(diǎn)。個(gè)性化的實(shí)質(zhì)是針對(duì)不同用戶采用不同策略來提供不同的服務(wù)內(nèi)容。個(gè)性化圖像檢索則是根據(jù)用戶對(duì)檢索結(jié)果的反饋主動(dòng)學(xué)習(xí)和記錄用戶的興趣信息，推測(cè)出用戶的興趣需求。用戶興趣模型(User Preference Profile)是個(gè)性化圖像檢索的核心，它用于存儲(chǔ)和管理用戶興趣信息，通過收集用戶的反饋信息，建立初始用戶興趣模型，經(jīng)過長(zhǎng)期地學(xué)習(xí)，不斷更新用戶興趣模型，最終可以得到用戶的興趣傾向，針對(duì)不同用戶提供個(gè)性化服務(wù)。

　　由于獲取用戶興趣面臨低層特征和高層語義之間的“語義鴻溝”問題，一些學(xué)者作了研究，如HE等人[3]提出了一種應(yīng)用于個(gè)性化圖像檢索的用戶興趣模型的構(gòu)建方法，以彌補(bǔ)語義鴻溝。QIU等 [4]提出基于用戶多媒體數(shù)據(jù)管理模型的個(gè)性化圖像檢索，建立用戶多媒體數(shù)據(jù)管理模型為用戶提供個(gè)性化圖像檢索。文獻(xiàn)[5]為了在個(gè)性化搜索過程中能夠準(zhǔn)確地挖掘到用戶的潛在興趣并進(jìn)行相應(yīng)的聚類分析，提出采用潛語義空間的Zipf分布的特性，并結(jié)合PLSA(概率潛在語義分析)來獲取全文的語義。

　　六、總結(jié)和展望

　　圖像檢索從基于文本的檢索發(fā)展到語義檢索，經(jīng)歷了簡(jiǎn)單到復(fù)雜、低級(jí)到高級(jí)的過程?；趫D像語義檢索，充分利用了圖像的語義信息，提高了圖像檢索的速度和質(zhì)量，應(yīng)用前景廣泛，但仍存在如何改進(jìn)語義提取方法以及語義描述方式等難題。目前，個(gè)性化Web圖像檢索成為主要研究熱點(diǎn)，但如何更好地解決語義鴻溝，建立和改善用戶興趣模型成為一個(gè)值得深入研究的問題。

　　參考文獻(xiàn)：

　　[1]魯珂，趙繼東，曾家智.一種適合Web圖像檢索的圖像降維算法研究.計(jì)算機(jī)科學(xué).2006，33(5)：255～260

　　[2]黃鵬，陳純，王燦，卜佳俊，陳偉，仇光.使用加權(quán)圖像標(biāo)注改進(jìn)Web圖像檢索.浙江大學(xué)學(xué)報(bào)(工學(xué)版).2009，43(12)：2129～2135

　　[3]賀琳，張菁，沈蘭蓀.個(gè)性化圖像檢索中用戶興趣模型的構(gòu)建方法.計(jì)算機(jī)工程與應(yīng)用.2009，45(31)：168～171

　　[4]邱兆文，張?zhí)镂?基于用戶多媒體數(shù)據(jù)管理模型的個(gè)性化圖像檢索.電子學(xué)報(bào).2008，36(9)：1749～1749

　　[5]陳冬玲，王大齡，于戈，于芳.基于PLAS方法的用戶興趣聚類.東北大學(xué)學(xué)報(bào)(自然科學(xué)版).2008，29(1)：53～56

點(diǎn)擊下頁還有更多>>>圖片檢索技術(shù)論文

不卡AV在线|网页在线观看无码高清|亚洲国产亚洲国产|国产伦精品一区二区三区免费视频

圖片檢索技術(shù)論文

圖片檢索技術(shù)論文篇一

相關(guān)文章

熱門文章