計(jì)算機(jī)信息檢索技術(shù)的相關(guān)論文(2)
計(jì)算機(jī)信息檢索技術(shù)的相關(guān)論文
計(jì)算機(jī)信息檢索技術(shù)的相關(guān)論文篇二
《多媒體數(shù)據(jù)庫(kù)檢索技術(shù)初探》
【摘 要】本文介紹了兩種多媒體數(shù)據(jù)庫(kù)的查詢方法,分析了基于內(nèi)容的檢索特點(diǎn)和處理過程,闡述了圖象數(shù)據(jù)查詢和檢索的基本過程和相關(guān)技術(shù)。
【關(guān)鍵詞】多媒體 數(shù)據(jù)庫(kù) 檢索
多媒體數(shù)據(jù)庫(kù)從作為傳統(tǒng)數(shù)據(jù)庫(kù)的一種高級(jí)應(yīng)用開始,到作為適合多媒體數(shù)據(jù)的數(shù)據(jù)庫(kù)管理系統(tǒng),已經(jīng)經(jīng)歷了十來年的研究與發(fā)展。傳統(tǒng)數(shù)據(jù)庫(kù)技術(shù)有一個(gè)根本的出發(fā)點(diǎn),就是企圖用一個(gè)統(tǒng)一的模式、統(tǒng)一的框架來描述、組織、處理客觀世界所有對(duì)象。凡是不滿足這種模式和柜架的對(duì)象就加以改造,而在改造過程中又不可避免地丟掉了許多語(yǔ)義信息。但多媒體數(shù)據(jù)類型卻無(wú)法處理,也無(wú)法改造。研究表面向?qū)ο髷?shù)據(jù)庫(kù)是解決多媒體數(shù)據(jù)庫(kù)較為科學(xué)的方法和工具,它可以方便靈活地處理圖形、圖像、聲音、文字、動(dòng)畫等多媒體信息,尤其是具有層次結(jié)構(gòu)的復(fù)雜對(duì)象。
一 兩種多媒體數(shù)據(jù)庫(kù)查詢方法
多媒體數(shù)據(jù)庫(kù)查詢方法分為基于表示和內(nèi)容兩大類?;诒硎镜臋z索目前已相對(duì)成熟,并且得到廣泛的應(yīng)用?;诒硎拘问降臋z索與數(shù)據(jù)類型和數(shù)據(jù)結(jié)構(gòu)有關(guān),在進(jìn)行檢索時(shí),只需對(duì)關(guān)鍵字檢索表進(jìn)行檢索,再根據(jù)關(guān)鍵字檢索表的指針,找到相應(yīng)的數(shù)據(jù)。它的特點(diǎn)是檢索速度快、精確度高。但在實(shí)際應(yīng)用中,存在基于內(nèi)容的檢索需求。例如,“查找與相片A面貌相似的人”就要求基于內(nèi)容的檢索,這一類檢索和查詢更加實(shí)用,更貼近人的思維和日常需要,是今后檢索的主流,而基于表示的檢索對(duì)于這一類檢索要求則無(wú)能為力。基于內(nèi)容的檢索是根據(jù)媒體內(nèi)容語(yǔ)義進(jìn)行檢索的。很明顯,人類語(yǔ)言極其豐富,人與人之間思維方式不同,同樣的,意義會(huì)有許多種表示方式,因此,對(duì)語(yǔ)義進(jìn)行精確的分析困難很大,分析出來的結(jié)果不可能很精確。所以,基于內(nèi)容的檢索形式雖然能根據(jù)媒體內(nèi)容語(yǔ)義進(jìn)行檢索,但是檢索速度很慢、精確度低。
二 基于內(nèi)容檢索的特點(diǎn)
隨著多媒體技術(shù)的普及,人們將大量接觸和處理多媒體信息,但每一種媒體數(shù)據(jù)都存在難以用符號(hào)化的方法進(jìn)行描述的問題,如圖像中的顏色、視頻中的運(yùn)動(dòng)、音頻中的音調(diào)等。當(dāng)用戶需要利用這些信息線索對(duì)數(shù)據(jù)進(jìn)行檢索時(shí),傳統(tǒng)的數(shù)據(jù)庫(kù)采用關(guān)鍵詞的檢索方式是不能完成的,為了滿足這種更深層次的檢索即基于內(nèi)容的檢索,就要先了解它的特點(diǎn):一是從媒體內(nèi)容中提取信息線索;二是提取特征的方法多種多樣;三是人機(jī)交互進(jìn)行基于內(nèi)容的檢索是一種近似匹配。
三 基于內(nèi)容的檢索的體系結(jié)構(gòu)
基于內(nèi)容的檢索作為一種信息檢索技術(shù),如超媒體系統(tǒng)、會(huì)議系統(tǒng)、多媒體信息系統(tǒng)等,提供基于多媒體數(shù)據(jù)內(nèi)容的信息查詢和檢索。因此,應(yīng)將基于內(nèi)容的檢索設(shè)計(jì)為多媒體數(shù)據(jù)庫(kù)的檢索引擎結(jié)構(gòu),在體系結(jié)構(gòu)上劃分為兩個(gè)子系統(tǒng):特征提取子系統(tǒng)和查詢子系統(tǒng),如下圖所示。
第一,目標(biāo)標(biāo)識(shí)。為用戶提供一種工具,以全自動(dòng)或半自動(dòng)的方式標(biāo)識(shí)靜態(tài)圖像、視頻鏡頭等媒體區(qū)域,以便針對(duì)目標(biāo)進(jìn)行特征提取并查詢。
第二,特征提取。對(duì)多媒體數(shù)據(jù)進(jìn)行特征提取,提取用戶感興趣、適合檢索要求的特征。特征提取可以是全局性的(如整幅圖像的視頻鏡頭),也可以是有針對(duì)性的(如視頻中的運(yùn)動(dòng)對(duì)象)等。
第三,數(shù)據(jù)庫(kù)。生成的數(shù)據(jù)庫(kù)由媒體庫(kù)、特征庫(kù)和知識(shí)庫(kù)三部分組成。媒體庫(kù)包含圖像、視頻、音頻、文本等多媒體數(shù)據(jù);特征庫(kù)包含用戶輸入的特征和預(yù)處理自動(dòng)提取的內(nèi)容特征;知識(shí)庫(kù)表達(dá)可以更換以使用各種不同的應(yīng)用領(lǐng)域。
第四,查詢接口。友好的人機(jī)交互界面是檢索系統(tǒng)不可缺少的。在基于內(nèi)容的檢索中,由于特征不直觀,因此必須為其提供一個(gè)可視化的輸入手段,還應(yīng)在用戶界面提供查詢結(jié)果的創(chuàng)覽功能。
第五,檢索引擎。檢索是利用特征之間的距離函數(shù)進(jìn)行相似性檢索。對(duì)于不同類型的媒體數(shù)據(jù)有不同的相似性檢測(cè)算法,檢索引擎中有一個(gè)有效可靠的相似性檢測(cè)函數(shù)集。
四 基于內(nèi)容檢索的處理過程
基于內(nèi)容的查詢和檢索是一個(gè)逐步求精的過程,也是一種特征不斷調(diào)整,重新匹配的循環(huán)過程。用戶查詢一個(gè)數(shù)據(jù)對(duì)象時(shí),利用人機(jī)界面提供的輸人方式形成一個(gè)查詢條件,將查詢特征與數(shù)據(jù)庫(kù)中的特征按照一定的匹配算法進(jìn)行匹配,然后把滿足一定相似性的一組候選結(jié)果按相似度大小排列返回給用戶,對(duì)系統(tǒng)返回的查詢結(jié)果,用戶可以通過測(cè)覽挑選滿意的結(jié)果,也可以從中選擇一個(gè)示例,進(jìn)行特征調(diào)整,最后形成―個(gè)新的查詢條件,如此逐步縮小查詢范圍,直到用戶對(duì)結(jié)果滿意為止。基于內(nèi)容檢索的處理過程包括如下過程:一是初始檢索說明,二是相似性匹配,三是特征調(diào)整,四是重新檢索。該過程直到用戶放棄或得到滿意檢索結(jié)果為止。
五 結(jié)束語(yǔ)
本文研究的是多媒體圖象數(shù)據(jù)的查詢和檢索方法。多媒體數(shù)據(jù)庫(kù)基于內(nèi)容檢索技術(shù)是目前數(shù)據(jù)庫(kù)研究的一個(gè)熱點(diǎn)問題。高效快速地對(duì)媒體數(shù)據(jù)進(jìn)行檢索,首先要建立數(shù)據(jù)生成子系統(tǒng)和數(shù)據(jù)查詢系統(tǒng),生成媒體庫(kù)、特征庫(kù)、知識(shí)庫(kù)等數(shù)據(jù)庫(kù);然后要對(duì)圖象進(jìn)行分割、提取特征、分類描述,分類結(jié)果存入相應(yīng)的數(shù)據(jù)庫(kù)中;最后進(jìn)行相似匹配,完成查詢和檢索過程。
參考文獻(xiàn)
[1]武獻(xiàn)宇等.基于內(nèi)容的信息檢索技術(shù)研究[J].電腦知識(shí)與技術(shù).2009(8).
[2]曹靜.多媒體數(shù)據(jù)庫(kù)基于內(nèi)容檢索方法的研究[J].武漢工程職業(yè)技術(shù)學(xué)院學(xué)報(bào).2005(12).
[3]鄭慶華、李人厚、胡峻.多媒體數(shù)據(jù)庫(kù)的主要問題、研究?jī)?nèi)容與實(shí)現(xiàn)方法[J].計(jì)算機(jī)工程與應(yīng)用.1998(1).
[4]鄭慶華、李人厚等.分布式多媒體數(shù)據(jù)庫(kù)技術(shù)研究.小型微型計(jì)算機(jī)系統(tǒng).1998(7).
[5]蔡巍、劉玉照.基于內(nèi)容檢索多媒體數(shù)據(jù)庫(kù)的構(gòu)建[J].中國(guó)圖書館學(xué)報(bào).2000(3).
[6]李蘭蘭、魏蛟龍.數(shù)字圖書館中多媒體數(shù)據(jù)庫(kù)信息的檢索[J].大學(xué)圖書情報(bào)學(xué)刊.2004(3).
[7]晏弼成.多媒體圖象數(shù)據(jù)的查詢與檢索[J].計(jì)算機(jī)工程.2001(5).
計(jì)算機(jī)信息檢索技術(shù)的相關(guān)論文相關(guān)文章:
3.有關(guān)計(jì)算機(jī)信息處理應(yīng)用論文
4.關(guān)于計(jì)算機(jī)認(rèn)識(shí)的論文