網(wǎng)絡(luò)故障檢測技術(shù)論文
計算機網(wǎng)絡(luò)故障種類較多,計算機網(wǎng)絡(luò)故障檢測是一個復(fù)雜的系統(tǒng)工程,不僅對網(wǎng)絡(luò)故障處理步驟有所要求,而且對網(wǎng)絡(luò)故障分析方法以及計算機故障維護都有極高的要求。下面是由學(xué)習(xí)啦小編整理的網(wǎng)絡(luò)故障檢測技術(shù)論文,謝謝你的閱讀。
網(wǎng)絡(luò)故障檢測技術(shù)論文篇一
網(wǎng)絡(luò)故障診斷技術(shù)概述
摘 要:對網(wǎng)絡(luò)故障診斷技術(shù)進行了概述。介紹了網(wǎng)絡(luò)故障診斷的基本概念及一般過程,重點對網(wǎng)絡(luò)故障診斷中的故障檢測、定位、原因診斷三個主要階段的關(guān)鍵技術(shù)和方法進行了深入研究,總結(jié)了相關(guān)領(lǐng)域經(jīng)典主流方法,并給出了方法具體過程和細節(jié)。
關(guān)鍵詞:網(wǎng)絡(luò)故障;故障檢測;故障定位;故障診斷;專家系統(tǒng);數(shù)據(jù)挖掘;神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP393.06
隨著計算機、通信以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展及應(yīng)用,網(wǎng)絡(luò)作為一種重要的工具,在軍事、政治、經(jīng)濟和科研等諸多領(lǐng)域起著越來越重要的作用,已經(jīng)成為社會生產(chǎn)和生活必不可少的一部分。與此同時,網(wǎng)絡(luò)的規(guī)模和復(fù)雜性不斷增大,一旦網(wǎng)絡(luò)發(fā)生故障,如果不能在有效時間內(nèi)對網(wǎng)絡(luò)故障進行診斷與修復(fù),將會造成巨大的損失,甚至嚴重威脅社會的安全與穩(wěn)定,因此對網(wǎng)絡(luò)故障診斷技術(shù)進行研究具有越來越重要的應(yīng)用價值和現(xiàn)實意義。
1 網(wǎng)絡(luò)故障診斷一般過程
通常來說,網(wǎng)絡(luò)故障診斷是以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運行的知識為基礎(chǔ),根據(jù)網(wǎng)絡(luò)出現(xiàn)的故障現(xiàn)象,并使用專門的網(wǎng)管理和檢測工具以獲取告警信息進而對網(wǎng)絡(luò)中出現(xiàn)的故障進行診斷、恢復(fù)以及預(yù)測的過程,一般可分為以下五個部分[1]:
(1)故障檢測,即網(wǎng)絡(luò)故障告警信息的獲取。網(wǎng)絡(luò)發(fā)生故障時,通過主動輪詢或異步收集方式,對網(wǎng)絡(luò)中的相關(guān)設(shè)備或服務(wù)的相關(guān)告警信息、設(shè)置和性能參數(shù),狀態(tài)信息等進行收集和分析,及時發(fā)現(xiàn)網(wǎng)絡(luò)出現(xiàn)的故障及問題。
(2)故障定位,即定位故障源。對故障檢測階段收集的海量告警數(shù)據(jù)進行分析和處理,在網(wǎng)絡(luò)中找出故障,為下一步的故障原因的診斷提供依據(jù)。
(3)故障原因的診斷,即查找故障產(chǎn)生的根源。根據(jù)故障定位的結(jié)果綜合運用各種規(guī)則進行系統(tǒng)的推理,快速的找到故障產(chǎn)生的原因或者最可能的原因。
(4)故障修復(fù)。根據(jù)網(wǎng)絡(luò)故障診斷結(jié)果修復(fù)網(wǎng)絡(luò)故障,恢復(fù)網(wǎng)絡(luò)的正常運行。
(5)故障預(yù)測,即根據(jù)先驗知識和監(jiān)測數(shù)據(jù)預(yù)測網(wǎng)絡(luò)可能發(fā)生的故障。
其中故障檢測,故障定位,故障原因診斷是必不可少的三個步驟,下面將重點對上述三個步驟進行詳細的介紹。
2 網(wǎng)絡(luò)故障檢測
通常計算機網(wǎng)絡(luò)通過以下兩種方式收集信息,通過分析收集到的信息來檢測故障[2]。
(1)Trap機制。在網(wǎng)絡(luò)中每一個被管設(shè)備中都要運行一個程序以便和管理站中的管理程序進行通信。
(2)主動輪詢。網(wǎng)絡(luò)中發(fā)生故障的被管設(shè)備或服務(wù)主動向網(wǎng)絡(luò)管理系統(tǒng)發(fā)出告警信息,能夠及時發(fā)現(xiàn)網(wǎng)絡(luò)中的故障,網(wǎng)絡(luò)管理系統(tǒng)還需通過主動輪詢這種方式了解與網(wǎng)絡(luò)性能密切相關(guān)的信息,并對這些影響網(wǎng)絡(luò)性能信息設(shè)置閾值,來判斷網(wǎng)絡(luò)性能,超過設(shè)定閾值也會觸發(fā)事件。
3 網(wǎng)絡(luò)故障定位
網(wǎng)絡(luò)系統(tǒng)中,一般通過監(jiān)測被管設(shè)備或服務(wù)等各種方法獲取大量原始告警數(shù)據(jù)或歷史積累信息,這些數(shù)據(jù)往往由于通信系統(tǒng)的復(fù)雜性、網(wǎng)絡(luò)結(jié)構(gòu)異構(gòu)性、噪聲、外界因素、因果關(guān)系等原因而具有相當(dāng)大的不確定性和不精確性,導(dǎo)致故障癥狀和故障原因都存在非線性映射關(guān)系,需要利用關(guān)聯(lián)技術(shù)對數(shù)據(jù)進行處理和分析才有效的進行故障定位[3],目前常用的故障定位技術(shù)主要有下面幾種:
3.1 基于人工智能的故障定位技術(shù)
3.1.1 基于規(guī)則的推理技術(shù)
基于規(guī)則的推理(Rule-based Reason,RBR)是最簡單的關(guān)聯(lián)技術(shù),已被用于多種構(gòu)架。一般而言,基于規(guī)則的系統(tǒng)由三個組成部分組成,如圖1所示。
(1)推理引擎,主要提供解決問題所需要的策略。
(2)知識庫,提供和定義與問題相關(guān)的規(guī)則和專家知識。
(3)工作內(nèi)存,主要提供解決問題所需要的數(shù)據(jù)。
在基于規(guī)則的推理的網(wǎng)絡(luò)故障定位系統(tǒng)中,知識庫充當(dāng)一個專家的角色,利用從人類專家獲取專家積累的經(jīng)驗和知識,這些知識主要包括對網(wǎng)絡(luò)問題的定義以及當(dāng)某一特定問題發(fā)生時,網(wǎng)絡(luò)故障定位系統(tǒng)需要執(zhí)行的操作。工作內(nèi)存主要是利用具體的網(wǎng)絡(luò)協(xié)議對網(wǎng)絡(luò)中的被管設(shè)備或服務(wù)進行監(jiān)測,得到有關(guān)被管設(shè)備或服務(wù)的各種信息。在對網(wǎng)絡(luò)故障進行定位時,推理引擎與知識庫共同合作,將監(jiān)測得到的網(wǎng)絡(luò)中被管設(shè)備或服務(wù)的狀態(tài)信息與知識庫中定義好的條件部分進行比對,根據(jù)條件滿足與否,來進行網(wǎng)絡(luò)故障的定位。
基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng),由于無需對專家系統(tǒng)的具體結(jié)構(gòu)和操作細節(jié)進行深入了解,從而具有結(jié)構(gòu)簡單等諸多優(yōu)點,并且實現(xiàn)起來比較簡單,非常適用于小型系統(tǒng)。但是基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)在匹配規(guī)則時,需要網(wǎng)絡(luò)狀態(tài)與知識庫中的規(guī)則條件精確匹配,否則將推出整個推理過程,無法定位故障,并且規(guī)則存在不易維護性和指數(shù)增長性,所有這些缺點決定了基于規(guī)則的網(wǎng)絡(luò)故障定位系統(tǒng)不適用大型系統(tǒng)。
3.1.2 基于模型的推理技術(shù)
基于模型的推理(Model-based Reason,MBR)是建立在面向?qū)ο笊系幕A(chǔ)之上,利用現(xiàn)有的專家經(jīng)驗和知識,將具體的目標系統(tǒng)中的實體都模型化診斷對象,并且明確地表現(xiàn)出現(xiàn)實目標系統(tǒng)中對象之間存在的各種關(guān)聯(lián)關(guān)系,再根據(jù)系統(tǒng)模型對具體的目標系統(tǒng)的行為進行推測。由于通常情況下,具體的目標系統(tǒng)與理想的系統(tǒng)模型之間存在差異性,因此基于模型的推理的專家系統(tǒng)需要對推測的行為和目標系統(tǒng)的實際行為進行不一致診斷,以確定具體目標系統(tǒng)中的故障根源。
為了更好地說明基于模型的推理專家系統(tǒng)的工作流程,文獻[4]使用一個物理模型和對應(yīng)的對等模型分別如圖2、3所示的網(wǎng)絡(luò)系統(tǒng)。網(wǎng)絡(luò)系統(tǒng)按一定的周期,有規(guī)律的向圖2中的被管設(shè)備發(fā)送ping命令以監(jiān)測網(wǎng)絡(luò)系統(tǒng)中的被管設(shè)備是否運行正常。管理系統(tǒng)和被管設(shè)備之間通過一個模型對象實現(xiàn)彼此之間的相互通信,具體來說,如圖2所示,系統(tǒng)中的集線器模型向被管設(shè)備集線器發(fā)送ping命令,路由器模型則向被管設(shè)備路由器發(fā)送ping命令。當(dāng)目標網(wǎng)絡(luò)發(fā)生故障時,如果故障發(fā)生在集線器1,則集線器1模型可以將其發(fā)現(xiàn)并且識別出來,如果集線器1模型連續(xù)3次向被管設(shè)備集線器1發(fā)送ping命令,在3次響應(yīng)超時以后,集線器模型1根據(jù)現(xiàn)有的網(wǎng)絡(luò)現(xiàn)象推測被管設(shè)備集線器1有可能發(fā)生故障,或者說目標系統(tǒng)中的故障位于集線器1。集線器1模型則會在確定故障并正式發(fā)送告警信息之前,集線器1模型將分析自身與圖2中其他被管設(shè)備的模型之間的關(guān)系以此來確定其是否應(yīng)該詢問網(wǎng)絡(luò)中路由器模型,如網(wǎng)絡(luò)中的路由器模型返回的是相應(yīng)的被管路由器設(shè)備工作處于正常狀態(tài),則集線器1觸發(fā)警報。 3.1.3 基于范例的推理技術(shù)
基于范例的推理(Case-based Reason,CBR)故障定位技術(shù)與前面的基于規(guī)則推理技術(shù)和基于模型推理技術(shù)相比具有很大的差異性,主要因為基于范例的推理技術(shù)的思想源于人類現(xiàn)實生活,主要根據(jù)過去積累的實際經(jīng)驗或經(jīng)歷,利用類比的推理方法對現(xiàn)有的新問題做出相似的解答,然后根據(jù)新問題與舊問題之間的差異對解答進行修改從而得到新問題的完全解答?;诜独评淼木W(wǎng)絡(luò)故障定位技術(shù)主要由四個部分組成,檢索 (Retrieve)、復(fù)用(Reuse)、修正(Revise)、保存(Retain),簡稱4R過程。
基于范例推理的故障定位技術(shù)與基于規(guī)則推理的故障定位技術(shù)相比,由于在基于范例推理的故障定位技術(shù)中檢索只是基于對案例的部分匹配,而基于規(guī)則推理的故障定位技術(shù)則是完全匹配,因此基于范例推理的故障定位技術(shù)對網(wǎng)絡(luò)配置變化的適應(yīng)度更好,更適用于問題的總體解決方案。
3.2 模型遍歷技術(shù)
模型遍歷技術(shù)(Model traversing techniques)是一種構(gòu)建網(wǎng)絡(luò)故障傳播模型的方法,該方法在構(gòu)建故障傳播模型時,主要根據(jù)網(wǎng)絡(luò)在運行時各種被管對象之間的相互關(guān)系,并且按照從引起事件的被管對象開始的順序進行構(gòu)建。該方法主要適用于網(wǎng)絡(luò)中被管對象之間的相互關(guān)系類似于圖形,并且一般情況下較容易獲取的情況,并且在系統(tǒng)配置變化較頻繁時該方法的魯棒性很好。模型遍歷技術(shù)主要具有兩大特點,事件驅(qū)動和事件關(guān)聯(lián),所謂事件驅(qū)動是指在一個故障癥狀報告到來之前,系統(tǒng)一直處于等待故障癥狀狀態(tài);事件關(guān)聯(lián)則是確定兩個故障癥狀是否來源同一個事件源。
一般情況下,模型遍歷技術(shù)需要在其事件報告中明確標識網(wǎng)絡(luò)系統(tǒng)中故障的征兆類型、征兆目標等相關(guān)信息,如果網(wǎng)絡(luò)系統(tǒng)中出現(xiàn)故障征兆,且不妨用si來表示該故障征兆,當(dāng)si的目標和si來源相同,則說明si是一個次要征兆也就說明某些告警信息可以被忽略。模型遍歷技術(shù)的整個處理可分為以下3步:
(1)首先,對網(wǎng)絡(luò)中的每個事件,依據(jù)網(wǎng)絡(luò)在運行時各種被管對象之間的相互關(guān)系對其構(gòu)建一個和事件源相關(guān)的對象圖。
(2)當(dāng)給定的兩個事件的對象圖相交時,此時說明兩個圖至少包含同一個對象,則認為這兩個對象圖的事件源是關(guān)聯(lián)的。
(3)當(dāng)給定三個故障癥狀si,sj,sk,其中si,sj相互關(guān)聯(lián),sj,sk相互關(guān)聯(lián),則根據(jù)故障癥狀的傳遞性可知si是一個次要的故障癥狀。
4 網(wǎng)絡(luò)故障原因診斷
(1)基于信號處理方法。該方法主要是依據(jù)信號模型,直接對網(wǎng)絡(luò)系統(tǒng)中的可測信號進行分析與處理,并通過提取可測信號的頻率等特征值,對網(wǎng)絡(luò)中存在的故障原因進行診斷。
(2)基于解析模型的方法?;诮馕瞿P偷姆椒ㄖ饕罁?jù)數(shù)學(xué)模型和數(shù)學(xué)方法來進行故障原因的診斷,在診斷時需要建立對象的精確數(shù)學(xué)模型。
(3)基于知識檢測的方法。與基于解析模型方法相比,此方法最大的特點在于其并不需要對象的精確數(shù)學(xué)模型就可以對網(wǎng)絡(luò)中的故障原因進行診斷。
下面主要介紹幾種目前國內(nèi)外研究學(xué)者研究比較多的基于知識檢測的方法,基于專家系統(tǒng)故障原因診斷方法和基于模糊理論故障原因診斷方法以及基于BP神經(jīng)網(wǎng)絡(luò)故障原因檢測方法。
4.1 基于專家系統(tǒng)故障原因診斷方法
基于專家系統(tǒng)故障原因診斷系統(tǒng)主要是利用人類專家的經(jīng)驗和歷史積累診斷數(shù)據(jù),使用一定的方法將其轉(zhuǎn)化為系統(tǒng)能夠識別的規(guī)則存在專家系統(tǒng)的知識庫中。當(dāng)網(wǎng)絡(luò)中出現(xiàn)故障時,診斷系統(tǒng)利用專家系統(tǒng)知識庫中的規(guī)則,對發(fā)生故障網(wǎng)絡(luò)中的被管對象的各項性能參數(shù)進行處理與分析以正確的確定網(wǎng)絡(luò)故障發(fā)生的具體原因[5]。組成由人機接口、推理機、知識庫等六部分組成:
目前,國內(nèi)外學(xué)者公認的專家系統(tǒng)瓶頸是知識獲取問題,因為專家系統(tǒng)在診斷過程中主要依賴于從人類專家領(lǐng)域內(nèi)獲取的知識、經(jīng)驗和以往診斷數(shù)據(jù),而這些獲取起來途徑有限,操作起來具有一定的局限性和復(fù)雜性。另外,專家系統(tǒng)在實時性和學(xué)習(xí)能力等方面也存在一定的局限性,因此目前通常將專家系統(tǒng)同其他方法相結(jié)合以提高專家系統(tǒng)在這些方面存在的局限性和不足。
4.2 模糊故障診斷方法
很多時候,網(wǎng)絡(luò)中的故障與系統(tǒng)得到的網(wǎng)絡(luò)現(xiàn)象之間存在非線性的映射關(guān)系,這種非線性的映射關(guān)系很難用確定的數(shù)學(xué)公式或者模型來刻畫,相應(yīng)的在故障原因診斷時,很難給出故障的精確原因。相反,只能給出故障發(fā)生的可能原因。對于這種存在一定模糊性的問題,可以使用模糊邏輯來解決。
目前使用的比較多的是向量識別法,其診斷過程可分為以下3步:
首先,需要根據(jù)網(wǎng)絡(luò)中的故障與表征網(wǎng)絡(luò)故障的數(shù)據(jù),建立二者之間的關(guān)系,通常用關(guān)系矩陣R來表示。
其次,對需要診斷的目標網(wǎng)絡(luò)系統(tǒng)(對象)進行狀態(tài)檢測,提取相關(guān)的特征參數(shù)以構(gòu)建特征向量矩陣X。
最后,根據(jù)模糊理論和矩陣理論,求解前面兩步構(gòu)建的關(guān)系矩陣方程Y=X・R,得到關(guān)系矩陣方程的解Y,再根據(jù)隸屬度等原則,對目標網(wǎng)絡(luò)系統(tǒng)的故障向量Y進行處理,得到故障的原因。
從上述診斷過程可知,在模糊故障診斷中,正確的進行故障原因診斷的前提是建立關(guān)系矩陣R、隸屬函數(shù)、特征值向量X,而這些矩陣、函數(shù)、向量的建立是人為構(gòu)造而成,難免具有一定的主觀性,并且由于該模糊診斷方法對特征元素的選取也有一定的要求,所以兩者若處理不當(dāng),會導(dǎo)致該方法的診斷結(jié)果精度嚴重下降甚至完全錯誤。
4.3 BP神經(jīng)網(wǎng)絡(luò)診斷方法
由于人工神經(jīng)網(wǎng)絡(luò)的這些特性以及網(wǎng)絡(luò)中故障與征兆之間有可能存在的非線性映射關(guān)系,使得人工神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)故障診斷中大有用武之地。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)大量應(yīng)用在網(wǎng)絡(luò)故障診斷領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)是常用的人工神經(jīng)網(wǎng)絡(luò)模型[6]。
BP神經(jīng)網(wǎng)絡(luò)故障診斷分為訓(xùn)練和診斷兩個階段:
(1)訓(xùn)練階段。BP神經(jīng)網(wǎng)絡(luò)對樣本進行訓(xùn)練,以選定網(wǎng)絡(luò)結(jié)構(gòu)和規(guī)模,確定網(wǎng)絡(luò)總層數(shù)、各層神經(jīng)元數(shù)。借助BP學(xué)習(xí)算法,將原始網(wǎng)絡(luò)收集到的故障樣本的特征參數(shù)作為BP神經(jīng)網(wǎng)絡(luò)輸入樣本集,以與之對應(yīng)的網(wǎng)絡(luò)故障原因編碼為BP神經(jīng)網(wǎng)絡(luò)的輸出,以此對BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。
(2)故障診斷階段。主要對待檢測對象的故障樣本進行特征提取和歸一化處理,然后輸入到BP神經(jīng)網(wǎng)絡(luò)進行診斷輸出診斷結(jié)果,整個過程分為以下4個步驟:1)故障樣本集預(yù)處理。2)BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計。3)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。4)故障診斷。
5 結(jié)束語
本文對網(wǎng)絡(luò)故障的概念以及基本過程進行了概述,重點對當(dāng)前網(wǎng)絡(luò)故障中的故障檢測、故障定位、故障診斷的關(guān)鍵技術(shù)及方法進行了研究和總結(jié)歸納,對開展網(wǎng)絡(luò)故障診斷技術(shù)研究具有一定的指導(dǎo)意義。
參考文獻:
[1]王成等.網(wǎng)絡(luò)故障診斷技術(shù)研究[J].科技信息,2011(11).
[2]陳琳.一種網(wǎng)絡(luò)環(huán)境中的故障診斷模型[J].北京航空航天大學(xué)學(xué)報,2004(11).
[3]張燕.網(wǎng)絡(luò)故障診斷關(guān)鍵技術(shù)[J].電腦知識與技術(shù),2009(31).
[4]李千目.戰(zhàn)略互聯(lián)網(wǎng)智能診斷技術(shù)研究[D].南京理工大學(xué),2005.
[5]吳曉知,李興明.網(wǎng)絡(luò)故障管理專家系統(tǒng)中知識庫的構(gòu)造[J].微計算機信息,2008(06).
[6]戚涌,劉鳳玉.基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)智能診斷系統(tǒng)[J].微電子學(xué)與計算機,2004(10).
作者簡介:張璋(1987.12-),男,安徽蚌埠人,碩士研究生,研究方向:網(wǎng)絡(luò)安全、身份認證。
作者單位:南京理工大學(xué) 計算機科學(xué)與工程學(xué)院,南京 210094
點擊下頁還有更多>>>網(wǎng)絡(luò)故障檢測技術(shù)論文