1.引言
網(wǎng)絡虛擬化允許多個服務提供商動態(tài)地組織多個異構的虛擬網(wǎng)絡,并在其上部署并管理客戶化的端到端業(yè)務。網(wǎng)絡虛擬化提供了在共享底層設施上運行多個網(wǎng)絡的有效方式。并且,作為一種長期解決方案,網(wǎng)絡虛擬化在支持未來網(wǎng)絡中多種體系結構同時共存方面發(fā)揮著重要的作用。
在網(wǎng)絡虛擬化環(huán)境中,傳統(tǒng)的網(wǎng)絡服務提供商(ISP)分離成基礎設施提供商(InP)和服務提供商(SP)。基礎設施提供商負責搭建底層物理網(wǎng)絡,提供物理資源。服務提供商租賃底層物理資源,組建虛擬網(wǎng)絡并在虛擬網(wǎng)絡上部署客戶化的協(xié)議和應用。有些文獻將SP進一步分離為虛擬網(wǎng)絡提供商和應用提供商。網(wǎng)絡虛擬化屏蔽了物理層的細節(jié),在技術上為網(wǎng)絡上運行多樣化的協(xié)議和應用提供了可能:在經(jīng)濟上通過共享底層基礎設施避免了對基礎設施的重復購買和運維成本?梢灶A見.在未來網(wǎng)絡環(huán)境中。虛擬網(wǎng)絡之上將運行日益豐富的網(wǎng)絡協(xié)議和應用,而網(wǎng)絡的健壯性和生存性勢必成為網(wǎng)絡虛擬化研究和發(fā)展過程中一個不容忽視的問題。
故障管理是網(wǎng)絡管理中重要的研究領域。網(wǎng)絡故障管理的目標是及時準確地定位網(wǎng)絡故障,并迅速對網(wǎng)絡故障進行響應,盡快隔離故障和恢復故障,從而盡可能減少或避免網(wǎng)絡故障對其上運行的業(yè)務的影響。然而在網(wǎng)絡虛擬化環(huán)境中,虛擬網(wǎng)絡和設施擴大了網(wǎng)絡的規(guī)模,為網(wǎng)絡狀態(tài)感知帶來更大的難度和復雜度:虛擬化技術在提供了按需創(chuàng)建、遷移、調整和撤銷虛擬網(wǎng)絡等靈活性的同時,也導致虛擬網(wǎng)絡和物理網(wǎng)絡間映射關系的不確定,給建立故障傳播模型和診斷故障帶來一定的復雜性;此外.虛擬網(wǎng)絡和物理網(wǎng)絡對資源能力、服務質量、管理成本等方面的需求也為網(wǎng)絡虛擬化環(huán)境下的故障恢復機制帶來很大的挑戰(zhàn)。而傳統(tǒng)IP網(wǎng)的故障探測、定位和恢復機制面向的是確定的、單一層次的網(wǎng)絡,無法處理上述不確定性和映射約束,并且需要針對擴大的網(wǎng)絡規(guī)模做出進一步優(yōu)化。因此.需要提出相應的故障管理機制,以便有效地對虛擬網(wǎng)絡故障狀態(tài)進行探測.及時準確地對虛擬網(wǎng)絡故障進行定位.快速高效地將網(wǎng)絡和業(yè)務從故障影響中恢復,從而提升虛擬網(wǎng)絡的頑健性、生存性和可管理性。
2.網(wǎng)絡虛擬化環(huán)境下的故障管理流程
網(wǎng)絡虛擬化環(huán)境下故障管理的基本過程為:通過在探測站點上發(fā)送一系列的探針,并收集探針返回的結果.獲得被管網(wǎng)絡中故障狀態(tài)信息;運用癥狀信息并結合網(wǎng)絡中的故障傳播模型診斷引發(fā)癥狀的根源故障:最后基于故障的位置.將虛擬網(wǎng)絡及相應的業(yè)務切換到預留的備份資源或臨時選擇的空閑資源上,最大限度減少或避免故障帶來的影響。
網(wǎng)絡虛擬化環(huán)境下故障管理的過程如圖1所示,各階段簡單描述如下。
圖1故障管理流程
故障探測階段:定期向網(wǎng)絡中發(fā)送探針,探測物理鏈路和節(jié)點以及虛擬鏈路和節(jié)點的運行狀態(tài).并收集探測信息。為減少探測對網(wǎng)絡性能的影響并提高診斷的處理速度。該階段需要運用優(yōu)化策略選取探測站點及探針集合。
故障定位階段:基于探測到的網(wǎng)絡癥狀信息和網(wǎng)絡的故障傳播模型,運行故障診斷算法,根據(jù)診斷結果判定網(wǎng)絡環(huán)境中是否發(fā)生故障,如果存在故障則進入故障恢復階段,如果未發(fā)生故障,則繼續(xù)定期探測網(wǎng)絡的運行狀態(tài)。
故障恢復階段:如果采用預留資源的恢復方案,則調用預先設計好的備份恢復方案:如果不采用預留資源的恢復方案,則管理系統(tǒng)需根據(jù)故障發(fā)生位置,臨時為故障網(wǎng)絡和業(yè)務選取可用資源。無論是預留資源的恢復方案還是無預留資源的恢復方案均須遵循相應的故障恢復策略,這些策略將綜合權衡質量、容量、成本等各種因素。最后基于恢復方案對網(wǎng)絡設施進行調整配置,實現(xiàn)故障恢復。
3.網(wǎng)絡虛擬化環(huán)境下故障管理的研究方向
基于網(wǎng)絡虛擬化環(huán)境的特性并圍繞故障管理流程的3個關鍵環(huán)節(jié)。要實現(xiàn)網(wǎng)絡虛擬化環(huán)境的故障管理.需要解決以下3個關鍵問題。
設計優(yōu)化的故障探測機制,感知網(wǎng)絡的故障狀態(tài)。
設計及時準確的故障診斷機制,定位網(wǎng)絡故障。
研究基于資源容量、位置:成本等各種因素的故障恢復機制,滿足服務質量要求。本文從故障探測、故障定位和故障恢復這3個方面簡要介紹網(wǎng)絡虛擬化環(huán)境下故障管理的研究方向并分析其研究趨勢。
3.1 故障探測機制
網(wǎng)絡虛擬化環(huán)境需要使用一種靈活、準確、基于探針的主動探測方法來獲取網(wǎng)絡故障狀態(tài)。這種方法通過向被管網(wǎng)絡發(fā)送探針,并搜集探針的返回結果,獲取網(wǎng)絡的故障信息,從而最終定位故障。網(wǎng)絡虛擬化環(huán)境在傳統(tǒng)的物理網(wǎng)絡設施的基礎上又增加了眾多并存的虛擬網(wǎng)絡,因此要想全面獲取網(wǎng)絡的故障狀態(tài)信息所需要的探測規(guī)模急劇增加。然而大量的探測會為網(wǎng)絡和故障診斷帶來極大的開銷。對故障探測和診斷的及時性和實用性都帶來嚴重的影響。為保證探測的全面性同時降低探測成本、減少不必要探測為網(wǎng)絡和故障診斷帶來的開銷,需要對故障探測進行優(yōu)化。具體來說涉及兩個方面:探針集合的優(yōu)化和探測站點的選擇優(yōu)化。
參考文獻采用不同的方法優(yōu)化主動探測向系統(tǒng)發(fā)送的探針集合,以盡可能少的探針獲取更多的系統(tǒng)信息,同時盡可能降低計算復雜度。然而,網(wǎng)絡虛擬化環(huán)境中的網(wǎng)絡規(guī)模龐大.上述研究由于其計算復雜度過高對于大規(guī)模的網(wǎng)絡來說仍然無法適用,為此。需要研究更加高效的故障探針集合選擇方法,保證所選擇的探針集合在能夠探明系統(tǒng)故障情況的前提下,盡可能減小探針集合的規(guī)模。參考文獻研究了探測站點的選擇問題,以盡可能少的探測站點保證被管網(wǎng)絡所有節(jié)點的故障情況可被探測所確定。網(wǎng)絡虛擬化環(huán)境下,探測站點由于虛擬化的引入存在著更多的不確定性,節(jié)點可能失效和遷移,還需要在傳統(tǒng)的探測站點選擇方法的基礎上針對網(wǎng)絡虛擬化環(huán)境做進一步的研究。
3.2故障定位機制
網(wǎng)絡虛擬化環(huán)境下的故障診斷是在某些故障發(fā)生之后,定位故障發(fā)生的具體位置,是故障恢復的基礎。故障傳播模型描述了被管網(wǎng)絡中故障與癥狀(探針返回的結果)之間的依賴關系。故障傳播模型是故障診斷的前提和基礎。由于虛擬化網(wǎng)絡中存在故障的多層次和關聯(lián)性、負載的隨機性、節(jié)點和鏈路的動態(tài)遷移特性,適合于虛擬化網(wǎng)絡的故障傳播模型成為故障診斷的一個重要研究內容。
在獲得故障傳播模型的基礎上。還需要針對不同系統(tǒng)的特性設計并優(yōu)化相應的故障診斷方法。降低方法的復雜度,參考文獻研究不同系統(tǒng)下的故障診斷方法。在網(wǎng)絡虛擬化環(huán)境下,底層信息對于上層虛擬網(wǎng)絡的透明性是網(wǎng)絡虛擬化的一個顯著特點。底層信息的透明性是指底層網(wǎng)絡設備的運行情況、底層設備的先驗故障概率、虛擬網(wǎng)設備與底層網(wǎng)絡設備的映射關系等信息,對于虛擬網(wǎng)絡提供商都是不可知的。而且對于虛擬網(wǎng)絡提供商來說,除了底層物理故障可能導致虛擬網(wǎng)絡提供商的故障,虛擬化技術本身也可能引入新的故障。如何在底層信息透明的。情況下進行物理故障和虛擬化故障這兩個層次的故障診斷是網(wǎng)絡虛擬化環(huán)境下需要解決的問題。
3.3 故障恢復機制
網(wǎng)絡虛擬化環(huán)境下的故障恢復機制為網(wǎng)絡的可靠性提供重要保障。故障恢復機制由故障觸發(fā),通過將虛擬網(wǎng)絡和相應的業(yè)務切換到預留的備份資源或臨時選擇的空閑資源上,最大限度地減少或避免故障帶來的影響。因此故障恢復機制本質上是故障發(fā)生條件下的資源分配問題。參考文獻研究了虛擬網(wǎng)絡映射問題,然而這些研究均假設網(wǎng)絡始終正常運行,沒有考慮網(wǎng)絡故障的情況。網(wǎng)絡故障恢復機制從是否有備份資源預留的角度可以劃分為有資源預留的故障恢復機制和無資源預留的故障恢復機制。
有資源預留的故障恢復機制阮弱]應用比例不為零的方案保證虛擬網(wǎng)絡的故障恢復.這類問題通常也被稱為可生存的虛擬網(wǎng)絡映射問題(sunrivable virtualnetwork embedding,SVNE)。參考文獻提出了一種基于物理鏈路故障情況下的備份預留資源的分配方法。該方法可以保證多物理鏈路故障的恢復。參考文獻通過將虛擬網(wǎng)請求的拓撲擴展從而映射擴充后的請求的兩階段方法來實現(xiàn)單一網(wǎng)絡設施節(jié)點的故障恢復。方法的第一階段通過添加冗余節(jié)點和鏈路將原始的VN請求擴展為一個可靠網(wǎng)絡;第二階段,將擴展后的網(wǎng)絡映射到物理網(wǎng)絡中。因此在第一階段如何擴展網(wǎng)絡以及在第二階段如何通過盡可能共享資源減少物理資源的使用是這類方法需要解決的問題。參考文獻研究了帶有地理位置約束的單一網(wǎng)絡設施節(jié)點故障的恢復。參考文獻研究了單一區(qū)域故障條件下的故障恢復。
無資源預留的故障恢復機制只在故障確實發(fā)生并被探測到之后才會觸發(fā)執(zhí)行。通常。對于持續(xù)時間較短的故障,采取數(shù)據(jù)重傳的方法,而對于持續(xù)時間較長的故障,通過為受到故障影響的虛擬資源搜索新的物理資源并將該虛擬資源重新映射到新的物理資源上實現(xiàn)故障恢復。這類問題的研究當前相對較少。一種最簡單的虛擬資源重映射方法聞可以不考慮問題空問的底層結構和故障模式,只是簡單地為每一個受到故障影響的虛擬網(wǎng)絡重新計算資源映射方案。由于需要重新計算所有受到影響的虛擬網(wǎng)絡的整體映射,該方法會有很大的配置開銷,也會帶來較長時間的服務中斷。無資源預留的故障恢復機制本質上是一種故障觸發(fā)的資源重映射,對這類問題的研究可以從縮小重映射可供選擇的底層物理資源的范圍人手.在映射之初計算出可供關鍵虛擬資源進行重新映射的候選物理資源集合,但并不做任何資源預留,承載關鍵虛擬資源的物理資源出現(xiàn)故障時,從事先確定的候選物理資源集合中選取可供重映射的物理資源。參考文獻采用這種思路研究單一物理鏈路故障的恢復問題。此外,由于物理資源的有,限性,有可能出現(xiàn)僅允許恢復部分業(yè)務的情況。因此對此類問題研究的重點在于候選資源集合的選取以及在資源有限的前提下如何根據(jù)虛擬業(yè)務的類型和級別確定故障恢復的優(yōu)先級。
4.結束語
網(wǎng)絡虛擬化環(huán)境下的故障管理對于網(wǎng)絡虛擬化環(huán)境下網(wǎng)絡的頑健性、生存性和可管理性具有重要的意義,其目標是及時準確定位網(wǎng)絡故障并迅速隔離和恢復故障。目前這方面的研究主要圍繞故障探測、故障定位和故障恢復這3個方面。在故障探測的研究方面,針對網(wǎng)絡虛擬化環(huán)境下網(wǎng)絡規(guī)模擴大的特點,需要研究優(yōu)化的探測機制.包括探測站點和探針集合的優(yōu)化選擇機制。在故障定位的研究方面,針對多層網(wǎng)絡以及虛擬網(wǎng)絡和物理網(wǎng)絡間映射關系的不確定性等特點.需要研究網(wǎng)絡虛擬化環(huán)境下的故障傳播模型以及相應的故障診斷方法。在故障恢復的研究方面,針對網(wǎng)絡虛擬化環(huán)境下對服務質量的要求,需要研究合理的故障恢復策略,在有限的物理網(wǎng)絡資源之上生成資源提供成本低且違約損失少的故障恢復方案。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:網(wǎng)絡虛擬化環(huán)境下的故障管理
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121511675.html