1 背景
黨中央和國務(wù)院十分重視信息安全工作。2003年,中辦發(fā)[2003127號文《國家信息化領(lǐng)導小組關(guān)于加強信息安全保障工作的意見》,要求各基礎(chǔ)信息網(wǎng)絡(luò)和重要信息系統(tǒng)建設(shè)要充分考慮抗毀性與災難恢復,制定和不斷完善信息安全應(yīng)急處置預案。2004年,國家網(wǎng)絡(luò)與信息安全協(xié)調(diào)小組辦公室發(fā)12004]11號文《關(guān)于做好重要信息系統(tǒng)災難備份工作的通知》。明確指出,提高抵御災難和重大事故的能力,減少災難打擊和重大事故造成的損失、確保重要信息系統(tǒng)的數(shù)據(jù)安全和作業(yè)連續(xù)性,避免引起社會重要服務(wù)功能的嚴重中斷,保障社會經(jīng)濟的穩(wěn)定。2005年,國務(wù)院信息化工作辦公室出臺了《重要信息系統(tǒng)災難恢復規(guī)劃指南》,為災難恢復工作提供了一個操作性較強的參考思路。
2007年,國家標準《信息系統(tǒng)災難恢復規(guī)范》(GB/T20988—2007)正式頒布,這是災備建設(shè)中具有里程碑意義的重要大事。該標準對災難備份、災難恢復相關(guān)術(shù)語進行了規(guī)范和梳理,指明了災難恢復工作的流程,明確了災難恢復的等級和相關(guān)要素,制訂了災難恢復工作的主要環(huán)節(jié)及各環(huán)節(jié)具體工作等。在2010年召開的第五屆中國災難恢復行業(yè)高層論壇上,提出了我國將全面啟動災難恢復體系建設(shè),制定強制性災備建設(shè)規(guī)范,完善災備標準體系并及時出臺災難恢復服務(wù)資質(zhì)管理辦法,以促進政府相關(guān)部門、行業(yè)用戶、企業(yè)災難恢復保障體系的發(fā)展。目前,許多政府部門和重要行業(yè)已經(jīng)開始積極有序進行應(yīng)急管理、災難備份與恢復體系的建設(shè)工作。
近十年來,國土資源信息化建設(shè)發(fā)展十分迅猛,數(shù)據(jù)積累不斷豐富,政務(wù)信息系統(tǒng)日漸增多,其安全性和穩(wěn)定性顯得愈來愈重要。一旦發(fā)生人為或自然等突發(fā)性災難,造成數(shù)據(jù)丟失或信息系統(tǒng)嚴重故障或癱瘓,將會直接影響到國土資源管理工作的正常運轉(zhuǎn)以及一些企業(yè)和廣大民眾的利益。災備工作將成為國土資源信息化建設(shè)的一項十分重要的工作。本文對目前的災備主流技術(shù)進行綜述。
2 災備指標和類型
災難事件一般包括:自然災難(如風、火、水、雷電和地震等)、人為災難(如人為失誤、非授權(quán)操作等偶然故障,病毒入侵、駭客及人為破壞等Byzantine故障、恐怖襲擊和戰(zhàn)爭等)和技術(shù)災難(設(shè)備故障、軟件錯誤、電信網(wǎng)絡(luò)中斷和電力故障等)。統(tǒng)計資料表明自然災難(包括人為的戰(zhàn)爭和恐怖襲擊等)僅占災難的3%,人為災難占災難的39%(其中。偶然故障和Byzantine故障分別占32%和7%),而技術(shù)災難占到災難總數(shù)的58%。
根據(jù)《信息系統(tǒng)災難恢復規(guī)范》,災難被定義為.由于人為或自然的原因,造成信息系統(tǒng)嚴重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受、達到特定的時間的突發(fā)性事件。通常導致信息系統(tǒng)需要切換到災備中心運行。災難恢復指的是,為了將信息系統(tǒng)從災難造成的故障或癱瘓狀態(tài)恢復到可正常運行狀態(tài)、并將其支持的業(yè)務(wù)功能從災難造成的不正常狀態(tài)恢復到可接受狀態(tài),而設(shè)計的活動和流程。災難備份指的是,為了災難恢復而對數(shù)據(jù)、數(shù)據(jù)處理系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、基礎(chǔ)設(shè)施、專業(yè)技術(shù)支持能力和運行管理能力進行備份的過程。
廣義地理解,災難備份(簡稱災備)是指利用技術(shù)、管理手段以及相關(guān)資源確保關(guān)鍵數(shù)據(jù)、關(guān)鍵數(shù)據(jù)處理系統(tǒng)和關(guān)鍵業(yè)務(wù)在災難發(fā)生后可以盡可能多且快地恢復的過程,包括災難備份和災難恢復兩層含義。不僅包括災難發(fā)生前對數(shù)據(jù)的備份和日志,信息系統(tǒng)構(gòu)建過程中容災體系結(jié)構(gòu)的設(shè)計、提前制定的災難應(yīng)急預案與恢復計劃等,而且涵蓋了災難發(fā)生后災備中心或者備份系統(tǒng)的業(yè)務(wù)接管,數(shù)據(jù)、系統(tǒng)、服務(wù)遷移過程中的安全管理、系統(tǒng)災難損失評估等內(nèi)容。災備的目的就是確保關(guān)鍵業(yè)務(wù)持續(xù)運行以及減少非計劃宕機時間。
衡量災備系統(tǒng)的兩個重要指標是:恢復時間目標(RTO,recovery time object)和恢復點目標(RPO,recovery point object)。
RTO:恢復時間目標,以時間為單位.即在災難發(fā)生后。信息系統(tǒng)或業(yè)務(wù)功能從停止到必須恢復的時間要求。RTO標志系統(tǒng)能夠容忍的服務(wù)停止的最長時間。系統(tǒng)服務(wù)的緊迫性要求越高,RTO的值越小,災備能力就越高。
RPO:恢復點目標,以時間為單位,即在災難發(fā)生時,系統(tǒng)和數(shù)據(jù)必須恢復到的時間點要求。RPO標志系統(tǒng)能夠容忍的最大數(shù)據(jù)丟失量。系統(tǒng)容忍丟失的數(shù)據(jù)量越小,RPO的值越小。若RPO等于0,相當于沒有任何數(shù)據(jù)丟失。否則,就需要進行業(yè)務(wù)回復處理,對丟失數(shù)據(jù)進行修復。
RPO針對的是數(shù)據(jù)丟失。RTO針對的是服務(wù)丟失,兩者必須在進行風險分析和業(yè)務(wù)影響分析之后根據(jù)業(yè)務(wù)的需求來確定。
一般而言,災備分為三個級別:數(shù)據(jù)級、應(yīng)用級和業(yè)務(wù)級。其中數(shù)據(jù)級、應(yīng)用級都屬于IT系統(tǒng)范疇之內(nèi),而業(yè)務(wù)級則考慮到IT系統(tǒng)之外的業(yè)務(wù)因素,包括備用辦公場所、辦公人員等。
數(shù)據(jù)級災備的關(guān)注點在于數(shù)據(jù),即災難發(fā)生后可以確保用戶原有的數(shù)據(jù)不會丟失或者遭到破壞。較低等級的數(shù)據(jù)級災備可將備份的數(shù)據(jù)通過人工方式保存到異地實現(xiàn),如將備份的磁帶(盤或光盤)定時運送到異地保存就是方法之一。而較高級的數(shù)據(jù)災備方案則依靠基于網(wǎng)絡(luò)的數(shù)據(jù)復制工具,實現(xiàn)生產(chǎn)中心不同備份設(shè)備之間或是生產(chǎn)中心與災備中心之間的異步/同步的數(shù)據(jù)傳輸,如采用基于磁盤陣列的數(shù)據(jù)復制功能。
應(yīng)用級災備是在數(shù)據(jù)級災備的基礎(chǔ)上,對應(yīng)用系統(tǒng)進行復制,也就是在異地災備中心再構(gòu)建一套應(yīng)用支撐系統(tǒng)。支撐系統(tǒng)包括數(shù)據(jù)備份系統(tǒng)、備用數(shù)據(jù)處理系統(tǒng)、備用網(wǎng)絡(luò)系統(tǒng)等部分。應(yīng)用級災備能提供應(yīng)用系統(tǒng)接管能力,即在生產(chǎn)中心發(fā)生故障的情況下,災備中心便能夠接管應(yīng)用,從而盡量減少系統(tǒng)停機時間,提高業(yè)務(wù)連續(xù)性。
業(yè)務(wù)級是最高級別的災備系統(tǒng)。它包括很多非IT系統(tǒng),如辦公地點等。當大的災難發(fā)生時。用戶原有的辦公場所都會受到破壞.用戶除了需要原有的數(shù)據(jù)、原有的應(yīng)用系統(tǒng)外,更需要工作人員在一個備份的工作場所能夠正常地開展業(yè)務(wù)。實際上,業(yè)務(wù)級容災還關(guān)注業(yè)務(wù)接入網(wǎng)絡(luò)的備份,不僅考慮支撐系統(tǒng)的服務(wù)提供能力,還考慮服務(wù)使用者的接入能力、甚至備份的工作人員。
在災備系統(tǒng)建設(shè)中,選擇不同的類型.應(yīng)該綜合考慮數(shù)據(jù)與應(yīng)用系統(tǒng)的重要性、業(yè)務(wù)關(guān)聯(lián)度、技術(shù)成熟度、基礎(chǔ)設(shè)施條件、成本和管理維護等一系列因素。
3 災備技術(shù)與發(fā)展趨勢
一般來講,災備系統(tǒng)可以分為數(shù)據(jù)級容災、應(yīng)用級容災和業(yè)務(wù)級容災。數(shù)據(jù)容災是基礎(chǔ)和前提,只有保證數(shù)據(jù)能及時、完整地備份或復制到災備中心,才能在災難發(fā)生時及時恢復受災業(yè)務(wù)。數(shù)據(jù)級容災可以允許系統(tǒng)在一定時間內(nèi)的數(shù)據(jù)量丟失,只要系統(tǒng)能夠通過備份或復制的數(shù)據(jù)將系統(tǒng)恢復起來。數(shù)據(jù)容災的技術(shù)包括數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)復制技術(shù)和數(shù)據(jù)管理技術(shù)等。應(yīng)用級的容災要求從應(yīng)用層面上實現(xiàn)對系統(tǒng)容災,要求對數(shù)據(jù)的丟失量為零,實現(xiàn)信息系統(tǒng)保持業(yè)務(wù)連續(xù)性、不間斷服務(wù),因而對系統(tǒng)的軟、硬件的要求都比較高,是一種比較高的容災方案。應(yīng)用容災包括災難檢測技術(shù)、系統(tǒng)遷移技術(shù)和系統(tǒng)恢復技術(shù)等。業(yè)務(wù)級容災則對技術(shù)和其它方面的要求更高。本文針對數(shù)據(jù)級容災介紹主流的災備技術(shù)。
3.1數(shù)據(jù)存儲技術(shù)
災難備份的一項主要技術(shù)是數(shù)據(jù)存儲技術(shù)。數(shù)據(jù)存儲備份就是把數(shù)據(jù)從生產(chǎn)系統(tǒng)備份到存儲備份系統(tǒng)中的存儲介質(zhì)的過程。因此,存儲優(yōu)化是提高災難備份系統(tǒng)性能的重要指標之一。目前,比較通用的技術(shù)有NAS(Network Attached Storage,網(wǎng)絡(luò)附加存儲)和SAN(Storage Area Network,存儲區(qū)域網(wǎng)絡(luò))。
NAS是將存儲設(shè)備連接到現(xiàn)有的網(wǎng)絡(luò)上,提供數(shù)據(jù)和文件服務(wù)。NAS服務(wù)器一般由存儲硬件、操作系統(tǒng)以及其上的文件系統(tǒng)等幾個部分組成。NAS實現(xiàn)簡單,建立方便,設(shè)備不依賴于操作系統(tǒng),數(shù)據(jù)的存儲和處理功能分離,價格較低。SAN是通過特定的互連方式連接的若干臺存儲服務(wù)器組成一個單獨的數(shù)據(jù)網(wǎng)絡(luò)。SAN的硬件基礎(chǔ)設(shè)施是光纖通道,由3部分構(gòu)成:存儲和備份設(shè)備(包括磁盤陣列和磁帶庫等)、光纖通道網(wǎng)絡(luò)連接部件(包括交換機、HBA卡、光纜線、集線器、光纖通道與SCSI間的橋接器等)和應(yīng)用管理軟件(包括備份軟件、存儲資源管理軟件、設(shè)備管理軟件等)。SAN是一種特殊的高速網(wǎng)絡(luò),連接網(wǎng)絡(luò)服務(wù)器和諸如大磁盤陣列或備份磁帶庫的存儲設(shè)備,SAN不依賴于LAN,允許任何服務(wù)器連接到任何存儲陣列,可以提供大容量的存儲數(shù)據(jù)服務(wù)。與NAS相比,SAN的成本較高。NAS、SAN的技術(shù)成熟、優(yōu)缺點也很明顯,不再贅述。
近來日趨發(fā)展的IP存儲(storage over IP,SOW)技術(shù),在IP網(wǎng)絡(luò)中傳輸數(shù)據(jù),使得服務(wù)器可以通過IP網(wǎng)絡(luò)連接SCSI設(shè)備,將IP技術(shù)與SAN網(wǎng)絡(luò)結(jié)合起來,使IP SAN可以和IP網(wǎng)絡(luò)完全整合。
3.2數(shù)據(jù)復制技術(shù)
數(shù)據(jù)復制技術(shù)即數(shù)據(jù)鏡像技術(shù)。與數(shù)據(jù)存儲技術(shù)相比,數(shù)據(jù)復制技術(shù)則是通過不斷將生產(chǎn)系統(tǒng)的數(shù)據(jù)復制到另外一個不同的備份系統(tǒng)中,以保證在災難發(fā)生時,生產(chǎn)系統(tǒng)的數(shù)據(jù)丟失量最少,它是災備的核心和主流技術(shù)。
根據(jù)數(shù)據(jù)復制的層次,數(shù)據(jù)復制技術(shù)的實現(xiàn)可以分成以下幾種:
(1)基于存儲(磁盤)系統(tǒng)的數(shù)據(jù)復制:通過存儲系統(tǒng)內(nèi)建的固件(firtnware)或操作系統(tǒng),利用IP網(wǎng)絡(luò)或DWDM、光纖信道等傳輸接口連接,將數(shù)據(jù)以同步或異步的方式從本地的存儲系統(tǒng)復制到遠端的存儲系統(tǒng)。主要產(chǎn)品包括EMC的SRDF、HDS的TrueCopy、IBM的PPRC等。這種方式優(yōu)點是獨立于主機平臺和應(yīng)用,適合于主機和業(yè)務(wù)系統(tǒng)很多、較復雜的環(huán)境,具有較高的性能和可靠性,其缺點是成本昂貴,而且還要受制于單一的設(shè)備廠商,通常必須采用同一廠家的存儲平臺,甚至是同一系列的存儲產(chǎn)品。
(2)基于主機(操作)系統(tǒng)的數(shù)據(jù)復制:利用生產(chǎn)、災備中心主機系統(tǒng)通過IP網(wǎng)絡(luò)建立數(shù)據(jù)傳輸通道,通過主機數(shù)據(jù)管理軟件實現(xiàn)數(shù)據(jù)的遠程復制。主要產(chǎn)品包括主機廠商和一些第三方軟件公司提供基于主機的數(shù)據(jù)復制方案,如IBM的XRC軟件、BakBone的NetVault Replicator和Verims的wR軟件等。主要優(yōu)點是不依賴于底層存儲平臺,可提供多種不同的方案,基于網(wǎng)絡(luò)而沒有距離限制:主要局限性是需要同種主機平臺,占用大量的主機的資源,不太適合多個系統(tǒng)、多種應(yīng)用的災備等,效率和管理上也存在一定問題。
(3)基于數(shù)據(jù)交換層的數(shù)據(jù)復制:這種方式的復制技術(shù)是伴隨著SAN的出現(xiàn)引入的,即在SAN的交換層上實現(xiàn)數(shù)據(jù)復制。實現(xiàn)方式可以通過專有的復制服務(wù)器實現(xiàn),也可以通過存儲局域網(wǎng)(SAN)交換機,將數(shù)據(jù)同步的復制到遠端存儲系統(tǒng)中。這種方式正在發(fā)展之中。
(4)基于數(shù)據(jù)庫的數(shù)據(jù)復制:利用數(shù)據(jù)庫自身提供的復制模塊,通過本地和遠程主機間的日志歸檔與傳遞來實現(xiàn)兩端的數(shù)據(jù)一致。比如Oracle的Data Guard和SQL Server的Mirror等。優(yōu)點是不依賴于其它軟件和底層存儲平臺,有較好的兼容性,無需增加額外硬件設(shè)備,可支持異構(gòu)環(huán)境的復制等,缺點是對數(shù)據(jù)庫的版本和操作系統(tǒng)平臺有特定要求,不能以一種技術(shù)實現(xiàn)多種應(yīng)用的數(shù)據(jù)復制。另外,因本地應(yīng)用程序向遠端復制的是日志文件,需要遠端應(yīng)用程序重新執(zhí)行和應(yīng)用才能生產(chǎn)可用的備份數(shù)據(jù)。
上述幾種技術(shù)除了基于數(shù)據(jù)庫的數(shù)據(jù)復制外,其他技術(shù)都具有同步和異步兩種復制方式。同步數(shù)據(jù)復制就是將本地生產(chǎn)系統(tǒng)的數(shù)據(jù)以完全同步的方式復制到備份系統(tǒng)中。由于發(fā)生在生產(chǎn)系統(tǒng)的每一次I/0操作都需要等待遠程復制完成才能返回,這種復制方式雖然可能做得數(shù)據(jù)的零丟失,但是對系統(tǒng)性能有很大的影響。異步數(shù)據(jù)復制則是將本地生產(chǎn)系統(tǒng)中的數(shù)據(jù)在后臺異步的復制到備份系統(tǒng)中。這種復制方式會有少量的數(shù)據(jù)丟失,但是對生產(chǎn)系統(tǒng)的性能影響較小。在災備中心的建設(shè)過程中,應(yīng)根據(jù)應(yīng)用需求和數(shù)據(jù)復制技術(shù)的優(yōu)缺點選擇不同的災難備份策略。
3.3技術(shù)發(fā)展趨勢
隨著信息化的深入發(fā)展,存儲容量的急劇膨脹。數(shù)據(jù)和信息的重要性已經(jīng)遠遠超越了系統(tǒng)設(shè)備的重要性。在當前數(shù)據(jù)量劇增的情況下,災備技術(shù)也呈現(xiàn)不斷發(fā)展的態(tài)勢,取得一些新的進展,體現(xiàn)在以下幾方面。
(1)存儲虛擬化(Storage Virtualization)技術(shù)。該技術(shù)是將系統(tǒng)中各種異構(gòu)的存儲設(shè)備映射為一個單一的存儲資源,對用戶完全透明.達到屏蔽存儲設(shè)備異構(gòu)和主機異構(gòu)的目的。通過虛擬化技術(shù)。用戶可以利用已有的硬件資源,把SAN內(nèi)部的各種異構(gòu)的存儲資源統(tǒng)一成對用戶來說是單一視圖的存儲池(Storage Pool),而且采用Striping、LUN Masking、Zoning等技術(shù).用戶可以根據(jù)自己的需求對這個大的存儲池進行方便的分割、分配.保護了用戶的已有投資,減少了總體擁有成本(TCO)。另外也可以根據(jù)業(yè)務(wù)的需要,實現(xiàn)存儲池對服務(wù)器的動態(tài)而透明的增長與縮減。
通過存儲虛擬化技術(shù)可實現(xiàn)數(shù)據(jù)的遠程復制,以確保災備中心與生產(chǎn)中心的數(shù)據(jù)保持同步以實現(xiàn)數(shù)據(jù)容災。存儲虛擬化技術(shù)可以在不同層面實現(xiàn),如在智能交換機層面、存儲層面或增加第三方設(shè)備來實現(xiàn)。采用虛擬存儲技術(shù)進行數(shù)據(jù)復制同樣也可以有同步復制方案和異步復制方案,需要根據(jù)具體的需求選擇合適的產(chǎn)品。
(2)重復數(shù)據(jù)刪除技術(shù)。該技術(shù)通過尋找不同數(shù)據(jù)塊中的冗余數(shù)據(jù)并刪除這些重復的數(shù)據(jù)來對數(shù)據(jù)進行壓縮。某些重復數(shù)據(jù)壓縮技術(shù)甚至實現(xiàn)了20:1的壓縮比。通過重復數(shù)據(jù)刪除技術(shù)不但能解決單數(shù)據(jù)中心中多副本占用空間的問題,還可以減少傳輸備份數(shù)據(jù)所需要的帶寬。重復數(shù)據(jù)刪除技術(shù)主要分為基于軟件的重復數(shù)據(jù)刪除和基于硬件的重復數(shù)據(jù)刪除兩種方式。這種技術(shù)已經(jīng)應(yīng)用于災備存儲中,如EMC的Avamar和Veritas的NetBackup等。
(3)持續(xù)數(shù)據(jù)保護(CDP)技術(shù)。CDP是一種在不影響主要數(shù)據(jù)運行的前提下,實現(xiàn)持續(xù)捕捉或跟蹤目標數(shù)據(jù)所發(fā)生的任何變化,并且能夠恢復到此前任意時間點的方法。CDP系統(tǒng)能夠提供塊級、文件級和應(yīng)用級的備份,以及恢復目標的無限的任意可變的恢復點。目前該技術(shù)尚處于發(fā)展階段,隨著技術(shù)的不斷成熟和完善,將會具有強大的生命力。
4 結(jié)語
在信息化大發(fā)展的今天,數(shù)據(jù)(信息)的價值已經(jīng)遠遠超過了計算機系統(tǒng)本身,同時,提供連續(xù)服務(wù)能力已經(jīng)成為災備系統(tǒng)發(fā)展的核心問題。隨著人們對災備問題的越來越重視以及信息技術(shù)的發(fā)展,災備技術(shù)取得了較大的進展。應(yīng)用范圍和領(lǐng)域也越來越廣泛?傮w而言,災備建設(shè)是一項復雜的、長期的系統(tǒng)工程.開展國土資源信息系統(tǒng)的災備建設(shè),既要考慮政策法規(guī)導向和規(guī)范制度建設(shè),也要根據(jù)實際需要選擇合適技術(shù)方案,這將在后續(xù)文章中進一步探討。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112153454.html