自從有了信息技術(shù)以來,信息系統(tǒng)面臨的各種災(zāi)難和故障就從來沒有停止過。隨著信息技術(shù)的不斷發(fā)展,企業(yè)正常業(yè)務(wù)的開展對信息系統(tǒng)的依賴性越來越高。如何保障業(yè)務(wù)數(shù)據(jù)的安全性和信息系統(tǒng)的可靠性已經(jīng)成為企業(yè)面臨的嚴(yán)峻問題。
災(zāi)難是一種具有破壞性的突發(fā)事件,如圖1所示,本文所關(guān)注的是災(zāi)難對單位的正常運(yùn)營和社會的正常秩序造成的影響。其中最明顯的影響是信息服務(wù)的中斷和延遲。信息系統(tǒng)停頓的時間越長,單位的信息化程度越高,損失就越大。
信息系統(tǒng)的容災(zāi),即對災(zāi)難的抵抗和防御,目的就是提高信息系統(tǒng)抵御災(zāi)難和重大事故的能力,減少災(zāi)難打擊和重大事故對企業(yè)造成的損失,保證信息系統(tǒng)所支持的關(guān)鍵業(yè)務(wù)功能在災(zāi)難發(fā)生后能及時恢復(fù)和繼續(xù)運(yùn)作。
圖1 信息系統(tǒng)災(zāi)難分布
1.通用容災(zāi)技術(shù)框架
1.1企業(yè)信息系統(tǒng)容災(zāi)的級別
信息系統(tǒng)的容災(zāi)可以分為三個級別:
(1)數(shù)據(jù)級容災(zāi):只考慮將生產(chǎn)站點(diǎn)的數(shù)據(jù)如何復(fù)制到遠(yuǎn)程站點(diǎn)。
(2)應(yīng)用級容災(zāi):災(zāi)難發(fā)生時,不僅要保證數(shù)據(jù)在容災(zāi)中心可用,而且還要保證容災(zāi)端的存儲設(shè)備、服務(wù)器設(shè)備、網(wǎng)絡(luò)設(shè)備等系統(tǒng)處于可用或者待命的狀態(tài)。
(3)業(yè)務(wù)級容災(zāi):不光要保證容災(zāi)端的應(yīng)用系統(tǒng)可以提供服務(wù),而且還要保證范疇之外的例如人員、部門、物資、財力都要可用,這是最高層次的容災(zāi)。
1.2容災(zāi)技術(shù)模型
從技術(shù)角度看,企業(yè)IT平臺一般可以劃分為“接人平臺、應(yīng)用平臺、數(shù)據(jù)平臺”三部分,容災(zāi)技術(shù)平臺建設(shè)主要著眼于這三部分的保護(hù),如圖2所示。
圖2 容災(zāi)技術(shù)模型示意圖
(1)接人平臺冗余和切換
關(guān)鍵在于實現(xiàn)相同訪問能力的網(wǎng)絡(luò)設(shè)備,并在網(wǎng)絡(luò)配置上確保能快速、方便地將網(wǎng)絡(luò)訪問從生產(chǎn)中心切換到容災(zāi)中心。
(2)業(yè)務(wù)處理能力的冗余
主要表現(xiàn)為對業(yè)務(wù)處理能力的冗余和復(fù)用,其中包括操作系統(tǒng)、應(yīng)用系統(tǒng)、數(shù)據(jù)庫、中間件等層面的復(fù)制及切換的能力。
(3)數(shù)據(jù)存儲平臺的保護(hù)
主要表現(xiàn)為對系統(tǒng)存儲層面的保護(hù)。它是比應(yīng)用平臺更為底層的數(shù)據(jù)級保護(hù)。
在容災(zāi)系統(tǒng)建設(shè)中,數(shù)據(jù)存儲平臺的保護(hù)是實現(xiàn)企業(yè)災(zāi)難恢復(fù)的核心。保證數(shù)據(jù)的安全永遠(yuǎn)是第一位的。
2.不同容災(zāi)技術(shù)分析
2.1容災(zāi)技術(shù)方案概述
對所有的容災(zāi)技術(shù)平臺建設(shè)而言,容災(zāi)方案的技術(shù)核心是實現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制,并能夠在災(zāi)難發(fā)生時在遠(yuǎn)端利用復(fù)制數(shù)據(jù)提供企業(yè)業(yè)務(wù)運(yùn)營支撐服務(wù),因此數(shù)據(jù)復(fù)制技術(shù)是構(gòu)建容災(zāi)技術(shù)平臺的核心。不同數(shù)據(jù)復(fù)制技術(shù)的分類如圖3所示。
圖3 數(shù)據(jù)復(fù)制分類
根據(jù)所采用數(shù)據(jù)遠(yuǎn)程復(fù)制技術(shù)位于的不同層面,又可以分為以下三類容災(zāi)方案:
(1)基于存儲層面的容災(zāi)方案:利用存儲系統(tǒng)的遠(yuǎn)程數(shù)據(jù)復(fù)制功能建設(shè)容災(zāi)系統(tǒng)。
(2)基于主機(jī)層面的容災(zāi)方案:利用主機(jī)廠家提供的相關(guān)功能軟件或第三方的主機(jī)軟件實現(xiàn)遠(yuǎn)程的數(shù)據(jù)復(fù)制,建設(shè)容災(zāi)系統(tǒng)。
(3)基于應(yīng)用層的容災(zāi)方案:如利用應(yīng)用軟件Oracle數(shù)據(jù)庫的本身的遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù)建設(shè)容災(zāi)系統(tǒng)。
2.2基于存儲數(shù)據(jù)復(fù)制技術(shù)的容災(zāi)系統(tǒng)
采用基于存儲的容災(zāi)方案的技術(shù)核心是利用存儲陣列自身復(fù)制技術(shù)實現(xiàn)數(shù)據(jù)的遠(yuǎn)程拷貝,從而實現(xiàn)生產(chǎn)數(shù)據(jù)的災(zāi)難保護(hù)。
基于存儲的容災(zāi)方案示意圖如圖4所示。
圖4 基于存儲友制技術(shù)的容災(zāi)方案示意圖
該方案的必要前提是:
(1)通常必須采用同一廠家的存儲平臺,存在一定的設(shè)備上的限制。
(2)采用同步方式可能對生產(chǎn)系統(tǒng)性能產(chǎn)生影響,對通信鏈路要求較高。
(3)采用異步方式存在數(shù)據(jù)丟失的風(fēng)險,通常在遠(yuǎn)距離通信鏈路帶寬有限的情況下實施。
盡管有以上限制,此方案也具有顯著優(yōu)點(diǎn):
(1)獨(dú)立于主機(jī)平臺和應(yīng)用,對各種應(yīng)用都適用,而且完全不消耗主機(jī)的資源。
(2)由于在最底層實現(xiàn),實施起來受應(yīng)用、主機(jī)環(huán)境等相關(guān)技術(shù)的影響最小,非常適合于復(fù)雜的環(huán)境。
(3)采用同步方式可以完全不丟失數(shù)據(jù),在同城容災(zāi)或園區(qū)內(nèi)容災(zāi)方案中不會對生產(chǎn)主機(jī)的性能產(chǎn)生顯著影響。
(4)采用異步方式雖然存在一定的數(shù)據(jù)丟失的風(fēng)險,但沒有距離限制,可以實現(xiàn)遠(yuǎn)距離保護(hù)。
由于以上優(yōu)點(diǎn),基于存儲災(zāi)難保護(hù)方案是目前采用最多的災(zāi)難保護(hù)方案。典型的基于存儲的容災(zāi)技術(shù)有EMC公司的MirrorView,SAN Copy, IBM公司的PPPC技術(shù)等。
2.3基于主機(jī)數(shù)據(jù)復(fù)制技術(shù)的容災(zāi)系統(tǒng)
采用基于主機(jī)的容災(zāi)方案的示意圖如圖5所示。
圖5 基于主機(jī)的容災(zāi)方案示意圖
該方案的核心是通過主機(jī)上的數(shù)據(jù)管理軟件實現(xiàn)數(shù)據(jù)的復(fù)制,從而提供了容災(zāi)的能力。
實現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制的數(shù)據(jù)管理軟件有很多產(chǎn)品,如Sun公司的Availability Suite軟件和Veritas Volume Replicator(VVR)等。
該容災(zāi)方案有以下優(yōu)點(diǎn):
(1)只對服務(wù)器平臺和主機(jī)軟件有要求,完全不依賴于底層存儲平臺。
(2)基于IP網(wǎng)絡(luò),沒有距離限制。
同時,該方案有以下局限:
(1)由于依靠主機(jī)的處理能力,因而對生產(chǎn)主機(jī)性能會產(chǎn)生一定甚至較大的影響。
(2)利用主機(jī)數(shù)據(jù)復(fù)制軟件的方案比較復(fù)雜,尤其是和數(shù)據(jù)庫應(yīng)用結(jié)合的時候,給生產(chǎn)系統(tǒng)的穩(wěn)定性、可靠性、性能可能帶來顯著影響。
(3)如果有多種應(yīng)用需要保護(hù),將無法有統(tǒng)一的技術(shù)方案。
(4)管理復(fù)雜,需要大量的人工干預(yù)過程,容易發(fā)生錯誤。
目前,企業(yè)采用基于主機(jī)的數(shù)據(jù)復(fù)制技術(shù)建設(shè)容災(zāi)方案相對比較少,比較適合單一系統(tǒng)在vo規(guī)模不大的情況下使用。
2.4基于應(yīng)用的數(shù)據(jù)復(fù)制建設(shè)容災(zāi)系統(tǒng)
基于應(yīng)用之間的數(shù)據(jù)復(fù)制技術(shù)也有很多種,以下以O(shè)racle公司的Oracle Data Guard技術(shù)進(jìn)行分析。
Data Guard的基本原理是在與主系統(tǒng)完全一致的平臺上建立后備數(shù)據(jù)庫,在主系統(tǒng)正常工作的同時將歸檔日志(Archived Log)不斷地傳送到后備系統(tǒng),并且在后備數(shù)據(jù)庫系統(tǒng)上連續(xù)進(jìn)行恢復(fù)(fteco-ver)操作,以保持后備系統(tǒng)與主系統(tǒng)的一致。當(dāng)主系統(tǒng)發(fā)生故障時,后備數(shù)據(jù)庫可以接管主數(shù)據(jù)庫。架構(gòu)如圖6所示。
圖6 采用Oracle Data Guard的容災(zāi)方案
該容災(zāi)方案有以下優(yōu)點(diǎn):
(1)完全不依賴于其它軟件和底層存儲平臺。
(2)可以實現(xiàn)一對多的數(shù)據(jù)復(fù)制,提供多重保護(hù)。
(3)后備數(shù)據(jù)庫可以在很短的時間內(nèi)提升到生產(chǎn)狀態(tài)。
(4)基于IP網(wǎng)絡(luò),沒有距離限制。
此方案的局限在于:
(1)該技術(shù)會利用主機(jī)的資源,會對生產(chǎn)數(shù)據(jù)庫系統(tǒng)的性能產(chǎn)生一定影響。
(2)并不是一種通用的數(shù)據(jù)庫保護(hù)方案,只能對Oracle數(shù)據(jù)庫數(shù)據(jù)提供保護(hù)。
(3)對運(yùn)維水平特別是數(shù)據(jù)庫管理人員的要求高,管理復(fù)雜。
3.三種容災(zāi)技術(shù)的比較
通過以上分析可以看出,基于存儲的容災(zāi)技術(shù)是通用性最高,也是適合大規(guī)模布署的容災(zāi)方式。基于主機(jī)的數(shù)據(jù)復(fù)制技術(shù)建設(shè)容災(zāi)方案相對比較少,通常適合單一應(yīng)用或系統(tǒng)在I/O規(guī)模不大的情況下局部使用。基于應(yīng)用的容災(zāi)架構(gòu)由于通用性低,并且對主機(jī)會有一定的影響,一般是作為關(guān)鍵應(yīng)用的單點(diǎn)保護(hù)。容災(zāi)技術(shù)比較如表1所示。
表1 容災(zāi)技術(shù)比較
4.容災(zāi)設(shè)計案例
4.1需求分析
由于容災(zāi)有很多層次,而對應(yīng)業(yè)務(wù)系統(tǒng)的容災(zāi)手段并不是選擇越高就越能達(dá)到要求,層次越高,所付出的成本成指數(shù)增長,要選擇具有最高性價比,執(zhí)行符合需求的整體解決方案。通過各系統(tǒng)詳細(xì)的容災(zāi)需求的調(diào)研,得到以下業(yè)務(wù)系統(tǒng)的容災(zāi)需求,如表2所示。
表2 信息系統(tǒng)業(yè)務(wù)容災(zāi)分析表
從表2可以看出,不同的業(yè)務(wù)系統(tǒng)依據(jù)它們的重要性和實時性的不同,需要達(dá)到的容災(zāi)級別也是不同的,OA系統(tǒng)、科研系統(tǒng)、生產(chǎn)系統(tǒng)是關(guān)系企業(yè)業(yè)務(wù)開展的關(guān)鍵業(yè)務(wù)系統(tǒng),擬設(shè)計達(dá)到應(yīng)用級別的容災(zāi),而郵件系統(tǒng)、質(zhì)量系統(tǒng)、和其它系統(tǒng)擬建設(shè)達(dá)到數(shù)據(jù)級容災(zāi)的要求。
4.2建設(shè)方案
考慮到更好的通用性以及可管理性,決定主要以基于存儲數(shù)據(jù)復(fù)制技術(shù)方案為基礎(chǔ)進(jìn)行規(guī)劃,以應(yīng)用級容災(zāi)和數(shù)據(jù)級容災(zāi)相結(jié)合的方式進(jìn)行一期的容災(zāi)建設(shè)。
所采用的容災(zāi)技術(shù)包括:
(1)EMC存儲復(fù)制技術(shù)。
( 2 ) Networker備份技術(shù)。
( 3 ) SureSave虛擬磁帶庫復(fù)制技術(shù)。
( 4 ) Acronis Backup And Recovery裸機(jī)備份及恢復(fù)技術(shù)。
此外在本地高可用性解決方案采用了:
(1)IBM AIX小型機(jī)集群技術(shù)。
(2 ) VMWARE虛擬機(jī)集群技術(shù)。
實際建設(shè)方案如圖7所示。
圖7 某單位建設(shè)方案
方案說明:
(1)關(guān)鍵業(yè)務(wù)系統(tǒng)運(yùn)行平臺為小型機(jī)集群和虛擬機(jī)集群,通過光纖交換機(jī)連接至后臺的EMCCX480存儲和VNX5500存儲,同時在容災(zāi)中心也有一套存儲設(shè)備與之構(gòu)成鏡像復(fù)制的關(guān)系,采用的策略為同步復(fù)制策略。同時配備備用服務(wù)器,構(gòu)成完整的應(yīng)用級容災(zāi)的基礎(chǔ)環(huán)境。
(2)其它業(yè)務(wù)系統(tǒng)主要通過Networker備份技術(shù)備份至虛擬磁帶庫,同時在容災(zāi)中心也有一套虛擬磁帶庫與之構(gòu)成復(fù)制關(guān)系,保證了數(shù)據(jù)級別的容災(zāi)需求。
(3)此外,為了縮短RTO,還實施了Acronis公司的Backup And Recovery裸機(jī)備份系統(tǒng),為業(yè)務(wù)系統(tǒng)的服務(wù)器提供操作系統(tǒng)級別的保護(hù),可以在短時間內(nèi)重建系統(tǒng)環(huán)境。
5.結(jié)束語
事實證明,各類災(zāi)難的到來通常是突發(fā)性、偶然性的,但只要能夠進(jìn)行行之有效的災(zāi)難恢復(fù)工作,就可以將損失降到最小。
本文僅從技術(shù)架構(gòu)方面對信息系統(tǒng)的容災(zāi)進(jìn)行了探討。但是,容災(zāi)系統(tǒng)(中心)的建設(shè)是一個系統(tǒng)性工程,涉及到大量的資源投人和建設(shè)維護(hù)。需要大量人力、物力、財力的投人。
只有深人廣泛地了解和掌握容災(zāi)技術(shù)和最新發(fā)展,同時吸取國內(nèi)外同行在這方面的成功經(jīng)驗,才能設(shè)計出科學(xué)、適配的容災(zāi)解決整體方案,為企業(yè)數(shù)據(jù)安全性帶來真正的保障。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:企業(yè)信息系統(tǒng)容災(zāi)技術(shù)架構(gòu)分析與應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839511041.html