容災(zāi)是企業(yè)數(shù)據(jù)管理中的一個重要環(huán)節(jié)。近年來,國內(nèi)頻頻發(fā)生的自然災(zāi)害事件給企業(yè)CIO提出了一個問題,災(zāi)難備份到底要做成什么程度才能滿足企業(yè)的業(yè)務(wù)連續(xù)性要求?
一 災(zāi)備建設(shè)參考法規(guī)和標準
1.1 信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范(GB/T 20988-2007)
我國至今已發(fā)布一系列的文件對災(zāi)難備份建設(shè)進行指導(dǎo)和監(jiān)督,其中國務(wù)院信息化工作辦公室2005年發(fā)布的《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》最為重要。2007年7月,《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》正式升級成為國家標準《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/T 20988-2007 )。這是中國災(zāi)難備份與恢復(fù)行業(yè)的第一個國家標準,并在2007年11月1日開始正式實施。
我國災(zāi)難恢復(fù)等級劃分:
大致可以分為兩類:數(shù)據(jù)類、應(yīng)用類。
第1級:數(shù)據(jù)介質(zhì)轉(zhuǎn)移;
第2級:備用場地支持;
第3級:電子傳送和部分設(shè)備支持;
第4級:電子傳送和完整設(shè)備支持;
第5級:實時數(shù)據(jù)傳送及完整設(shè)備支持;
第6級:數(shù)據(jù)零丟失和遠程。
1.2 災(zāi)備建設(shè)遵循標準
各種災(zāi)難時間按照發(fā)生頻率可排序如下:軟災(zāi)難、硬件災(zāi)難、自然災(zāi)難。
因此,軟災(zāi)難的防范是數(shù)據(jù)災(zāi)備建設(shè)過程中重點考慮對象,同時要兼顧到硬件災(zāi)難與自然災(zāi)難。
從技術(shù)上看,衡量災(zāi)備系統(tǒng)有兩個主要指標:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了當災(zāi)難發(fā)生時允許丟失的數(shù)據(jù)量;而RTO則代表了系統(tǒng)恢復(fù)的時間。
在數(shù)據(jù)保護和災(zāi)備系統(tǒng)建設(shè)中主要有三個指標:
PTO(Recovery Time Object,恢復(fù)時間目標)
RTO是將信息系統(tǒng)“從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運行狀態(tài),并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài)”所需時間,其中包括備份數(shù)據(jù)恢復(fù)到可用狀態(tài)所需時間、數(shù)據(jù)處理系統(tǒng)切換時間、備用網(wǎng)絡(luò)切換時間等,該指標用以衡量災(zāi)備方案的業(yè)務(wù)恢復(fù)能力。
RPO(Recovery Point:Objective,恢復(fù)點目標)
RPO是指業(yè)務(wù)系統(tǒng)所允許的災(zāi)難過程中的最大數(shù)據(jù)丟失量。數(shù)據(jù)保護的根本目的,就是在一定的預(yù)算和技術(shù)基礎(chǔ)上,要求實現(xiàn)盡量小的RTO、RPO。當發(fā)生各種故障時,可以進行快速的系統(tǒng)和數(shù)據(jù)恢復(fù),使得系統(tǒng)繼續(xù)發(fā)揮作用,提供數(shù)據(jù)服務(wù)和業(yè)務(wù)服務(wù)能力。
RR(Recovery Radius,災(zāi)備半徑)
RR 即主站點與備份站點間的距離,指災(zāi)備系統(tǒng)能夠承受多大物理距離內(nèi)的災(zāi)難,應(yīng)對自然災(zāi)害。
二 應(yīng)用級容災(zāi)的功能特性以及傳統(tǒng)容災(zāi)方式簡介
容災(zāi),顧名思義是業(yè)務(wù)系統(tǒng)在災(zāi)難發(fā)生時的承受和抵御能力。業(yè)務(wù)系統(tǒng)通過容災(zāi)機制來保證數(shù)據(jù)的安全可靠,提高系統(tǒng)的可用性,并確保業(yè)務(wù)的連續(xù)性。從對用戶整個業(yè)務(wù)連續(xù)性的保障程度來看,容災(zāi)可以分為兩個級別:數(shù)據(jù)級別和應(yīng)用級別。
2.1 數(shù)據(jù)級別
數(shù)據(jù)級別容災(zāi)的關(guān)注點在于數(shù)據(jù),即災(zāi)難發(fā)生后可以確保用戶原有的數(shù)據(jù)不會丟失或者遭到破壞。數(shù)據(jù)級的容災(zāi)較為基礎(chǔ),數(shù)據(jù)級別容災(zāi)是保障數(shù)據(jù)可用的最基本要求,當數(shù)據(jù)丟失時能夠保證應(yīng)用系統(tǒng)可以重新得到所有數(shù)據(jù)。該級別災(zāi)難恢復(fù)時間較長,延遲大,仍然存在較大風(fēng)險,盡管有時候用戶原有數(shù)據(jù)沒有丟失,應(yīng)用也會被中斷,用戶業(yè)務(wù)也會被迫停止。但這種方案的特點是成本低、構(gòu)建簡單。
2.2 應(yīng)用級別
對于業(yè)務(wù)應(yīng)用繁多、而且系統(tǒng)需要保持7 X 24小時連續(xù)運行的企業(yè)來說,顯然需要高級別的應(yīng)用容災(zāi)系統(tǒng)來滿足他們的需求。應(yīng)用級容災(zāi)是在數(shù)據(jù)級容災(zāi)的基礎(chǔ)上,再把執(zhí)行應(yīng)用處理能力復(fù)制一份。應(yīng)用級容災(zāi)系統(tǒng)能提供不間斷的應(yīng)用服務(wù),讓用戶應(yīng)用的服務(wù)請求能夠透明地繼續(xù)運行,而感受不到災(zāi)難的發(fā)生,保證業(yè)務(wù)系統(tǒng)提供的服務(wù)完整、可靠、安全,以及業(yè)務(wù)的連續(xù)。
三 構(gòu)建在虛擬化環(huán)境中的容災(zāi)系統(tǒng)為信息系統(tǒng)建設(shè)帶來的變革
3.1 虛擬化概述
虛擬化就是淡化用戶對于物理計算資源,如處理器、內(nèi)存、I/O設(shè)備的直接訪問,取而代之的是用戶訪問邏輯的資源,而后臺的物理連接則由虛擬化技術(shù)來實現(xiàn)和管理。從而實現(xiàn)了靈活性、可靠性、可擴展性、安全性、降低成本。
3.2 如何定位業(yè)務(wù)連續(xù)性
業(yè)務(wù)連續(xù)性就是將宕機時間縮短到最小。構(gòu)建業(yè)務(wù)連續(xù)性解決方案的需求有以下四點:
(1)構(gòu)建在可靠的平臺之上:這個平臺本身的可用性必須很高,并且不依賴操作系統(tǒng)或特定驅(qū)動裝置;
(2)獨立于物理架構(gòu)之外:這樣物理架構(gòu)的缺陷將不會導(dǎo)致業(yè)務(wù)系統(tǒng)的不穩(wěn)定;
(3)貫穿操作系統(tǒng)和應(yīng)用程序的保護:雖然我們需要保護的是業(yè)務(wù)系統(tǒng),但是與業(yè)務(wù)系統(tǒng)息息相關(guān)的操作系統(tǒng)、配置文件等也必須考慮進來;
(4)廣譜宕機因素的保護能力:這個系統(tǒng)必須能對計劃內(nèi)與計劃外的宕機提供保護,同時對組件、服務(wù)器、數(shù)據(jù)以及站點災(zāi)難同樣要提供保護。
在虛擬化平臺之上為業(yè)務(wù)連續(xù)性的每一個層面都能提供保護,當這些保護措施不足以滿足我們業(yè)務(wù)連續(xù)性的要求時,還有更多的、專注單一層面解決方案,可以和虛擬化平臺有機的進行結(jié)合。例如:在VMware環(huán)境中Vizioncore VVSP的各個組件可以提供對虛擬化平臺更加優(yōu)化的管理,這其中包含容災(zāi)管理。
3.3 災(zāi)難恢復(fù)需考慮的要素
3.3.1 想要達成什么樣的災(zāi)難恢復(fù)目標很重要
災(zāi)難恢復(fù)分為以下三種:
本地高可用:冷備,有備機是否就已足夠?熱備,MSCS?VCS?VMware HA?VMware FT?系統(tǒng)級切換還是應(yīng)用級別的切換?
遠程數(shù)據(jù)保護:僅有數(shù)據(jù)足夠嗎?在災(zāi)難恢復(fù)發(fā)生時,怎么讓數(shù)據(jù)能夠使用起來?僅有應(yīng)用足夠嗎?在災(zāi)難恢復(fù)發(fā)生時,怎么去獲得生產(chǎn)數(shù)據(jù)讓應(yīng)用能夠發(fā)揮作用?
任何情況下不間斷運行:真的需要實時切換嗎?實時切換的巨大投入(硬件、軟件、線路、人力)是否能購承受?
3.3.2 災(zāi)難恢復(fù)的實現(xiàn)方式
基于應(yīng)用程序災(zāi)難恢復(fù)解決方案:應(yīng)用程序在本地、遠端雙寫I/O,需要從寫應(yīng)用程序,周期長,不穩(wěn)定;
基于數(shù)據(jù)庫復(fù)制的遠程災(zāi)難恢復(fù)解決方案:數(shù)據(jù)庫本身的遠程復(fù)制(Oracle DB Guard),只能復(fù)制數(shù)據(jù)庫自身的文件;
基于主機的遠程數(shù)據(jù)復(fù)制軟件災(zāi)難恢復(fù)解決方案:復(fù)制軟件在卷管理器層面截獲I/O,遠程復(fù)制,支持異構(gòu)存儲平臺,但是低效率、對主機的運行有影響,配置復(fù)雜;
基于存儲的遠程數(shù)據(jù)復(fù)制災(zāi)難恢復(fù)解決方案:智能存儲遠程數(shù)據(jù)復(fù)制,相對安全、成熟、簡單、高效、節(jié)省資源,但是對存儲的要求比較高,一般要求同構(gòu)平臺;
基于虛擬化平臺的遠程數(shù)據(jù)復(fù)制軟件災(zāi)難恢復(fù)解決方案:復(fù)制軟件在虛擬化存儲層面截獲I/0,遠程復(fù)制,支持異構(gòu)/同構(gòu)存儲平臺。
在虛擬架構(gòu)下系統(tǒng)和數(shù)據(jù)采用同樣的方式來保護,系統(tǒng)也是數(shù)據(jù),保護系統(tǒng)的同時就保護了數(shù)據(jù),反之亦然。虛擬機既存儲系統(tǒng)也存儲數(shù)據(jù),整個系統(tǒng)封裝在文件中:硬件配置,操作系統(tǒng),應(yīng)用及數(shù)據(jù)。這樣我依靠虛擬化的硬件獨立性,可以可靠地將虛擬機恢復(fù)到其他的硬件服務(wù)器上,并可將整個系統(tǒng)迅速轉(zhuǎn)移到災(zāi)難恢復(fù)中心;由于關(guān)于系統(tǒng)的所有信息都以數(shù)據(jù)的方式存儲在磁盤上,我們可以依靠虛擬化的封裝性,用保護數(shù)據(jù)的方式保護整個系統(tǒng);我們可以依靠虛擬化的分區(qū)和整合特性,保障生產(chǎn)中心與災(zāi)備中心服務(wù)器的比例不在是1:1;同時我們可以依靠虛擬化的資源池化特性,確保生產(chǎn)中心與災(zāi)備中心基礎(chǔ)架構(gòu)的一致性。
這樣使得在虛擬化環(huán)境中用任何你喜歡的方法(自動或者手動)將數(shù)據(jù)(包含系統(tǒng)、應(yīng)用及數(shù)據(jù))復(fù)制過去,然后啟動虛擬機即可,從而獲得最好的RTO。
四 總結(jié)
通過在虛擬化環(huán)境中部署應(yīng)用級容災(zāi)軟件,實現(xiàn)司信息系統(tǒng)高效安全的“兩帶三中心”容災(zāi)系統(tǒng),提高了信息系統(tǒng)的穩(wěn)定性,數(shù)據(jù)的安全性,促進信息化安全平穩(wěn)運行。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:利用虛擬化技術(shù)進行信息系統(tǒng)應(yīng)用級容災(zāi)的建設(shè)
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083974914.html