計算機系統(tǒng)在為企業(yè)各類應(yīng)用系統(tǒng)提供強大支撐的同時,無時無刻不面臨著系統(tǒng)崩潰的危險。計算機硬件故障、病毒侵害、人為誤操作、自然災(zāi)難等情況的發(fā)生都會讓系統(tǒng)變得極其脆弱,一旦系統(tǒng)癱瘓,通常的解決辦法只能是購置設(shè)備(配件)、重裝系統(tǒng)、安裝應(yīng)用軟件、完成配置操作等等繁瑣的工作,可見系統(tǒng)在短時間內(nèi)是無法恢復(fù)正常使用的。但作為一個企業(yè)的生產(chǎn)系統(tǒng).必須保證生產(chǎn)業(yè)務(wù)不中斷、不受影響,因此適合的應(yīng)急恢復(fù)技術(shù)是保證系統(tǒng)穩(wěn)定運行的關(guān)鍵。中國石油油氣生產(chǎn)信息系統(tǒng)是油田生產(chǎn)業(yè)務(wù)重要的信息系統(tǒng)之一。為保證系統(tǒng)的穩(wěn)定運行,采用了目前計算機系統(tǒng)恢復(fù)技術(shù)中較為先進的冗災(zāi)恢復(fù)技術(shù)和方法。本文通過對中國石油油氣生產(chǎn)信息系統(tǒng)是如何實現(xiàn)對生產(chǎn)系統(tǒng)的快速恢復(fù)和異地冗災(zāi)的闡述,論述應(yīng)急恢復(fù)技術(shù)在企業(yè)信息系統(tǒng)中的應(yīng)用。
1 信息系統(tǒng)現(xiàn)狀與需求
中國石油油氣生產(chǎn)信息系統(tǒng)是管理油氣田勘探與生產(chǎn)過程的重要信息系統(tǒng)之一,系統(tǒng)建設(shè)范圍覆蓋了中國石油總部和各油氣田分公司,是集數(shù)據(jù)采集、存儲、傳輸、處理、分析、發(fā)布和服務(wù)于一體的現(xiàn)代化勘探開發(fā)信息管理系統(tǒng)。系統(tǒng)自建設(shè)完成,保證7×24h不間斷運行,全面服務(wù)于油氣田油氣生產(chǎn)。
油氣生產(chǎn)信息系統(tǒng)前端應(yīng)用層服務(wù)器使用windows2003操作系統(tǒng),之上安裝有TWs、LPM、CDMT、Dss等多種油氣生產(chǎn)管理專業(yè)軟件,后臺使用0racle9i數(shù)據(jù)庫,同時,系統(tǒng)掛接有磁盤存儲系統(tǒng)和帶庫系統(tǒng)等共同組成完整的架構(gòu)體系。系統(tǒng)穩(wěn)定運行離不開完備的應(yīng)用程序架構(gòu)和軟件產(chǎn)品,同時建立合理、完善的備份與應(yīng)急恢復(fù)機制是確保系統(tǒng)安全、穩(wěn)定運行必不可少的前提條件。各類災(zāi)害以及人為誤操作導(dǎo)致計算機系統(tǒng)崩潰、數(shù)據(jù)丟失的情況屢見不鮮,面對災(zāi)難和故障做好系統(tǒng)和生產(chǎn)數(shù)據(jù)的快速恢復(fù)工作就顯得尤為重要。為增強油氣生產(chǎn)信息系統(tǒng)應(yīng)對各種風(fēng)險的恢復(fù)能力,對該系統(tǒng)部署實施了應(yīng)急恢復(fù)子系統(tǒng),應(yīng)急恢復(fù)子系統(tǒng)的建成保證了油氣生產(chǎn)信息系統(tǒng)的安全、穩(wěn)定、高效,同時為中國石油打造了一個堅實的油氣生產(chǎn)信息平臺。
2 應(yīng)急恢復(fù)技術(shù)實現(xiàn)
2.1應(yīng)急恢復(fù)系統(tǒng)方案設(shè)計原則
應(yīng)急恢復(fù)系統(tǒng)方案設(shè)計必須遵守以下原則:高可用性的原則;運維簡捷,容易操作,可管理性高的原則;以不犧牲原系統(tǒng)的強壯性原則;保證生產(chǎn)系統(tǒng)正常運行原則;系統(tǒng)層、應(yīng)用層具有高強容錯能力設(shè)計的原則。同時,需要保證生產(chǎn)系統(tǒng)生產(chǎn)數(shù)據(jù)任何情況下不丟失,本地備份與異地災(zāi)備相結(jié)合的原則。當(dāng)災(zāi)難發(fā)生時應(yīng)急恢復(fù)系統(tǒng)恢復(fù)正常工作時間<10min,在線恢復(fù)回寫系統(tǒng)和數(shù)據(jù)時間<4h,災(zāi)難發(fā)生時系統(tǒng)管理員能遠程控制切換操作,快速恢復(fù)系統(tǒng)正常工作。
2.2應(yīng)急恢復(fù)系統(tǒng)方案設(shè)計
根據(jù)信息系統(tǒng)現(xiàn)狀與需求,結(jié)合當(dāng)前災(zāi)備恢復(fù)技術(shù)進行分析論證,系統(tǒng)采用集中災(zāi)備模式。由于信息系統(tǒng)的前端應(yīng)用層和后臺數(shù)據(jù)庫層在運行方式、備份需求與內(nèi)容上有很大的不同,為了做到有針對性的災(zāi)備與恢復(fù).我們對應(yīng)用層系統(tǒng)采用“網(wǎng)絡(luò)盤存儲鏡像”備份技術(shù),對數(shù)據(jù)庫層系統(tǒng)采用“遠程數(shù)據(jù)庫準同步”備份技術(shù)。
整個應(yīng)急恢復(fù)系統(tǒng)架構(gòu)設(shè)計實現(xiàn)本地系統(tǒng)數(shù)據(jù)保護和異地冗災(zāi)接管的功能。系統(tǒng)總體設(shè)計框架如圖1所示。
圖1系統(tǒng)總體設(shè)計框架
“網(wǎng)絡(luò)盤存儲鏡像”(注:硬件設(shè)備+軟件系統(tǒng))技術(shù)主要是將windows操作系統(tǒng)及其上的應(yīng)用軟件、數(shù)據(jù)庫等在系統(tǒng)運行正常時保存在“網(wǎng)絡(luò)盤存儲鏡像”中,并可多版本快照保存。當(dāng)災(zāi)難發(fā)生時,服務(wù)器可以拋開本地(內(nèi)置)硬盤不用,直接從“網(wǎng)絡(luò)盤存儲鏡像”啟動操作系統(tǒng)、應(yīng)用軟件和數(shù)據(jù)庫系統(tǒng),這種啟動方式所掛的“網(wǎng)絡(luò)盤存儲鏡像”盤是可讀寫的,也就是說它完全可代替原應(yīng)用服務(wù)器工作,快速恢復(fù)生產(chǎn)應(yīng)用。然后再利用生產(chǎn)空閑時間將當(dāng)前版本寫回主應(yīng)用服務(wù)器系統(tǒng),使主服務(wù)器恢復(fù)正常工作!熬W(wǎng)絡(luò)盤存儲鏡像”的另一優(yōu)勢還可多版本存儲Windows操作系統(tǒng),可根據(jù)實際需求回滾到之前存儲過的任何一個windows版本。
對應(yīng)用層windows系統(tǒng),在每個油田部署一個(組)“網(wǎng)絡(luò)盤存儲鏡像”系統(tǒng),各油田的應(yīng)用服務(wù)系統(tǒng)都備份在“網(wǎng)絡(luò)盤存儲鏡像”中,并可多版本快照保存。然后在北京總部再部署一組“網(wǎng)絡(luò)盤存儲鏡像”系統(tǒng),在油田“網(wǎng)絡(luò)盤存儲鏡像”系統(tǒng)與總部“網(wǎng)絡(luò)盤存儲鏡像”系統(tǒng)之問做一個實時增量數(shù)據(jù)同步,從而做到各個油田的應(yīng)用系統(tǒng)實時備份到總部。當(dāng)油田系統(tǒng)出現(xiàn)故障不能從當(dāng)?shù)貑訒r,可以由總部服務(wù)器從總部備份系統(tǒng)啟動代替各油田的服務(wù)器應(yīng)用系統(tǒng)。
對0racle數(shù)據(jù)庫系統(tǒng),利用部署好的“網(wǎng)絡(luò)盤存儲鏡像”系統(tǒng),使用遠程數(shù)據(jù)庫準同步方案,所有備份數(shù)據(jù)都直接放在總部,利用數(shù)據(jù)復(fù)制同步軟件技術(shù)實現(xiàn)總部數(shù)據(jù)與各油田數(shù)據(jù)準實時同步。
2.2.1應(yīng)用層服務(wù)器系統(tǒng)恢復(fù)
利用“網(wǎng)絡(luò)盤存儲鏡像”技術(shù)將windows操作系統(tǒng)及其上的應(yīng)用軟件、系統(tǒng)服務(wù)等在系統(tǒng)正常運行時實時的保存到“網(wǎng)絡(luò)盤存儲鏡像”設(shè)備中,并可進行多版本快照保存。但是過多的快照會影響系統(tǒng)L/O讀寫性能,占用一定量的系統(tǒng)資源,根據(jù)各油田使用油氣生產(chǎn)信息系統(tǒng)的使用頻度和使用峰值時段,每6h定制一個快照,共4個快照即可滿足業(yè)務(wù)需求,同時備份體保存64d(256/4)!熬W(wǎng)絡(luò)盤存儲鏡像”的一個優(yōu)勢是可多版本存儲,可根據(jù)實際需要回滾到任何一個“干凈”版本,理論上它能防止任何操作系統(tǒng)故障、應(yīng)用軟件故障、數(shù)據(jù)庫故障以及人為的誤操作等引起的系統(tǒng)或者軟件故障。
當(dāng)故障引起的系統(tǒng)崩潰在短時間(4h)內(nèi)無法修復(fù)生產(chǎn)系統(tǒng)時,服務(wù)器可以拋開本地硬盤不用,直接從“網(wǎng)絡(luò)盤存儲鏡像”啟動操作系統(tǒng)、應(yīng)用軟件,從而快速恢復(fù)生產(chǎn)系統(tǒng)。整個恢復(fù)過程根據(jù)流程進行恢復(fù)、接管硬盤及軟件系統(tǒng)故障:應(yīng)用服務(wù)器因病毒、操作系統(tǒng)、應(yīng)用軟件、硬盤發(fā)生故障時,只需從本地網(wǎng)絡(luò)重啟服務(wù)器就會接替原應(yīng)用服務(wù)器系統(tǒng)工作。然后再利用生產(chǎn)空閑時間將當(dāng)前版本寫回主應(yīng)用服務(wù)器系統(tǒng),使主服務(wù)器恢復(fù)正常工作。其他硬件故障如:服務(wù)器主板、網(wǎng)卡等非硬盤故障時,由后備服務(wù)器從網(wǎng)絡(luò)盤存儲鏡像設(shè)備網(wǎng)絡(luò)啟動,接替原服務(wù)器工作。主服務(wù)器修理后,根據(jù)硬盤數(shù)據(jù)情況再決定是否采用回寫方式恢復(fù)系統(tǒng)。
由于北京總部和各油田應(yīng)急恢復(fù)系統(tǒng)是進行實時增量同步的,所以當(dāng)油田出現(xiàn)故障不能從油田本地啟動,或是油田系統(tǒng)在長時問(4h以上)無法恢復(fù),如:機房整體搬遷、機房停用、地震、地質(zhì)災(zāi)害等均可啟用異地冗災(zāi)接管,即啟動總部的備份來接管故障油田應(yīng)用。
2.2.2生產(chǎn)數(shù)據(jù)恢復(fù)
生產(chǎn)數(shù)據(jù)使用遠程數(shù)據(jù)庫準同步方案,利用數(shù)據(jù)復(fù)制同步純軟件技術(shù)進行準實時同步,各油田所有生產(chǎn)數(shù)據(jù)復(fù)制到北京總部,時間差應(yīng)在180s以內(nèi)。生產(chǎn)數(shù)據(jù)數(shù)據(jù)庫采用軟件方式,需要在各個油田的數(shù)據(jù)庫服務(wù)器上安裝同步軟件,在總部需要建立相應(yīng)存儲,并安裝同步軟件,實現(xiàn)數(shù)據(jù)同步。
當(dāng)生產(chǎn)數(shù)據(jù)服務(wù)器發(fā)生故障時,因這種方式是將生產(chǎn)數(shù)據(jù)寫入遠程的總部數(shù)據(jù)系統(tǒng)中,這樣無論是主服務(wù)器的硬件、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)出現(xiàn)故障,還是存儲硬件、軟件出現(xiàn)故障,總部數(shù)據(jù)庫備份系統(tǒng)均能很快接替它,使其快速恢復(fù)生產(chǎn)數(shù)據(jù)應(yīng)用。
2.3應(yīng)急恢復(fù)系統(tǒng)特點
冗災(zāi)系統(tǒng)的建設(shè)具有技術(shù)復(fù)雜、需求依賴性高的特點,各類技術(shù)方案不僅要實現(xiàn)冗災(zāi)復(fù)制,還要按照業(yè)務(wù)需求實現(xiàn)各類災(zāi)難的快速恢復(fù),同時還要對現(xiàn)有的生產(chǎn)系統(tǒng)和網(wǎng)絡(luò)環(huán)境具有適應(yīng)性,不產(chǎn)生負面的后果。
系統(tǒng)采用虛擬化技術(shù)在信息整合、信息復(fù)制、信息備份等多個方面的獨特能力,為各種應(yīng)用系統(tǒng)提供有效的數(shù)據(jù)保護,實現(xiàn)“實時備份+多版本快照+瞬間恢復(fù)+遠程災(zāi)備”,具體表現(xiàn)在以下方面:
1)實現(xiàn)生產(chǎn)數(shù)據(jù)遠程復(fù)制和本地時問點保護,使系統(tǒng)在本地快速恢復(fù)和遠程冗災(zāi)接管有機結(jié)合,實現(xiàn)既具有冗災(zāi)能力又提供本地快速恢復(fù)能力的冗災(zāi)系統(tǒng)。
2)256個在線多版本自動快照供選擇。256個快照相當(dāng)于256個全備份,利用快照.一旦發(fā)生任何一類故障,管理員都可以找到最近或特定的快照版本,進行立即恢復(fù),從快照中恢復(fù)數(shù)據(jù)只是幾分鐘的事情。多版本快照支持應(yīng)用系統(tǒng)的系統(tǒng)盤和數(shù)據(jù)盤的全面地實時保護,從而實現(xiàn)操作系統(tǒng)和應(yīng)用數(shù)據(jù)的同步保護。
3)“塊增量+壓縮+加密”的網(wǎng)絡(luò)傳輸特性,支持基于塊增量的遠程數(shù)據(jù)復(fù)制功能,節(jié)省用于遠程復(fù)制的網(wǎng)絡(luò)帶寬,加密的遠程網(wǎng)絡(luò)傳輸功能,保證數(shù)據(jù)體傳輸?shù)目旖菖c安全。
4)利用網(wǎng)絡(luò)盤啟動操作系統(tǒng)和回滾啟動功能,可瞬間恢復(fù)系統(tǒng)。
5)支持指定目錄和指定文件的選擇性恢復(fù)。根據(jù)需要,利用實時鏡像和多點快照,在任意時間恢復(fù)任意目錄和文件。
6)集成多點自動快照技術(shù)的冗災(zāi)系統(tǒng),實現(xiàn)了由人為誤操作類“災(zāi)難”的防范及糾錯功能。
7)全面保護數(shù)據(jù)庫系統(tǒng)和windows操作系彩應(yīng)用系統(tǒng)。傳統(tǒng)的備份系統(tǒng)主要針對數(shù)據(jù)系統(tǒng)提供保護,而該系統(tǒng)是一體化快速恢復(fù)系統(tǒng)和災(zāi)備系統(tǒng),對Windows操作系統(tǒng)、生產(chǎn)業(yè)務(wù)應(yīng)用系統(tǒng)和數(shù)據(jù)庫系統(tǒng)提供實時的數(shù)據(jù)保護和一鍵式快速恢復(fù)機制。
3 結(jié)論
通過應(yīng)急恢復(fù)技術(shù)在中國石油油氣生產(chǎn)信息系統(tǒng)的應(yīng)用研究實例可以看出.采用“網(wǎng)絡(luò)盤存儲鏡像”技術(shù)的災(zāi)備系統(tǒng)可以為企業(yè)信息系統(tǒng)提供一個開放的、易于擴展的存儲平臺,他不僅幫助我們構(gòu)建了一個高效的遠程異地冗災(zāi)系統(tǒng),同時也為我們提供了本地實時備份系統(tǒng)和快速恢復(fù)系統(tǒng),構(gòu)建了一個可以應(yīng)對各種系統(tǒng)故障和災(zāi)難恢復(fù)的安全體系,為企業(yè)生產(chǎn)打造一個安全穩(wěn)定的系統(tǒng)平臺。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:企業(yè)信息系統(tǒng)應(yīng)急恢復(fù)技術(shù)應(yīng)用研究
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083934289.html