1.概述
如今信息化手段已經滲透到各行各業(yè),成為管理、運作不可或缺的一部分,各行業(yè)和部門的信息系統(tǒng)以及電子政務系統(tǒng)已經成為國家的重要基礎設施。在享受信息化在各方面帶來的便利的同時,其潛在的在安全性和可靠性等方面的負面影響也同樣值得關注。
電網企業(yè)作為關系國家能源安全和國家經濟命脈的重要骨干企業(yè),在信息化方面的依賴程度日漸提高。集中式信息系統(tǒng)為電網企業(yè)帶來一體化操作平臺和便捷的業(yè)務管理等一系列好處,但樣高度集中的平臺也增加了其日常運營的風險,一旦系統(tǒng)由于自然災難或不可預見的意外事件出現(xiàn)問題,將導致整個電網企業(yè)業(yè)務的全面癱瘓,造成難以估量的損失。因此,在集中式系統(tǒng)遭受打擊之后,如何快速恢復正常狀態(tài)以保障正常生產生活成為了當前企業(yè)面臨的重要挑戰(zhàn)。
2.容災備份的相關概念
容災備份是指采用某種機制對企業(yè)的各類業(yè)務信息進行完整的備份,在災難發(fā)生之后受到損壞的系統(tǒng)平臺能夠迅速進行重建并恢復到進行備份時的狀態(tài),從最大限度上保障企業(yè)各種業(yè)務的正常運轉。
容災備份技術是在節(jié)點層面上進行操作,能夠保障整個節(jié)點的性能恢復。從對系統(tǒng)的保護程度上看,容災可以分為如下3大類:
1)數(shù)據(jù)級容災:數(shù)據(jù)級容災本質上就是數(shù)據(jù)的遠程備份,具體來說是在異地建立一個或多個容災中心,將待備份的數(shù)據(jù)存儲到容災中心,并定期對備份數(shù)據(jù)進行更新以保證數(shù)據(jù)恢復時能獲得最新的數(shù)據(jù)。這種容災方式機制簡單且易于實現(xiàn),但數(shù)據(jù)恢復時間相對較長。
2)應用級容災:應用級容災建立在數(shù)據(jù)級之上,是將本地的應用系統(tǒng)的鏡像運行在異地容災中心。它通過實時的、連續(xù)的復制來確保應用系統(tǒng)的及時同步,這樣可以保證關鍵應用在允許的時間范圍內恢復運行。災難發(fā)生之后,容災中心的最新的應用能夠直接遷移到本地,用戶幾乎感覺不到災難帶來的損失。
3)業(yè)務級容災:這是建立在業(yè)務層面上的災備方式,它的對象包括IT方面的所有技術和維持IT架構的其他設施,甚至包括了業(yè)務辦公所需的基礎設備(如電話、辦公地點)。業(yè)務級容災能夠保證在災難發(fā)生之后,迅速重新建立一套與原先配置一樣的工作場所,以維持正常的業(yè)務活動。
3.集中式信息系統(tǒng)災備實施及關鍵技術
電網企業(yè)集中式信息系統(tǒng)災備的實施是對企業(yè)系統(tǒng)安全性和可靠性的重要保障,其設計和實施的效果將對整個信息系統(tǒng)產生巨大的影響。下面對電網企業(yè)信息系統(tǒng)災備項目的實施方案和關鍵技術進行詳細分析。
3.1 綜合管理系統(tǒng)優(yōu)化整合
集中式信息系統(tǒng)強調對應用、平臺的集中式管理,將原先分散的應用系統(tǒng)集成到一個統(tǒng)一的硬件環(huán)境下,實現(xiàn)信息化軟硬件資源的優(yōu)化整合。整合之后不僅能夠加強系統(tǒng)的集約化、一體化管理,也能夠降低系統(tǒng)容災備份的難度,為數(shù)據(jù)集災備的實施提供基礎和保障。
3.1.1 綜合管理系統(tǒng)的整合架構
針對電網企業(yè)信息系統(tǒng)的特點,設計出了綜合管理系統(tǒng)軟硬件優(yōu)化整合的目標架構,如圖1所示。
圖1 綜合管理系統(tǒng)整合架構
如上圖所示,整合的過程主要是利用企業(yè)現(xiàn)有服務器,安裝VMWare ESX3.5虛擬機軟件并構建HA,以實現(xiàn)虛擬服務器池,然后將綜合管理系統(tǒng)的各應用逐步遷移其上,以提升目前應用的穩(wěn)定性和設備利用效率,實現(xiàn)綜合管理系統(tǒng)整合目標。
3.1.2 系統(tǒng)整合風險分析
系統(tǒng)整合的過程中隨時可能出現(xiàn)各種意外狀況,因此有必要在整合方案實施前對各種可能的狀況進行分析并進行預案。經過對整合過程的分析,可得出該綜合信息管理系統(tǒng)整合方案實施過程中可能出現(xiàn)的風險狀況及應對方案。
1) 在生產系統(tǒng)割接到目標系統(tǒng)環(huán)境過程中,目標系統(tǒng)可能會發(fā)生問題時,需要回切到原有系統(tǒng)。應對方案:保持原有生產系統(tǒng)環(huán)境在可用狀態(tài),如果之前先需要拆除部分原生產系統(tǒng)的,需要找環(huán)境先建立一套可用的系統(tǒng)做回切準備;厍泄ぷ髦饕性诰W絡切換。
2) 在原生產系統(tǒng)中改造數(shù)據(jù)庫整合過程中,可能會出現(xiàn)覆蓋原生產系統(tǒng)數(shù)據(jù)的風險。應對方案:在任何數(shù)據(jù)庫改造工作之前,需要確保數(shù)據(jù)庫服務器上的數(shù)據(jù)庫數(shù)據(jù)已經備份。此外,在數(shù)據(jù)導入之前,需要檢驗數(shù)據(jù)的用戶名、模式名稱是否有重名的問題。
3) 在目標應用服務器上部署應用包時,可能會出現(xiàn)被部署的應用不是當前生產上運行的最新版本。應對方案:在目標應用服務器部署應用包之前,需要和應用開發(fā)商及維護人員確認當前被部署的應用包與生產系統(tǒng)運行的應用包的版本一致。
3.1.3 整合回退應急措施
在綜合系統(tǒng)整合實施過程中,尤其是各子系統(tǒng)上線割接時,如果測試環(huán)境無法使用并在停機窗口間無法找出問題,需要在各相關人員的配合下啟用應急預案進行回退操作;赝瞬僮髦饕槍θ齻方面進行——中間件整合回退、數(shù)據(jù)庫整合回退和數(shù)據(jù)庫數(shù)據(jù)不完整回退。
在遷移各應用系統(tǒng)中間件應用過程中,如果在遷移截止時間之前未能按照預期實現(xiàn)當前的操作目標,則需要執(zhí)行回退計劃。中間件整合回退的關鍵是在實施前對應用進行備份。備份時首先向應用軟件開發(fā)商確認各應用系統(tǒng)的應用軟件包及其版本與兼容性,再停機備份各應用系統(tǒng)的應用文件目錄。
數(shù)據(jù)庫整合之前同樣需要先對原有的數(shù)據(jù)庫進行備份。在數(shù)據(jù)庫整合過程中,如果在整合截止時間之前沒有按照預期實現(xiàn)當前操作目標,則需要進行數(shù)據(jù)庫回退操作。另外,如果在校驗過程中發(fā)現(xiàn)遷移的數(shù)據(jù)庫對象或數(shù)據(jù)不完整,則需要刪除相應的用戶及其對象,重新進行用戶創(chuàng)建及數(shù)據(jù)庫導入。
數(shù)據(jù)庫遷移的過程中可能會不完整的現(xiàn)象,因此在遷移前需對原始數(shù)據(jù)進行備份并確認備份數(shù)據(jù)是可用的。測試人員驗收數(shù)據(jù)庫完整性過程中發(fā)現(xiàn)數(shù)據(jù)丟失時,需要導入原始應用中的數(shù)據(jù)庫備份數(shù)據(jù)以恢復生產。
3.2 SAN存儲優(yōu)化整合
SAN(Storage Area Network)是一個集中式管理的高速存儲網絡c7,由多供應商存儲系統(tǒng)、存儲管理軟件、應用程序服務器和網絡硬件組成。對SAN的存儲優(yōu)化整合是電網企業(yè)軟硬件資源優(yōu)化整合工作的重要部分。
3.2.1 SAN存儲系統(tǒng)目標架構
SAN存儲系統(tǒng)大體上由SAN服務器、SAN存儲和SAN互連三部分構成。服務器是整個SAN方案的前提,而存儲基礎結構是所有信息活動的基礎,SAN互連解決的是服務器和存儲之間的連接問題。SAN存儲系統(tǒng)目標架構如圖2所示。
圖2 SAN存儲系統(tǒng)目標架構
3.2.2 SAN網絡目標架構
SAN存儲系統(tǒng)架構的中間層有核心和邊緣兩種SAN交換機,其原因是系統(tǒng)采用了核心一邊緣架構的二級部署模式。為了能夠提供高的安全和擴展性,有利于集中管理和維護,可以將核心交換機連接存儲設備,包括磁盤和磁帶庫設備,同時將邊緣交換機連接服務器。詳細的網絡架構如圖3。
圖3 SAN存儲網絡架構
3.3數(shù)據(jù)級容災
數(shù)據(jù)級容災是災備方案中相對比較容易實施的一種,也是應用級、業(yè)務級容災方案的基礎,因此數(shù)據(jù)級容災的實施情況對后續(xù)災備的開展有著重要作用。數(shù)據(jù)級容災的目標是建立多個異地的容災中心,對各單位的信息系統(tǒng)數(shù)據(jù)進行集中備份,為后續(xù)額容災措施打下基礎。
3.3.1數(shù)據(jù)級容災方案總體設計
基于對國網災備總體框架的分析與討論,綜合考慮電網企業(yè)現(xiàn)有系統(tǒng)框架后,制定出的電網企業(yè)數(shù)據(jù)級容災的設計方案如下:
1)生產中心在ERP及管控、營銷、生產管理和一體化平臺中的結構化數(shù)據(jù)主機上部署Oracle GcldenGate數(shù)據(jù)庫復制客戶端,以實現(xiàn)結構化數(shù)據(jù)到容災中心的復制發(fā)起。
2)除使用Oracle GcldenGate進行復制的數(shù)據(jù)庫外,其他的結構化及非結構化數(shù)據(jù)都通過HP XP24000進行存儲復制,存儲在非XP24000中的中低端存儲需要先虛擬化到XP24000中,再進行遠程復制傳輸?shù)疆惖貫膫渲行牡奶摂M化平臺。
3)在容災中心建立相應的數(shù)據(jù)庫主機群、存儲池用來處理和存放企業(yè)的生產數(shù)據(jù)。
3.3.2數(shù)據(jù)級容災策略設計
數(shù)據(jù)級容災措施可向核心應用、一體化平臺和綜合管理平臺應用系統(tǒng)提供異地數(shù)據(jù)級容災保護,因此容災中心能夠在一定范圍內提供數(shù)據(jù)保護和數(shù)據(jù)恢復能力。在容災數(shù)據(jù)復制方面,同樣需要采取一定的策略進行保障。首先應該在對現(xiàn)有生產影響最小的情況下對數(shù)據(jù)進行完整的、一致性的遷移。同時,遷移前應對數(shù)據(jù)進行精簡以節(jié)省遷移時間、磁盤空間和傳輸帶寬。另外,災備中心處理能力的保障對數(shù)據(jù)級容災至關重要。災備中心處理能力設計策略應著重考慮如下三點:
1)容災中心的處理能力將優(yōu)先考慮滿足數(shù)據(jù)級容災復制的最低需求,其中數(shù)據(jù)庫復制主機按照2CPU , 8G內存進行配置,驗證區(qū)主機按照典型網省的典型系統(tǒng)主機進行配置。
2)容災中心數(shù)據(jù)按照不同層級存儲。
3)現(xiàn)有生產中心業(yè)務系統(tǒng)與災備中心相關災備系統(tǒng)的的設備類型和操作系統(tǒng)版本應保持一致。
3.3.3數(shù)據(jù)級容災災難恢復場景設計
國網集中式容災系統(tǒng)建設具有可行性、先進性又具有經濟性等特點。但是,容災系統(tǒng)的建立并不能解決所有問題。容災系統(tǒng)是面向一定的風險場景,容災具有其適應性與局限,不是所有問題均能夠通過容災解決。正確的定位容災系統(tǒng),有利于信息系統(tǒng)的建設與管理,利于業(yè)務系統(tǒng)的持續(xù)運行。適用于數(shù)據(jù)級容災的場景如表1所示。
表1 數(shù)據(jù)級容災適用場景
不支持的場景如表2中所示。
表2 數(shù)據(jù)級容不災適用的場景
4.結束語
電網企業(yè)信息系統(tǒng)及業(yè)務數(shù)據(jù)的安全直接影響到國民經濟的正常運行,其安全保障和災難恢復工作已經引起了國家和企業(yè)的重大關注。該文對電網企業(yè)信息系統(tǒng)災備過程中的關鍵技術進行了分析介紹,具體包括綜合管理系統(tǒng)優(yōu)化整合、SAN存儲系統(tǒng)優(yōu)化整合以及數(shù)據(jù)級容災,同時還對災備實施中的突發(fā)狀況進行了預案分析。由于數(shù)據(jù)級容災備份是應用級和業(yè)務級容災備份的基礎,實施的效果將對后兩者產生直接作用,因此本文著重對數(shù)據(jù)級容災方面進行了較全面的分析。該文介紹的若干個災備關鍵技術在電網企業(yè)實際的容備項目中得到了成功的實施并取得了預期的效果。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/
本文標題:電網企業(yè)信息系統(tǒng)容災備份關鍵技術研究
本文網址:http://www.ezxoed.cn/html/consultation/10839511010.html