容災是指系統(tǒng)具有在嚴重災難發(fā)生后的恢復能力。容災是通過在相當距離的異地,建設一套功能和處理能力與正常生產(chǎn)系統(tǒng)相當?shù)膫浞菹到y(tǒng),以確保當主系統(tǒng)發(fā)生意外災難或有計劃的長時間停機的情況下,備份系統(tǒng)能夠在短時間內(nèi)接替、延續(xù)主系統(tǒng)的生產(chǎn)任務。容災系統(tǒng)對以下情況具有恢復能力:
、僮匀粸暮捌渌豢煽沽Φ臑碾y;長時間無法修復性停電等機房外設的損壞;
②主機升級、檢修等計劃性宕機等長時間機房設備無法正常工作;
③主機系統(tǒng)、數(shù)據(jù)信息被嚴重破壞等人為失誤造成的災害。
容災系統(tǒng)的設計和實現(xiàn)主要有兩種方式,一是基于應用軟件的容災備份方式,是根據(jù)應用系統(tǒng)本身的特點,選擇將主系統(tǒng)處理過程中收集或使用的與備份系統(tǒng)不同的信息(即增量和變化信息),通過網(wǎng)絡傳輸?shù)絺浞菹到y(tǒng)。其特點是:對應用程序須要作一定的改造,將主、備同步機制嵌入到應用程序中去,使主系統(tǒng)能將同步數(shù)據(jù)生成并傳輸?shù)絺浞菹到y(tǒng),而備份系統(tǒng)能根據(jù)收到的同步數(shù)據(jù)進行處理,從而產(chǎn)生與主系統(tǒng)相同的處理結(jié)果,達到主、備系統(tǒng)的一致性。應用軟件級容災的優(yōu)點是所需網(wǎng)絡帶寬較小,對主、備系統(tǒng)距離沒有限制,但其缺點是對于軟件系統(tǒng)的改造和維護工作量較大。另一種是基于共享磁盤的硬件級同步,是將主系統(tǒng)在共享磁盤上執(zhí)行底層“寫”操作,然后通過網(wǎng)絡發(fā)送到備份系統(tǒng)跟從執(zhí)行,從而達到主、備系統(tǒng)的數(shù)據(jù)一致性。其特點是:對應用程序基本透明,無須對應用軟件作較大的改造,便可以實現(xiàn)容災。但是它對于網(wǎng)絡帶寬的要求也較高,對于主、備系統(tǒng)的距離也有一定限制,這是因為當兩地距離超過一定長度后,網(wǎng)絡由于信號中斷引起的延時會對主系統(tǒng)的性能造成較大的沖擊。
1 硬件級容災方案設計
硬件級容災方式是利用存儲服務器的遠程數(shù)據(jù)復制軟件來實現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫的實時拷貝復制。主、備份中心磁盤陣列本身就可以通過陣列上的微處理器完成數(shù)據(jù)的實時同步,不需要主機干涉。即實現(xiàn)遠程容災方案。無須對數(shù)據(jù)庫配置和應用系統(tǒng)進行任何改動,可以做到災難發(fā)生的同時實現(xiàn)應用處理過程的恢復,遠程備份系統(tǒng)的重新啟動可以做到像一般電源故障后的重新啟動那么簡單。
將主機服務器的操作系統(tǒng)、數(shù)據(jù)庫及應用程序安裝在獨立的具有備份功能的磁盤陣列上,并將磁盤陣列上的數(shù)據(jù)進行遠程鏡像,同樣可以實現(xiàn)主機操作系統(tǒng)的遠程容災。當在生產(chǎn)系統(tǒng)上對操作系統(tǒng)參數(shù)、數(shù)據(jù)庫配置文件和應用程序參數(shù)進行修改時,同時也復制到備份中心,無需系統(tǒng)管理員在備份系統(tǒng)的操作系統(tǒng)磁盤上手工重復這些配置參數(shù)的修改,一旦生產(chǎn)中心發(fā)生突發(fā)性故障,備份中心使用備份陣列上的外掛操作系統(tǒng)盤鏡像,與主中心相同的系統(tǒng)配置參數(shù)迅速引導主機,恢復業(yè)務系統(tǒng)的運行。
2 存儲區(qū)域網(wǎng)絡
2.1 網(wǎng)絡存儲技術(shù)
隨著光纖通道技術(shù)的出現(xiàn)和網(wǎng)絡技術(shù)的發(fā)展,存儲的底層技術(shù)逐漸向網(wǎng)絡存儲方向發(fā)展。網(wǎng)絡存儲可以實現(xiàn)數(shù)據(jù)的安全存儲管理,實現(xiàn)不同平臺之間的數(shù)據(jù)共享,為用戶提供不問斷的數(shù)據(jù)訪問。
存儲區(qū)域網(wǎng)絡是網(wǎng)絡存儲技術(shù)發(fā)展的主流方向,它是以Gb帶寬實現(xiàn)計算機和存儲器之間的通訊,結(jié)合了I/O通道技術(shù)、局域網(wǎng)模型、大容量存儲器的技術(shù)優(yōu)點。它消除了服務器傳輸處理的瓶頸。適合大數(shù)據(jù)量傳輸、實時數(shù)據(jù)處理。獨立于服務器網(wǎng)絡系統(tǒng)之外,幾乎擁有無限存儲能力的高速存儲網(wǎng)絡,這種網(wǎng)絡采用高速的光纖通道作為傳輸媒體。存儲區(qū)域網(wǎng)絡SAN(Storage Area Network,SAN)可使服務器與存儲設備之間進行“any to any”的連接通信,實現(xiàn)多服務器獨立地共享一個陣列子系統(tǒng)、共享—個自動庫,實現(xiàn)數(shù)據(jù)的共享和集中的管理,進而完成快速、大容量和安全可靠的數(shù)據(jù)存儲。
2.2 SAN的拓撲結(jié)構(gòu)
SAN的組成包含了存儲介質(zhì)(磁盤陣列、磁帶庫等)、存儲連接器件(光纖交換機、適配器等)、SAN管理服務器(見圖1)。網(wǎng)絡連接包含SAN網(wǎng)絡連接和以太網(wǎng)局域網(wǎng)連接兩部分。
采用SAN架構(gòu)時,如果采用l臺光纖交換機和多臺使用SAN的應用服務器相連,光纖交換機就成了系統(tǒng)中的單點故障隱患點。為了提高存儲系統(tǒng)的安全性和冗余性,在實際應用中采用2臺光纖交換機。所有需要接人SAN存儲子系統(tǒng)的應用服務器都配置兩塊光纖卡,每臺服務器和兩臺光纖交換機之間都有物理連接,整個存儲子系統(tǒng)形成了一個全冗余的架構(gòu)。當有某塊光纖卡或某臺光纖交換機發(fā)生故障現(xiàn)象時,整個存儲子系統(tǒng)不會癱瘓。
3 容災系統(tǒng)的結(jié)構(gòu)和實現(xiàn)
基于SAN的硬件級異地容災系統(tǒng)包括生產(chǎn)數(shù)據(jù)中心(主)和備份數(shù)據(jù)中心(備)兩部分組成(見圖2),分別位于不同的地理位置(同城異地)。兩個數(shù)據(jù)中心的數(shù)據(jù)存儲都是基于SAN的,通過光纖通道交換機將本地磁盤陣列和異地容災磁盤陣列組成SAN網(wǎng)絡存儲。整個系統(tǒng)中的網(wǎng)絡環(huán)境包括兩部分:
①是公網(wǎng)部分(見圖2上半部分所示),主要承擔服務器與服務器之間、服務器與客戶機之間的網(wǎng)絡通訊;
②是SAN管理網(wǎng)段,主要承擔SAN網(wǎng)絡存儲中光纖交換機與設備之間、異地交換機之間的網(wǎng)絡通訊。
主數(shù)據(jù)中心采用高可靠性集群解決方案設計,通過安裝高可靠性管理軟件組成多機高可靠性環(huán)境。數(shù)據(jù)存儲在主數(shù)據(jù)中心的磁盤陣列中,磁帶庫作為日常備份使用。主數(shù)據(jù)中心還要配置一臺備份管理服務器,直接連接到存儲磁盤陣列和磁帶庫,用來管理和控制系統(tǒng)的日常數(shù)據(jù)的備份。類似主數(shù)據(jù)中心,在異地備份數(shù)據(jù)中心配置相同結(jié)構(gòu)的存儲環(huán)境。兩個數(shù)據(jù)中心之間采用高性能骨干網(wǎng),為兩個數(shù)據(jù)中心提供高帶寬、高可靠的連接通道。通過使用容災軟件自動實現(xiàn)主數(shù)據(jù)中心存儲數(shù)據(jù)與備份數(shù)據(jù)中心數(shù)據(jù)的實時完全備份。在本地數(shù)據(jù)及整個應用系統(tǒng)出現(xiàn)災難時,系統(tǒng)至少在異地保存有一份可用的關(guān)鍵業(yè)務的鏡像數(shù)據(jù),該數(shù)據(jù)是本地生產(chǎn)數(shù)據(jù)的完全實時拷貝。
在方案實現(xiàn)上,主要分為以下幾個步驟:
、僭趥浞輸(shù)據(jù)中心,采購和生產(chǎn)數(shù)據(jù)中心一致的光纖交換機和存儲設備,構(gòu)成SAN環(huán)境;
②生產(chǎn)數(shù)據(jù)中心和備份數(shù)據(jù)中心之間通過裸光纖連接起來;
③在每個需要容災的應用服務器主機上,部署容災軟件;
、芡ㄟ^容災軟件提供的跨陣列磁盤鏡像技術(shù),實現(xiàn)同城異地間的數(shù)據(jù)容災。
4 容災系統(tǒng)的災難處理
一個完備的容災系統(tǒng),除了在數(shù)據(jù)災難發(fā)生時完成容災備份的使命,還要考慮系統(tǒng)本身的可維護性和可操作性,以及對系統(tǒng)盡可能快的恢復。
當生產(chǎn)中心的磁盤系統(tǒng)發(fā)生故障(災難),導致應用服務器無法訪問本地數(shù)據(jù),容災系統(tǒng)會自動隔離生產(chǎn)中心的磁盤,讓應用服務器直接對備份數(shù)據(jù)中心的數(shù)據(jù)進行訪問。應用和數(shù)據(jù)庫不會因為生產(chǎn)中心的磁盤系統(tǒng)故障而停止;更重要的是,避免了發(fā)生數(shù)據(jù)庫損壞(數(shù)據(jù)一致性風險)的可能。當備份數(shù)據(jù)中心或生產(chǎn)數(shù)據(jù)中心到備份數(shù)據(jù)中心的光纖鏈路發(fā)生故障,導致了鏡像的破壞,容災系統(tǒng)將自動只與狀態(tài)健康的磁盤陣列繼續(xù)工作,與生產(chǎn)數(shù)據(jù)中心發(fā)生故障時的處理是相同的。這樣,即使在無人值守的情況下,也能夠確保業(yè)務系統(tǒng)全天候的正常運行。
磁盤系統(tǒng)故障修復之后,要盡可能快的將遠程鏡像系統(tǒng)恢復起來,實現(xiàn)鏡像的重新同步,以確保容災的功能繼續(xù)得以實現(xiàn),這也是容災方案是否成功的關(guān)鍵因素。目前鏡像同步的技術(shù)大多是基于日志功能的,當因故導致鏡像被破壞時,災難恢復軟件會通過日志記錄此后發(fā)生變化的業(yè)務數(shù)據(jù);一旦故障被修復,會根據(jù)日志記錄的情況,將更新的業(yè)務數(shù)據(jù)(變化量)增量同步到災難端,從而實現(xiàn)鏡像的完全同步。在鏡像快速同步的過程中,用戶的應用始終可以正常工作。整個同步過程的發(fā)起,管理員只需要執(zhí)行簡單命令即刻完成。
5 結(jié)束語
本系統(tǒng)適用于備份數(shù)據(jù)中心和主數(shù)據(jù)中心的近距離容災(距離小于100公里),容災級別相對較低。但投資規(guī)模較小,日常維護費用少,并且可以將已有的投資與長期的存儲解決方案結(jié)合起來。當主、備機房的距離更遠(位于不同城市)時,光纖連接則需要加上光纖延伸器。儲存上則需要專用的存儲服務器,如IBM TotalStorage系列產(chǎn)品,容災費用大,僅適用于大型企業(yè)。
在企業(yè)將來有更高的容災需求時,只需對現(xiàn)有系統(tǒng)結(jié)構(gòu)進行部分擴充,就可以實現(xiàn)。擴充的內(nèi)容主要包括網(wǎng)絡、應用及數(shù)據(jù)庫服務器、IP等資源,以及各資源之間的良好協(xié)調(diào)。這樣,在備份數(shù)據(jù)中心建立一套完整的與生產(chǎn)數(shù)據(jù)中心相當?shù)膫浞輵孟到y(tǒng),從而實現(xiàn)更高級別的應用級容災。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領(lǐng)域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112153829.html