為了確保ERP系統(tǒng)持續(xù)穩(wěn)定運行,并滿足金融監(jiān)管部門等對歷史數(shù)據(jù)的查詢需要,數(shù)據(jù)備份管理面臨更高的要求。數(shù)據(jù)中心作為銀行信息系統(tǒng)的核心,有效的數(shù)據(jù)備份管理尤為重要。因其數(shù)據(jù)具有來源復雜、數(shù)據(jù)量大的特點,要做好大型數(shù)據(jù)中心的備份管理,需關注以下幾個問題。
(1)數(shù)據(jù)備份策略制定的合理性。數(shù)據(jù)備份策略是指數(shù)據(jù)備份的基本規(guī)則和約定,合理的備份策略應符合以下要求:一是滿足數(shù)據(jù)有效恢復的需要;二是盡量降低備份的成本和時間。
(2)數(shù)據(jù)備份策略部署的合規(guī)性。由于數(shù)量龐大,備份策略需部署到備份工具中,由其自動調度執(zhí)行。策略部署的合規(guī)性是指,備份策略各個要素在工具中的部署正確無誤。
(3)數(shù)據(jù)備份策略執(zhí)行的準確性。受系統(tǒng)資源、網(wǎng)絡環(huán)境等影響,備份策略可能出現(xiàn)執(zhí)行錯誤,錯誤類型主要有未執(zhí)行、執(zhí)行失敗和執(zhí)行超出時間窗口等。策略執(zhí)行的準確性要求應盡量避免問題發(fā)生,并在問題發(fā)生后能及時處理。
(4)數(shù)據(jù)備份管理工作的可控性。可控性是指,一方面通過一定的工具和手段確保備份管理工作符合上述三點要求;另一方面建立相應的指標,對備份情況進行統(tǒng)計度量。對于大型數(shù)據(jù)中心,一般需要采用自動化的工具實現(xiàn)。
一、數(shù)據(jù)備份策略的制定
1. 備份策略的要素及分類
數(shù)據(jù)備份策略應包括備份內(nèi)容、備份頻率、備份方式、保存期限、備份時間窗口、備份介質、介質存放地點等要素。為了易于執(zhí)行、維護,各個要素的內(nèi)容應精確、可操作。
2. 影響因素分析
制定備份策略需要綜合考慮一些因素,詳見表1。
表1 備份策略要素的影響因素
3. 策略制定的原則及規(guī)范
制定合理的備份策略,需要遵循兩個原則:一是滿足業(yè)務數(shù)據(jù)查詢或系統(tǒng)恢復的需要,包括恢復內(nèi)容要求、恢復時間點要求、恢復效率要求等;二是在滿足恢復需求的前提下,盡量減少備份冗余,以節(jié)約成本、降低耗時。比如通過降低備份頻率,可以降低系統(tǒng)和網(wǎng)絡的使用率,同時減少存儲介質消耗。
為了實現(xiàn)對海量備份需求的統(tǒng)一管理,可根據(jù)以上原則編制《備份策略制定規(guī)范》,以明確對于給定的備份需求,如何確定各項備份要素。比如,對于數(shù)據(jù)庫的備份,可編制如表2所示規(guī)范。
表2 數(shù)據(jù)庫備份策略規(guī)范示例
二、數(shù)據(jù)備份策略的部署
備份策略制定完成后,需部署到備份管理軟件中,由其集中調度,實現(xiàn)自動備份。本文以目前主流的Veritas NetBackup(NBU)軟件為例加以說明。
1. 策略部署存在的問題
根據(jù)合規(guī)性要求,備份策略的各項要素均需正確部署。然而,對于大型數(shù)據(jù)中心而言,由于策略數(shù)量龐大且涉及的系統(tǒng)、網(wǎng)絡及設備等環(huán)節(jié)較多,部署過程中難免出現(xiàn)操作失誤;同時,若備份策略沒有隨應用版本升級等環(huán)境變化及時調整,也可能導致部署錯誤。常見的部署錯誤類型見表3。
表3 備份策略部署問題類型
表4 備份策略執(zhí)行問題類型
2. 解決措施
為了規(guī)避上述問題發(fā)生,可對備份策略的部署情況進行檢查,并及時整改發(fā)現(xiàn)的問題。一般來說,可采用定期檢查、非定期檢查結合的方式;如果技術條件成熟,可采用實時檢查的方式。
定期檢查主要針對因環(huán)境變化導致的部署錯誤。檢查周期根據(jù)環(huán)境變化的速度而定,一般可采用較長周期內(nèi)全面檢查、期間進行抽樣檢查的方式。非定期檢查主要針對策略部署過程中的操作失誤,一般在備份策略變更后進行。實時檢查采用自動化檢查工具,對策略的部署情況實時監(jiān)控。該方式可第一時間發(fā)現(xiàn)問題,確保策略部署的合規(guī)性。
三、數(shù)據(jù)備份策略的執(zhí)行
部署在NBU中的備份策略,一般可由NBU調度自動執(zhí)行;但受系統(tǒng)資源、網(wǎng)絡環(huán)境等影響,備份策略可能出現(xiàn)執(zhí)行錯誤。以下簡單介紹主要的錯誤類型及處理措施。
1. 策略執(zhí)行存在的問題
備份策略在執(zhí)行可能發(fā)生如表4 所示問題。
2. 解決措施
要解決策略執(zhí)行錯誤的問題,降低因此帶來的負面影響,主要應采取以下兩方面的措施:①及時處理。NBU軟件可以提供備份策略執(zhí)行的日志,根據(jù)表4中的判斷依據(jù)對日志進行分析,即可發(fā)現(xiàn)執(zhí)行錯誤問題,進而及時進行手工補備。②根源分析及隱患整改。通過對執(zhí)行出錯問題的統(tǒng)計、根源分析,定位問題的根本原因,并采取措施避免類似問題的再度發(fā)生。
四、備份管理工作的自動化及度量指標
通過上述分析可見,僅采用備份工具NBU尚不能保障備份工作的可控性,因此需引入自動化工具,加強對策略的部署、執(zhí)行等環(huán)節(jié)的控制,并通過一定的指標進行度量。
1. 策略的維護及發(fā)布
功能介紹:將制定的備份策略表導入工具,并提供編輯(增刪改)、查詢、篩選及導出等功能;同時可作為官方工具,將備份策略在數(shù)據(jù)中心范圍內(nèi)發(fā)布。該功能將便于管理人員從整體上把握備份策略,同時為后續(xù)的功能提供基礎數(shù)據(jù)。
2. 策略部署情況自動檢查
功能介紹:自動檢查備份策略在NBU中的部署是否正確,并列出部署錯誤的策略。檢查項目包括是否已部署、服務器IP、備份內(nèi)容、備份時間窗口、備份頻率及保存周期等。
實現(xiàn)方法:通過自定義腳本,定期(如每日)導出NBU中的策略部署信息,與備份策略表進行比對。需要指出的是,兩組數(shù)據(jù)格式上可能有差異,在比對時需要先進行轉換。比如備份策略表中的備份周期是“每日備份”,則NBU中部署為“每月1日、每月2日...每月31日”。
3. 策略執(zhí)行出錯分析
功能介紹:自動生成執(zhí)行出錯策略清單,并提供接口供操作人員錄入后續(xù)處理信息。
實現(xiàn)方法:通過自定義腳本,定期(如每小時)導出NBU 中的策略執(zhí)行日志,并根據(jù)本文前面介紹的方法進行分析。
4. 策略執(zhí)行情況統(tǒng)計
功能介紹:匯總所有備份策略的執(zhí)行情況(包括執(zhí)行時間、備份數(shù)據(jù)量、執(zhí)行出錯信息等),以便進行統(tǒng)計分析,發(fā)現(xiàn)問題隱患。
實現(xiàn)方法:通過對NBU 策略執(zhí)行日志的分析,記錄返回碼、數(shù)據(jù)量、執(zhí)行時間等要素,按照表5 格式生成報表。
表5 備份策略執(zhí)行情況報表設計
5. 備份情況指標設計
(1)備份策略執(zhí)行準確率。該指標用于評價備份策略執(zhí)行的準確性,其基礎數(shù)據(jù)來自備份策略執(zhí)行情況報表,計算方法為:備份策略執(zhí)行準確率=(計劃執(zhí)行的備份策略總數(shù)-執(zhí)行出錯的備份策略數(shù))/計劃執(zhí)行的備份策略總數(shù)。
備份策略執(zhí)行準確率越高,需要后續(xù)人工處理的工作量就越小,備份工作的自動化程度也就越高。要提高該指標,一方面需要確保備份策略部署的合規(guī)性;另一方面需要通過對歷史出錯情況的深入分析,對系統(tǒng)、網(wǎng)絡等環(huán)境進行優(yōu)化。
(2)備份數(shù)據(jù)恢復準確率。該指標用于評價已備份數(shù)據(jù)在后續(xù)使用(即數(shù)據(jù)恢復)時的有效性,其基礎數(shù)據(jù)來自于備份數(shù)據(jù)的恢復驗證結果,計算方法為:備份數(shù)據(jù)使用正確率=(數(shù)據(jù)恢復總次數(shù)-無法正常恢復的次數(shù))/數(shù)據(jù)恢復總次數(shù)。
備份數(shù)據(jù)恢復正確率從事后驗證的角度綜合反映了備份管理的工作水平,它不僅體現(xiàn)了備份策略的執(zhí)行結果,也與備份介質的保管情況密切相關。但由于是抽樣指標,其可靠程度依賴于樣本總容量(即數(shù)據(jù)恢復總次數(shù))的大小。
轉載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:大型數(shù)據(jù)中心數(shù)據(jù)備份管理的方法與實踐
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112152502.html