交通銀行數(shù)據(jù)中心管理范圍覆蓋生產(chǎn)環(huán)境、測試環(huán)境、同城及異地災(zāi)備環(huán)境。隨著業(yè)務(wù)的發(fā)展,IT規(guī)模不斷擴張,以生產(chǎn)系統(tǒng)小型機分區(qū)為例,分區(qū)數(shù)從2006 年的300 多個增加到現(xiàn)在3000 多個,而人員的增長遠遠跟不上服務(wù)器數(shù)量的增長。采用傳統(tǒng)的依靠人員擴張的方式難以滿足快速交付和生產(chǎn)穩(wěn)定運行的要求。
為此,交行數(shù)據(jù)中心提出了走“規(guī)范化、流程化和自動化道路”的發(fā)展策略。從數(shù)據(jù)中心成立伊始就采用自動化技術(shù),降低人力資源成本。2005 年,交行數(shù)據(jù)中心在數(shù)據(jù)大集中之后就實現(xiàn)了批處理作業(yè)和版本發(fā)布的自動化。2008 年開始,建立了自動化運維平臺,實現(xiàn)了開放平臺日常運維工作的自動化,大大提高了運維效率,使得人員從日常繁重的運維工作中解脫出來,投入生產(chǎn)的預(yù)防性工作中。2011年,隨著
云計算技術(shù)的興起,交行進一步引入云計算的理念,建立了生產(chǎn)運維云服務(wù)平臺,將原來任務(wù)級的自動化提升到服務(wù)級。從IT 云服務(wù)的角度實現(xiàn)了資源配置管理和日常運維管理的“云化”,在生產(chǎn)運維中發(fā)揮了重要作用。
生產(chǎn)運維服務(wù)云的建設(shè)過程
自2009 年開始,交通銀行數(shù)據(jù)中心啟動了運維云服務(wù)平臺的建設(shè)工作。如何借助“云”的力量,全面提升運維管理能力,這需要從本質(zhì)上去理解“云”的概念;趯I(yè)界云計算概念、技術(shù)和相關(guān)實踐的深入研究及理解,交通銀行數(shù)據(jù)中心在國內(nèi)首次提出了“運維流程即服務(wù)”的概念。并在此基礎(chǔ)上開展了運維云服務(wù)平臺的研究及建設(shè)工作,對運維“云”建設(shè)進行了長期持續(xù)發(fā)展的規(guī)劃,目的是將云計算技術(shù)應(yīng)用于生產(chǎn)運維。
在云服務(wù)平臺中,對云計算技術(shù)的實踐側(cè)重在兩個方面,包括在底層建設(shè)基礎(chǔ)設(shè)施云(PaaS)、在上層建立生產(chǎn)運維服務(wù)云(BaaS),以達到有效提高資源利用率,全面提升系統(tǒng)運維管理能力的目的。
1.基礎(chǔ)設(shè)施“云化”。交行數(shù)據(jù)中心運維管理范圍包括生產(chǎn)環(huán)境和大量的測試環(huán)境,以及不直接面對客戶的輔助
生產(chǎn)管理系統(tǒng)等。硬件設(shè)備規(guī)模龐大,資源管理復(fù)雜,為了提高效率,實現(xiàn)資源配置和管理的規(guī)范化和流程化。
我們在運維云服務(wù)平臺中實現(xiàn)了虛擬資源池管理功能。通過推廣底層基礎(chǔ)架構(gòu)的標(biāo)準(zhǔn)化、虛擬化,構(gòu)建硬件資源虛擬化資源池,以及結(jié)合應(yīng)用系統(tǒng)的運行情況,實現(xiàn)分配、交付、監(jiān)控、動態(tài)調(diào)配、回收等一系列資源池管理功能,使得數(shù)據(jù)中心部分基礎(chǔ)設(shè)施環(huán)境,成為按需獲取、快速交付、可動態(tài)調(diào)整的計算資源。資源池的劃分和分配可以通過云平臺集中管理,實現(xiàn)了基礎(chǔ)設(shè)施的“云化”。
2.生產(chǎn)運維“云化”。交行數(shù)據(jù)中心根據(jù)系統(tǒng)日常運維管理的需要,從服務(wù)自動化的角度梳理運維云服務(wù)目錄,將新系統(tǒng)安裝配置、災(zāi)備切換(SANBOOT)、基礎(chǔ)架構(gòu)資源劃分、健康檢查、版本升級、系統(tǒng)備份、資源調(diào)整等日常運維工作“云化”為可以隨時獲取的服務(wù)。將各類運維工具提供的功能看成運維服務(wù)的“資源池”,標(biāo)準(zhǔn)化并全面整合現(xiàn)有的各類系統(tǒng)運維流程,將手工或已利用各類運維工具的自動化操作進行全面整合,實現(xiàn)全面的系統(tǒng)運維流程服務(wù)自動化。集中管理、按需提供,實現(xiàn)運維服務(wù)自動化;提供統(tǒng)一視圖,服務(wù)過程可視、可控、可計量;側(cè)重運維流程服務(wù)自動化,確保生產(chǎn)環(huán)境相關(guān)管理及規(guī)范,以滿足生產(chǎn)中心在安全、ISO20000 流程、高可用等各方面要求。
生產(chǎn)運維云的實施取得了明顯的效果,改變了傳統(tǒng)的IT 系統(tǒng)安裝和交付方式。以新系統(tǒng)環(huán)境交付為例,一套新的應(yīng)用環(huán)境的安裝配置包括操作系統(tǒng)安裝、HA 高可用軟件安裝配置、中間件和數(shù)據(jù)庫系統(tǒng)安裝配置、工具軟件安裝配置、監(jiān)控部署、應(yīng)用版本發(fā)布和配置等,并需按照安全管理要求進行安全加固、賬號移交、配置信息錄入CMDB等步驟。按傳統(tǒng)方式,一套新系統(tǒng)的安裝配置需要一周時間,且存在執(zhí)行過程難跟蹤、人為因素大、規(guī)范難落實等問題。
在經(jīng)過運維服務(wù)“云化”后,系統(tǒng)管理員在受到新的需求后,通過云服務(wù)平臺提交以應(yīng)用系統(tǒng)(可跨平臺、多分區(qū))為單位的服務(wù)請求,在服務(wù)請求中包括了該應(yīng)用的系統(tǒng)架構(gòu)中各類服務(wù)器的安裝需求(及服務(wù)器的配置參數(shù)),集群配置、軟件配置等相關(guān)信息,由平臺的服務(wù)流程調(diào)度各類腳本、工具進行全自動化安裝配置,安裝完成后,平臺直接將配置信息自動化上送數(shù)據(jù)中心CMDB,并通過郵件通知系統(tǒng)管理員將賬號移交安全賬號管理平臺,整個新系統(tǒng)環(huán)境即交付使用,效率大大提高。
運維云服務(wù)在生產(chǎn)運行中的作用
交行的生產(chǎn)運維云服務(wù)提供的“一站式”端到端的運維流程服務(wù),日常運維流程效率明顯提升;同時提供快速、大規(guī)模的系統(tǒng)測試環(huán)境、生產(chǎn)環(huán)境搭建及交付,可有效保障整體工程建設(shè)進度;運維云化過程中明確了運維管理策略及技術(shù)標(biāo)準(zhǔn),是保持系統(tǒng)可用率的重要基礎(chǔ)保障;運維服務(wù)流程與運維管理需求充分結(jié)合,可保障投產(chǎn)上線后,大規(guī)模系統(tǒng)環(huán)境維護管理的有序和有效。具體影響體現(xiàn)在以下幾個方面。
1.有效提升交付能力,落實管理及技術(shù)規(guī)范。平臺投產(chǎn)后,一個新應(yīng)用的安裝周期由原來的1 周(多分區(qū))縮短至數(shù)小時,大規(guī)模并行搭建效率提升更加顯著。同時新系統(tǒng)交付云服務(wù)流程中的技術(shù)標(biāo)準(zhǔn)是根據(jù)系統(tǒng)架構(gòu)技術(shù)規(guī)范定制,可保障管理策略及技術(shù)規(guī)范的落地,確保各類環(huán)境及運維符合監(jiān)管、安全及生產(chǎn)運行要求,為保障生產(chǎn)系統(tǒng)的高可用性提供了有效支持。
2.提高日常運維管理效率。例如,原來生產(chǎn)環(huán)境數(shù)千個分區(qū)進行一次健康檢查及報告整理需要投入大量的人力工作數(shù)周時間,現(xiàn)在通過云服務(wù)平臺只需要幾個小時就可將檢查報告自動發(fā)送到維護人員的郵箱,與手工運維流程相比效率提升幾十倍。
3.提高資源利用率,降低硬件成本。通過對硬件資源的虛擬化整合及根據(jù)需要調(diào)整資源的分配,有效提升了資源利用率。按300 個應(yīng)用分區(qū)(1CPU) + 100 個DB 分區(qū)(2CPU) 估算,原來約需500CPU 及配套的內(nèi)存、板卡、存儲等資源,納入平臺虛擬化資源池進行管理后,在分配時按需動態(tài)調(diào)配資源保障相關(guān)測試環(huán)境容量,資源利用率可提高近4 倍。
4.提升生產(chǎn)系統(tǒng)的可用性。首先,運維云服務(wù)平臺實現(xiàn)了生產(chǎn)運維的自動化,大幅提高了生產(chǎn)運維的效率,使得大量的人力從繁重的系統(tǒng)安裝、大規(guī)模的系統(tǒng)健康檢查等工作中解脫出來,可以將更多的精力投入到生產(chǎn)的預(yù)防性工作中,提前消除風(fēng)險隱患。其次,健康檢查云服務(wù)使得檢查的頻率大大提高,許多潛在的問題可以通過健康檢查提前發(fā)現(xiàn),提高了生產(chǎn)系統(tǒng)的可用性。第三,云服務(wù)平臺實現(xiàn)了系統(tǒng)安裝配置的規(guī)范化,減少了個人操作的失誤,也屏蔽了技術(shù)人員水平參差不齊導(dǎo)致的生產(chǎn)問題,使得專家的經(jīng)驗可以通過規(guī)范得到推廣落地,提升了整理的生產(chǎn)運維水平,也提升了生產(chǎn)系統(tǒng)的可用性。
通過生產(chǎn)運維云服務(wù)平臺的規(guī)劃及建設(shè),交通銀行把云計算技術(shù)的應(yīng)用引入到了大型金融企業(yè)數(shù)據(jù)中心的生產(chǎn)環(huán)境中。將傳統(tǒng)IT 系統(tǒng)“煙囪”式的IT 部署改變?yōu)橘Y源池的動態(tài)分配和管理,將生產(chǎn)運維變成云計算的服務(wù),對外全面提升數(shù)據(jù)中心的交付能力和服務(wù)水平,對內(nèi)有效提高IT 資源的利用率和技術(shù)人員工作效率,在交行的生產(chǎn)運維中發(fā)揮了重要作用。
目前,交行數(shù)據(jù)中心正進一步將云計算應(yīng)用于大數(shù)據(jù)處理和分析,搭建了數(shù)據(jù)云服務(wù)平臺, 將云服務(wù)拓展到業(yè)務(wù)精準(zhǔn)營銷、交叉銷售、互聯(lián)網(wǎng)產(chǎn)品創(chuàng)新、風(fēng)險控制等領(lǐng)域,其實施將對業(yè)務(wù)的發(fā)展取到更大的促進作用。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:數(shù)據(jù)中心生產(chǎn)運維云建設(shè)與實踐
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839718975.html