隨著信息化的飛速發(fā)展,信息系統(tǒng)已成為支撐企業(yè)運作不可缺少的一部分,在企業(yè)內(nèi)部建立了各種信息系統(tǒng),如ERP系統(tǒng)、生產(chǎn)執(zhí)行系統(tǒng)、辦公自動化等系統(tǒng)。信息系統(tǒng)在給企業(yè)帶來便利的同時,也隱含著風險,一旦信息系統(tǒng)出現(xiàn)問題,可能將導致企業(yè)無法進行日常的業(yè)務運營,因此保障信息系統(tǒng)的正常穩(wěn)定運行顯得越來愈重要,但傳統(tǒng)以人工為主的運維管理已不能滿足企業(yè)全面管理信息系統(tǒng)的要求,缺乏有效的運維管理已成為影響信息系統(tǒng)應用效果的主要瓶頸。
對于如何進行有效的IT運維管理,很多企業(yè)和政府部門進行了長期的探索和實踐,逐漸形成了一套IT運維管理方法論—IT服務管理(IT Service Management)。IT服務管理是以流程為導向,通過整合IT服務和業(yè)務需求,提高IT服務水平,讓信息化資源發(fā)揮更大的效能。在IT服務管理領域中,ITIL (IT Infrastructure Library, IT基礎架構庫)已成為事實上的行業(yè)標準,它是從大量企業(yè)的IT服務管理經(jīng)驗中總結出來的最佳實踐,將ITIL引入運維管理中,可以使企業(yè)在建立IT運維管理制度和流程的過程中充分吸取前人的成功經(jīng)驗,對改善企業(yè)運維質(zhì)量具有很好的借鑒意義。
1、IT運維管理現(xiàn)狀
目前,信息技術在企業(yè)中的應用得到了前所未有的重視,但是長期持續(xù)建設的慣性使企業(yè)普遍存在“重建設、輕運維”,“重技術、輕流程”等問題,導致對IT運維工作投入不足,缺乏規(guī)范化的運維管理流程。其實從信息系統(tǒng)的整個生命周期來看,實施建設只占其生命周期的20%,而其余80%的時間都是對其進行運行維護,所以運維階段是IT生命周期中的關鍵階段,如果IT的運維管理做的不好,那么這些花費大筆投資建立起來的系統(tǒng)將無法帶來預期的效益。
由于缺乏規(guī)范的運維管理體系,導致企業(yè)普通存在以下問題:
(1)運維人員就像救火隊員一樣,處于被動的服務狀態(tài),只有當問題已經(jīng)發(fā)生后,才進行緊急處理,不能預防問題的發(fā)生。
(2)缺乏統(tǒng)一的服務臺,用戶請求隨意性大,直接找有經(jīng)驗的信息人員,導致能干的人員成天處理無價值的瑣碎事情,價值無法有效體現(xiàn)。
(3)缺乏規(guī)范的運維制度和流程。在處理問題時,沒有對問題進行記錄和分類,導致無法跟蹤和監(jiān)控問題的處理情況。
(4) IT運維的相關經(jīng)驗沒有積累和共享。由于缺乏對運維過程的記錄,使得問題的處理方法只有當時的維護人員掌握,相關經(jīng)驗難以積累和共享。
(5)運維人員績效無法量化。在運維工作中沒有建立量化的考核指標,IT運維質(zhì)量和運維人員的績效無法量化,使得運維人員的工作積極性得不到提高。
因此實現(xiàn)運維管理從傳統(tǒng)被動式服務轉(zhuǎn)變?yōu)橹鲃宇A防服務,以流程貫穿整個運維管理過程,實現(xiàn)運維管理的標準化、規(guī)范化和流程化是目前企業(yè)信息化建設急需解決的問題。
2、ITIL體系框架概述
在20世紀80年代中期,英國政府為了提高政府部門IT服務的質(zhì)量,啟動了一個項目來開發(fā)一套規(guī)范化的、可進行財務計量的IT資源使用方法,該項目的最終成果就是ITIL V1.0版本。ITIL確定了以流程為中心的IT服務管理方法,并定義了各個流程之間的相互關系,使人們對IT服務管理統(tǒng)一了思想、認清了方向。在2007年,ITIL V3正式發(fā)布,它融入了IT服務管理領域當前的最佳實踐,并首次引入了生命周期的概念,通過PDCA模型( Plan-Do-Check-Act ),可以持續(xù)不斷地循環(huán)改進IT服務,從而保證IT比持續(xù)的生命活力。
ITIL V3框架如圖1所示,它主要包括五個核心模塊:
(1)服務戰(zhàn)略。該模塊為制定IT服務管理的政策和指南提供指導,保證IT服務戰(zhàn)略與業(yè)務相一致。主要包括服務戰(zhàn)略制定、服務投資組合管理、服務財務管理和需求管理等流程。
(2)服務設計。該模塊為制定IT服務管理制度和流程等方面提供指導,幫助用戶設計出合適的IT服務解決方案及流程。主要包括服務目錄管理、服務級別管理、可用性管理、持續(xù)性管理和安全管理等流程。
(3)服務轉(zhuǎn)換。該模塊為新增的或修改的IT服務轉(zhuǎn)換到實際應用中提供指導。主要包括配置與資產(chǎn)管理、發(fā)布與部署管理、變更管理、知識管理和服務檢驗與測試等流程。
(4)服務運營。該模塊為如何達到IT服務支持和交付的效果和效率,保持服務運營穩(wěn)定性提供指導。主要包括事件管理、服務臺、問題管理、技術管理、應用管理和訪問管理等流程。
(5)持續(xù)服務改進。根據(jù)業(yè)務需求持續(xù)改進和提高IT服務生命周期中的每個階段,使得IT服務能不斷與業(yè)務需求的變化相適應。
ITIL V3通過服務設計、服務轉(zhuǎn)換和服務運營的實施,并借助持續(xù)服務改進不斷完善整個過程,使I下服務管理過程整合為一個良性循環(huán)的整體。
3、運維管理流程體系設計
根據(jù)目前IT運維工作情況及存在的問題,本文在ITIL理論的指導之下,設計了IT運維管理的主要流程,流程如圖2所示。
下面針對以上流程進行詳細介紹。
(1)事件管理流程。事件是指可能引起或已經(jīng)引起IT服務中斷或服務質(zhì)量下降的活動,事件管理的目的就是盡可能在最短時間內(nèi)解決故障,減少事件對業(yè)務運作的影響。該流程首先是新建事件,在運維平臺中,新建事件有兩個來源:
一是當用戶發(fā)現(xiàn)信息系統(tǒng)故障,通過電話或者郵件通知服務臺,由服務臺人員在系統(tǒng)中手動創(chuàng)建事件;
二是當監(jiān)控平臺通過監(jiān)視工具發(fā)現(xiàn)性能指標超過閉值時,系統(tǒng)會自動創(chuàng)建事件。在創(chuàng)建事件時,服務臺人員根據(jù)事件信息進行事件的分類以及設定優(yōu)先級,同時系統(tǒng)會自動從運維知識庫里搜尋該事件的解決方案,為服務臺人員處理事件提供參考。如果服務臺可以處理該事件,就直接答復用戶,否則將該事件指派給相關運維人員。當運維人員接收到該事件,對事件進行分析和處理,并將解決方案反饋給服務臺。服務臺向用戶確定事件的處理效果,并填寫用戶反饋意見,當故障已解決,則關閉該事件。整個事件的處理過程都記錄在事件問題庫中,方便用戶進行查詢和統(tǒng)計分析,并根據(jù)情況,將解決方案記錄到運維知識庫中,實現(xiàn)知識的積累和共享,為以后處理同類事件提供參考。
(2)問題管理流程。問題管理的目的是找出并消除引起事件的根本原因,從而避免事件再次發(fā)生。該流程首先是對事件進行分析,將之前重復發(fā)生過的或者非常嚴重的事件升級為問題,根據(jù)問題信息進行分類以及設定優(yōu)先級。然后將問題指派給相應的專家組,由專家組對問題進行分析并找出問題的根源,從而提出相應的解決方案,然后由技術總監(jiān)對解決方案進行審批,審批通過后,進行解決方案的實施,必要時觸發(fā)變更管理流程。當實施結束后,對實施效果進行評審,評審通過后,關閉問題并將問題的處理過程記錄到問題事件庫中,同時根據(jù)情況,將解決方案記錄到運維知識庫中,為以后處理同類問題提供參考。
(3)變更管理流程。該流程首先是新建變更請求,新建變更請求有兩個來源:一是為了解決系統(tǒng)問題;二是為了適應業(yè)務的變化。在創(chuàng)建變更時,根據(jù)變更情況進行分類以及設定優(yōu)先級。然后將變更指派給相應的專家組,由專家組對變更進行綜合分析,明確變更的風險及其影響,并制定詳細的變更方案及計劃。變更經(jīng)理對變更方案進行審批,審批通過后,按照變更計劃實施變更,同時觸發(fā)發(fā)布管理流程。當完成變更實施后,由變更管理小組對實施情況進行評審,如果成功,則關閉變更請求,并出具變更總結報告,反之,修改變更方案重新實施變更。
(4)發(fā)布管理流程。由變更管理觸發(fā)生成發(fā)布請求,根據(jù)發(fā)布請求制定發(fā)布方案以及計劃,明確發(fā)布的內(nèi)容、角色職資分配、發(fā)布日期等。根據(jù)變更實施情況組織用戶進行培訓和測試,確保變更和發(fā)布的成功。當測試通過后,確定軟硬件版本并進行安裝,同時觸發(fā)配置管理流程,更新配置信息。
(5)配置管理流程。配置管理是將IT環(huán)境中所有配置項(硬件、軟件等)的信息以及配置項之間的關系記錄到配置管理數(shù)據(jù)庫中,從而為其他流程的處理提供軟硬件的詳細配置信息。發(fā)布管理會觸發(fā)生成配置請求根據(jù)配置請求確定配置的范圍并制訂配置計劃,識別本次更新的配置項,并將配置項的詳細信息以及配置項之間的關系記錄到配置管理庫中,并定期對配置管理庫進行審驗,保證其配置信息能真實反映實際的情況。
4、實施策略
IT運維管理流程體系涉及到多個相互獨立又彼此關聯(lián)的管理流程,它的實施是一個長期而艱巨的任務,不但要面對各種各樣的技術難題,更重要的是將ITIL的思想與企業(yè)文化相融合,因此ITIL的應用實際是一個管理變革活動,在變革過程中,會涉及到人員的職能、思維模式、工作方式等的轉(zhuǎn)換,容易產(chǎn)生的誤解和消極的態(tài)度。其次,ITIL作為信息部門內(nèi)部管理的流程,存在許多與現(xiàn)有的應用管理系統(tǒng)以及外部系統(tǒng)及流程的接口整合銜接的問題,需要在流程設計和自動化等環(huán)節(jié)逐步解決。
基于以上原因,運維管理流程體系的建設不是一次性就能夠全部實現(xiàn)的,需要逐步實施和優(yōu)化,本文通過對這一課題的研究,提出分階段實施的策略,具體如下:
第一階段:咨詢評估階段。該階段主要工作是通過對企業(yè)的IT建設和運維管理現(xiàn)狀進行調(diào)查研究,評估企業(yè)當前的IT服務成熟度,找出運維管理存在的問題和不足,制定運維管理建設的總體目標、功能需求和實施計劃等。
第二階段:建設實施階段。在前期咨詢評估的成果上,建設基于ITIL理念的IT運維管理系統(tǒng),通過系統(tǒng)的建設,固化運維管理流程,本階段主要實施ITIL中最核心的運維流程,包括服務臺、服務目錄、事件管理、問題管理、配置管理和知識管理等。
第三階段:推廣提高階段。在第二階段的基礎上,對運維流程體系進一步的深化和改進,主要實現(xiàn)變更管理、發(fā)布管理、服務級別管理、能力管理、可用性管理、監(jiān)控系統(tǒng)的集成,運維KPI指標的制定。
第四階段:持續(xù)改進階段。因為IT運維管理是一個不斷持續(xù)滿足用戶需求和期望的過程,所以IT運維管理體系的建設應該是一個不斷持續(xù)改進的過程,整個過程包括計劃(Plan )、執(zhí)行(Do)、檢查(Check)和行動(Action) 4個階段(PDCA),并按此順序不斷循環(huán)改進,通過PDCA的管理思想,定期地對運維流程進行分析,提出優(yōu)化和改進建議,使運維流程隨著組織內(nèi)外部環(huán)境的不斷變化而改進,保障運維流程動杰滿足企業(yè)的中冬目標。
5、總結
本文首先對目前企業(yè)的IT運維工作狀況進行了分析,歸納出目前存在的主要問題,然后基于對IT比最佳實踐的研究基礎上,設計了一套基于ITIL的運維管理流程,并提出了IT運維管理分階段實施的策略,使運維管理從傳統(tǒng)的單一、被動和低效的管理方式逐步轉(zhuǎn)變?yōu)榻y(tǒng)一、主動和高效的管理模式,提升IT運維管理水平。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:IT運維管理流程體系設計與實踐
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112153942.html