IT服務(wù)管理的質(zhì)量直接影響業(yè)務(wù)的質(zhì)量,進而影響企業(yè)的市場聲譽和客戶滿意度。信息技術(shù)基礎(chǔ)架構(gòu)庫(IT Infrastructure Library, ITIL)為企業(yè)的IT服務(wù)管理實踐提供了一個嚴(yán)謹(jǐn)、客觀、可量化的標(biāo)準(zhǔn)和規(guī)范,是一套以流程為導(dǎo)向、以客戶為中心的管理方法,對IT基礎(chǔ)架構(gòu)進行全面而集中的管理,以確保企業(yè)業(yè)務(wù)的平穩(wěn)、高效運營。企業(yè)的IT部門可參考ITIL制定其IT服務(wù)管理流程,從而確保企業(yè)能夠高效地實現(xiàn)IT服務(wù)管理,為企業(yè)的運作提供更好的支持。
基于ITIL的IT服務(wù)管理由服務(wù)臺、事件管理、問題管理、變更管理、配置管理、發(fā)布管理、服務(wù)級別管理組成,事件管理是整個支持系統(tǒng)中的首要環(huán)節(jié),具有應(yīng)用廣、重要性大的特點。目前,我國實施IT服務(wù)管理的企業(yè)中絕大部分已執(zhí)行了事件管理流程。事件管理往往以快速解決表征現(xiàn)象為目的,而不在于查找根本原因,因此,時效性成為評價企業(yè)事件管理水平的重要標(biāo)志。
事件管理是IT服務(wù)管理中的一個核心流程,提升事件管理時效性、回歸事件管理本身屬性,可以提高IT服務(wù)的質(zhì)量,有效改變目前我國企業(yè)普遍存在的重開發(fā)、輕運維的現(xiàn)象,真正踐行以服務(wù)為導(dǎo)向的ITIL理念,通過切實有效的IT服務(wù)管理為企業(yè)創(chuàng)造價值。
一、事件管理的目的
事件是指引起或可能引起服務(wù)中斷和服務(wù)質(zhì)量下降的事件,也可以是一種為個人提供特殊服務(wù)的請求。事件管理是負責(zé)解決IT服務(wù)過程中的突發(fā)事件、問題以及客戶需求等內(nèi)容的運維管理。事件管理中的事件是一個廣義的概念,不是狹義的故障,它可能是軟件、硬件問題,也可能是服務(wù)需求事件。
目前,很多公司IT運維管理部門沒有建立事件處理的優(yōu)先級和解決時限關(guān)聯(lián),不能保障事件解決的實效性和IT資源的有效利用,事件發(fā)生后沒有明確而唯一的責(zé)任人,缺乏有效的對事件監(jiān)控和跟蹤的機制,沒有統(tǒng)一的IT服務(wù)管理應(yīng)對事件受理的界面、完整的記錄和及時反饋,缺乏事件監(jiān)控和診斷等技術(shù)工具,事件不能在技術(shù)工具的支持下得到主動、快速處理。IT人員工作被動,只能像救火隊一樣,不知道什么時候、什么地方會出現(xiàn)“火”情,只有當(dāng)事件發(fā)生并且已造成業(yè)務(wù)影響時才能發(fā)現(xiàn)和著手處理。這種被動“救火”不但使IT服務(wù)人員終日忙碌,也使IT服務(wù)本身質(zhì)量很難提高,導(dǎo)致IT和業(yè)務(wù)部門的滿意度都不高。因此,將IT服務(wù)管理的理念和方法應(yīng)用到企業(yè)信息技術(shù)的服務(wù)管理中,是確保企業(yè)IT工作發(fā)揮效益的重要舉措。企業(yè)在實施IT服務(wù)管理的過程中采取的方式和進程并不相同,有的全盤開展ITIL所有流程,有的僅從建立服務(wù)臺開始,循序漸進。事件管理流程是服務(wù)支持中的第一項流程,是在IT系統(tǒng)遇到問題之后,解決問題的第一個環(huán)節(jié),與其他流程相比,它的應(yīng)用最廣、重要性最大。
事件管理的目標(biāo)就是對組織及用戶在盡可能小的影響情況下,使IT系統(tǒng)盡快恢復(fù)到服務(wù)級別協(xié)議所定義的服務(wù)級別,以確保最好的服務(wù)質(zhì)量和可用性級別。也就是說,迅速解決問題,將不利影響降到最低,提高追蹤和事件升級的效率,更好地控制整個管理過程。為了實現(xiàn)這個目的,事件管理流程必須最佳地利用資源支持業(yè)務(wù)、開發(fā)和維護有效的事件記錄以及設(shè)計和應(yīng)用統(tǒng)一的事件報告方法。事件管理側(cè)重于恢復(fù)服務(wù),為了能夠有效地解決問題,事件管理還必須對不同的事件進行分類和排隊,分類就是要分成不同的優(yōu)先級,排隊就是要識別它們。因此,事件管理的主要活動有兩個,一是對事件進行優(yōu)先級分類;二是記錄事件,把記錄下來的內(nèi)容形成一個資源庫,為將來分析挖掘知識儲備資源。
事件管理的主要任務(wù)是及時識別并跟蹤發(fā)生的事件;對事件進行分類并提供初步支持;對事件進行調(diào)查分析,識別引發(fā)事件的潛在原因;解決事件并恢復(fù)服務(wù);跟蹤和監(jiān)督所有事件的解決過程,并隨時進行溝通。因此,研究事件管理對解決目前IT運維中存在的服務(wù)問題具有重要的意義,事件管理的時效性將直接影響整個企業(yè)的IT服務(wù)質(zhì)量和整體運營狀況。
二、事件管理的基本流程
事件管理流程大概如下:當(dāng)一個事件輸入的時候,首先要對事件進行檢查、定位。檢查事件的時候要與它不斷交互,明確它的影響范圍和緊急程度,還要進行初步的歸類評估。服務(wù)臺(ServiceDesk)是事件的唯一入口,它接收事件后,操作人員通過查閱CMDB〔配置管理數(shù)據(jù)庫)進行處理。具體流程如圖1所示。
圖1事件管理的基本流程
1.事件的查明和記錄
服務(wù)臺記錄一些標(biāo)識客戶的基本信息,如姓名、工作地點、電話號碼等,而事件管理記錄詳細的事件信息,如事件發(fā)生的時間、受事件影響的服務(wù)等。這樣做的目的是便于確認(rèn)事件的影響,問題管理可以根據(jù)這些信息查找事件原因,密切跟蹤事件進展。
首先,當(dāng)用戶、服務(wù)臺工作人員或其他IT部門人員發(fā)現(xiàn)或系統(tǒng)檢測到某系統(tǒng)發(fā)生事件時,就將其報告給服務(wù)臺,服務(wù)臺將基本信息輸入事件數(shù)據(jù)庫并報告給事件管理人員。通常所有的事件都是先報告給服務(wù)臺,再由服務(wù)臺工作人員將其輸入事件數(shù)據(jù)庫,服務(wù)支持小組是不允許直接記錄事件的。
其次,事件管理人員給事件一個唯一的編號(事件單號),記錄一些基本的事件分析信息(時間、癥狀、位置、用戶、受影響服務(wù)、硬件等),并補充其他的事件信息(與用戶的交互信息和配置管理數(shù)據(jù)庫等。
再次,事件管理人員根據(jù)服務(wù)臺提供的信息和事件數(shù)據(jù)庫信息判斷此類事件是否與已有的事件相同或類似,如果有就更新事件信息或建立原事件的從屬記錄,并在必要時修改原事件的影響度和優(yōu)先級,如果沒有則創(chuàng)建新事件記錄。最后,事件管理需要判斷事件是否嚴(yán)重,如果嚴(yán)重就先向管理層報告并告知用戶有關(guān)情況,再采取進一步行動,如果不嚴(yán)重就直接進入下一步的事件初步歸類和支持。
2.初步歸類和初步支持
經(jīng)過第一步的事件查明和記錄,可從用戶處獲取的事件信息基本上已得到,事件管理數(shù)據(jù)庫已經(jīng)根據(jù)這些信息進行更新,接下來就是事件的初步歸類和初步支持。這里強調(diào)初步,就是為了能夠盡可能快地恢復(fù)用戶的正常工作,盡量避免或者減少事件對IT服務(wù)質(zhì)量的影響。
歸類的目的是發(fā)現(xiàn)事件原因以便采取相應(yīng)行動。一般來說,許多事件是重復(fù)出現(xiàn)的,因此,當(dāng)某個事件再次出現(xiàn)時,只需要根據(jù)已有的經(jīng)驗和措施采取行動即可:,當(dāng)新的事件出現(xiàn)時,就有一個與其問題和知名錯誤(知識庫)相匹配的過程,如果匹配成功就可直接用已有的方案將其解決,而不需要進一步調(diào)查,否則就要繼續(xù)進行下面提到的其他幾個步驟。
服務(wù)臺如果沒有成功解決事件,就將事件轉(zhuǎn)交給二線、三線支持處理,然后負責(zé)記錄事件并聯(lián)系各支持小組,采取必要的措施以確保用戶滿意。如果碰到未出現(xiàn)過的事件或事件解決過程非常復(fù)雜,就必須對事件進行調(diào)查和分析。
3.事件調(diào)查和分析
事件在第一階段和第二階段沒有圓滿解決時,專家支持小組應(yīng)介入處理過程,對其進行調(diào)查和分析。
一旦事件被分派給某個支持小組,他們應(yīng)當(dāng)完成以下工作:確認(rèn)接收事件處理任務(wù),同時指定有關(guān)日期和時間以保障正常更新事件狀態(tài)和歷史信息,經(jīng)過服務(wù)臺及時通知客戶事件最新進展,說明事件當(dāng)前所處的狀態(tài);盡可能快地把發(fā)現(xiàn)的權(quán)宜措施提供給服務(wù)臺和客戶;參考知名錯誤、問題、解決方案、計劃的變更和知識庫等對事件進行評審;必要時要求服務(wù)臺根據(jù)協(xié)議的服務(wù)級別,重新評價事件影響度和優(yōu)先級,并在必要時對其進行調(diào)整;記錄所有相關(guān)信息,包括解決方案、新增的或修改的分類;將所有相關(guān)事件的更新、花費的時間以及處理結(jié)果反饋給服務(wù)臺以讓其終止此類事件。
4.解決事件和恢復(fù)服務(wù)
在分析和調(diào)查事件后,支持小組根據(jù)更新的事件信息,提議的權(quán)益措施和解決方案以及有關(guān)的變更請求,解決事件并恢復(fù)服務(wù),同時更新有關(guān)事件信息
5.事件終止
解決事件和恢復(fù)服務(wù)后,事件到達終止階段。這個階段輸入的是上一階段更新后的事件記錄和已解決的事件,采取的行動主要是和客戶一起確認(rèn)事件解決是否成功,輸出的結(jié)果為更新的事件信息和事件記錄。在事件解決后,服務(wù)臺應(yīng)該確保以下內(nèi)容:有關(guān)用于解決事件的行動的信息是準(zhǔn)確的、易懂的;根據(jù)事件產(chǎn)生的根本原因?qū)ζ錃w類;客戶同意事件解決方案和方案的執(zhí)行及最終結(jié)果;詳細記錄事件控制階段的所有相關(guān)信息,如客戶是否滿意和滿意度如何,處理事件所花費的時間,事件終止的日期和時間。
6.事件處理過程的跟蹤和監(jiān)督
服務(wù)臺負責(zé)跟蹤和監(jiān)督所有事件的解決過程。在這個過程當(dāng)中,服務(wù)臺要做到以下兒點:監(jiān)督事件狀態(tài)和事件處理最新進展及其影響服務(wù)級別的狀況;特別注意事件處理責(zé)任在不同專家支持小組間的轉(zhuǎn)移,因為轉(zhuǎn)移往往因支持人員的責(zé)任不明確而發(fā)生拖延;更多注意高影響度的事件;及時通知受影響的用戶關(guān)于事件處理的最新進展;檢查相似的事件,有助于保障每個事件在規(guī)定的或者最短的時間內(nèi)得到解決。我們在實際工作中還要盡量避免支持人員把過多的時間用于調(diào)查和分析而忽視用戶比較急切的需求.即本文后面將提出的事件管理問題化現(xiàn)象。
三、提高事件管理時效性的措施
根據(jù)事件管理的基本流程,可以從流程的每個銜接環(huán)節(jié)入手,主動管理,提高事件管理時效性,具體措施如下。
1.減少進入事件管理流程的事件數(shù)量
服務(wù)臺作為IT服務(wù)管理的一個基本流程,包括呼叫中心(Call-center)和幫助臺(Helpdesk)以及郵件系統(tǒng)等,其主要職能是受理客戶需求,記錄并跟蹤事件、向客戶反饋其服務(wù)需求以及事件的進展情況,根據(jù)服務(wù)級別協(xié)議對客服需求做出初步評估,盡力解決或?qū)⑵浒才沤o有關(guān)人員解決等。服務(wù)臺是服務(wù)提供方和日常聯(lián)絡(luò)處,一般作為事件的一線部門,負責(zé)報告事件和處理服務(wù)需求,同事件管理流程聯(lián)系最為緊密。服務(wù)臺要跟蹤和記錄各種事件,并負責(zé)協(xié)調(diào)二線、三線支持小組處理和解決事故。服務(wù)臺應(yīng)利用既有資源,通過匹配知識庫等方法努力解決所受理的事件,提高事件的一線解決率,減少進入事件管理流程的事件數(shù)量,減少事件的不必要流轉(zhuǎn),提高事件管理的時效性,從而提升事件管理效率。
2.準(zhǔn)確評定事件級別,提高事件的解決效率
在日常企業(yè)IT運維過程中,有時必須同時處理數(shù)個事件,但受時間、人力、物力等條件的限制,必須對事件處理順序進行排列。這里就必須對事件進行分級,通?梢园凑帐苡绊懙挠脩魯(shù)、系統(tǒng)數(shù)以及事件的嚴(yán)重性等因素來確定事件的影響程度和緊急程度,然后根據(jù)影響程度和緊急程度來確定事件級別(見圖2),事件級別是根據(jù)事件影響程度和緊急程度而制定的處理事件的先后順序。
首先,事件管理部門可以根據(jù)事件級別的不同,優(yōu)先處理高級別事件,減小其對業(yè)務(wù)的影響,避免客戶投訴等問題。
其次,可以根據(jù)事件級別的不同,針對不同級別事件建立具體的時效性指標(biāo),要求二、三線支持部門在指定時間內(nèi)完成事件的處理,并及時向客戶反饋處理結(jié)果,確保事件解決。對于服務(wù)已恢復(fù)、原因無法確定的事件應(yīng)及時轉(zhuǎn)至問題管理流程處理。
3.監(jiān)控事件處理過程,適時進行事件升級管理
服務(wù)臺可以成立一個專門的事件監(jiān)控小組,承擔(dān)跟蹤和監(jiān)控事件處理過程的工作。當(dāng)事件處理進展不盡如人意時,服務(wù)臺可以根據(jù)已經(jīng)定義好的升級程序進行事件升級。
圖2事件級別確定途徑
事件升級是指一線處理部門(服務(wù)臺)在規(guī)定時間內(nèi)不能解決或沒有解決某個事件時,將事件轉(zhuǎn)二線、三線支持部門處理。事件升級是根據(jù)上文提到的事件級別和事件解決時間確定的,事件升級具體過程如圖3所示。
4.避免事件管理問題化
企業(yè)在事件管理過程中通常會出現(xiàn)的一個誤區(qū)是未能分清事件管理同問題管理的區(qū)別,在處理事件過程中注重事件具體原因和解決力、法,未將恢復(fù)因此中斷的服務(wù)放在事件管理的首位,將事件管理問題化。
問題管理的主要目標(biāo)是要查明事件發(fā)生的潛在原因并找到解決此事件的方法或防止其再次發(fā)生的措施,而事件管理的主要目標(biāo)是在事件發(fā)生后盡可能快地恢復(fù)客戶服務(wù),可能采取的是一些應(yīng)急措施而不是永久的解決方案。事件管理強調(diào)速度,而問題管理強調(diào)質(zhì)量,把速度放在第二位。為了發(fā)現(xiàn)事件原因和防止事件再次發(fā)生,問題管理可能需要花費更多時間解決事故且可能推遲恢復(fù)服務(wù)。
5.不斷推動事件管理工具建設(shè)事件管理依賴于知識庫的建立
維護和相關(guān)管理工具的支持,在事件處理過程中,應(yīng)盡可能發(fā)揮工具的作用,根據(jù)事件管理工作需要推動開發(fā)部門開發(fā)相關(guān)工具,將事件的跟蹤管理工作自動化,提高事件處理效率。例如,對于停留在單個支持部門時間過長的事件,可以根據(jù)事先制定好的時間闌值對該部門事件處理人員自動發(fā)出提醒,要求其盡快處理相關(guān)事件,借此提高各個部門事件處理的時效性。
6.建立健全事件管理制度,規(guī)范事件管理流程
各個企業(yè)在開展IT服務(wù)管理過程中,應(yīng)重視自身的制度建設(shè),完善制度中不合理的內(nèi)容。提高事件管理的時效性,在一定程度上依賴于事件管理制度的建立和健全,通過制度約束規(guī)范企業(yè)事件管理流程,樹立事件管理時效性意識,從而更好地為業(yè)務(wù)部門提供IT服務(wù)。
圖3事件升級過程
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:基于ITIL的事件管理時效性初探
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083934606.html