所謂IT運維管理是指單位IT部門采用相關的方法、手段、技術、流程和文檔等,對IT運維環(huán)境(如硬軟件環(huán)境、網(wǎng)絡環(huán)境等)、IT業(yè)務系統(tǒng)和IT運維人員進行的綜合管理。
IT運維管理主要包括八個方面的管理內(nèi)容。
設備管理:對網(wǎng)絡設備、服務器設備、操作系統(tǒng)運行狀況進行監(jiān)控和管理。
應用/服務管理:對各種應用支持軟件如數(shù)據(jù)庫、中間件、群件以及各種通用或特定服務的監(jiān)控管理,如郵件系統(tǒng)、DNS、Web等的監(jiān)控與管理。
數(shù)據(jù)/存儲/容災的管理:對系統(tǒng)和業(yè)務數(shù)據(jù)進行統(tǒng)一的存儲、備份和恢復。
業(yè)務管理:包含對企業(yè)自身核心業(yè)務系統(tǒng)運行情況的監(jiān)控和管理.對于業(yè)務的管理,主要關注該業(yè)務系統(tǒng)的CSF (關鍵成功因素Critical Success Factors)和KFI(關鍵績效指標Key Performance Idicators)。目錄/內(nèi)容管理:該部分主要對于企業(yè)需要統(tǒng)一發(fā)布或因人定制的內(nèi)容管理和對公共信息的管理。
資源資產(chǎn)管理:管理企業(yè)中各IT系統(tǒng)的資源資產(chǎn)情況,這些資源資產(chǎn)可以是物理存在的,也可以是邏輯存在的。并可以與企業(yè)的財務部門進行數(shù)據(jù)交換。
信息安全管理:該部分包含了許多方面的內(nèi)容,目前信息安全管理主要依據(jù)的國際標準是ISO17799,該標準涵蓋了信息安全管理的十大控制方面,36個控制目標和127中控制方式,如企業(yè)安全組織方式、資產(chǎn)分類與控制、人員安全、物理與環(huán)境安全、通信與運營安全、訪問控制、業(yè)務連續(xù)性管理等。
日常工作管理:該部分主要用于規(guī)范和明確運維人員的崗位職責和工作安排、提供績效考核量化依據(jù)、提供解決經(jīng)驗與知識的積累與共享手段。
通過以上對IT運維管理的理解,我們對服務器設備進行了系統(tǒng)的維護,根據(jù)企業(yè)的實際情況制定了詳細的策略和方法,為服務器穩(wěn)定運行提供最基礎的保障。
2 企業(yè)運維管理的策略和方法
在錯綜復雜的信息環(huán)境中,企業(yè)要想吸取有效信息 就必須面對跨越異構(gòu)環(huán)境(硬件平臺、操作系統(tǒng)、數(shù)據(jù)庫平臺……)帶來的層層障礙。針對企業(yè)的現(xiàn)狀以及我們對IT運維管理的理解,我們制定的策略和方法。
2.1設備管理
設備管理主要是對網(wǎng)絡設備、服務器設備和操作系統(tǒng)等的運行狀況進行監(jiān)控和管理。本公司的網(wǎng)絡設備有思科、華為和中興等三家的產(chǎn)品,服務器設備IBM、HP、Sun以及聯(lián)想等四家;操作系統(tǒng)更是有AIX、Windows、Unix和Solaris等四種;為保證應用系統(tǒng)安全穩(wěn)定的運行,各應用系統(tǒng)也由單機系統(tǒng)變成了雙機備份系統(tǒng),這樣就大大提高了網(wǎng)管系統(tǒng)的效率和可用性。
2.1.1 網(wǎng)絡設備
對于企業(yè)來說,功能完善的網(wǎng)絡屬于必備的條件。本公司的網(wǎng)絡設備類型有三種,我們使用HP的軟件在被管節(jié)點上安裝代理程序通過SNMP把需要采集的信息,包括性能數(shù)據(jù)、閾值告警等傳遞到管理站,然后我們的網(wǎng)絡管理員就可以通過網(wǎng)絡管理站來實時的監(jiān)控獲取到的相關信息來監(jiān)控網(wǎng)絡運行狀況,為網(wǎng)絡管理和運維提供可靠依據(jù),保證網(wǎng)絡7x24小時穩(wěn)定運行。
2.1.2 服務器設備
我們首先對設備進行正常的日常維護,除此之外,我們還針對不同設備、應用系統(tǒng)的要求以及維護的要求分別對各類設備進行維護,如我們現(xiàn)有服務器50多臺,一臺一臺地檢查一次至少需要2個小時,既浪費時間也麻煩還容易出錯,給運維帶來很大的工作量,我們根據(jù)這種情況通過交換機將各服務器連接起來,組成一個局域網(wǎng).利用帶外管理軟件來管理和運維,這樣既可以快速發(fā)現(xiàn)故障也減少了許多的 作量。
2.1.3 操作系統(tǒng)
操作系統(tǒng)是一管理電腦硬件與軟件資源的程序,同時也是計算機系統(tǒng)的內(nèi)核與基石。操作系統(tǒng)身負諸如管理與配置內(nèi)存、決定系統(tǒng)資源供需的優(yōu)先次序、控制輸入與輸出設備、操作網(wǎng)絡與管理文件系統(tǒng)等基本事務。操作系統(tǒng)是管理計算機系統(tǒng)的全部硬件資源包括軟件資源及數(shù)據(jù)資源、控制程序運行、改善人機界面、為其它應用軟件提供支持等,使計算機系統(tǒng)所有資源最大限度地發(fā)揮作用。目前操作系統(tǒng)的種類繁多,但所有的操作系統(tǒng)具有并發(fā)性、共享性、虛擬性和不確定性四個基本特征,根據(jù)這些特征,我們制定了各類操作系統(tǒng)的巡檢制度,并結(jié)合網(wǎng)管軟件將錯誤日志等通過短信或郵件發(fā)給維護人員,使我們能夠及時快速的發(fā)現(xiàn)和處理故障策略探討·Strategies Discussed保證業(yè)務系統(tǒng)的正常運行。
2.2應用/服務的管理
應用和服務的管理主要是對各種應用支持軟件如數(shù)據(jù)庫、中間件、群件以及各種通用或特定服務的監(jiān)控管理.而我們維護主要對數(shù)據(jù)庫進行日常管理和維護。數(shù)據(jù)庫是應用軟件的核心,數(shù)據(jù)庫日常維護工作是系統(tǒng)管理員的重要職責,熟悉數(shù)據(jù)庫的維護方法對于計算機技術人員解決日常工作中的問題來說是很有幫助的。我們主要從幾個方面對數(shù)據(jù)庫進行維護。
2.2.1監(jiān)視系統(tǒng)運行狀況,及時處理系統(tǒng)錯誤
我們通過觀察監(jiān)視當前用戶以及進程的信息、目標占用空間情況、監(jiān)視Server的統(tǒng)計數(shù)據(jù)等對數(shù)據(jù)庫進行日常巡檢和管理。
2.2.2備份和恢復數(shù)據(jù)庫數(shù)據(jù)
利用IBM 公司的TSM 軟件和Acronis軟件.對各系統(tǒng)的數(shù)據(jù)庫定期進行備份、恢復和歸檔,并定期進行數(shù)據(jù)庫優(yōu)化工作。
2.2.3保證系統(tǒng)數(shù)據(jù)安全。定期更改用戶口令
2.3業(yè)務管理
我們的業(yè)務系統(tǒng)分為數(shù)據(jù)采集、綜合展示和短信系統(tǒng)等部分.我們通過HP的采集軟件將網(wǎng)絡設備和服務器設備進行監(jiān)控,并通過報表和短信系統(tǒng)展示出來,逐漸從傳統(tǒng)的人工監(jiān)管向利用軟件自動監(jiān)管的方向過度,并將出現(xiàn)的故障寫入服務流程單,進行總結(jié)和歸檔,為以后的維護提供原始資料。
2.4數(shù)據(jù)/存儲/容災的管理
存儲已經(jīng)從網(wǎng)絡基礎架構(gòu)外的一部分發(fā)展為網(wǎng)絡的重要組成.從直接連接到服務器上的一塊磁盤到龐大的網(wǎng)絡存儲。存儲管理之所以復雜,是因為它管理的對象龐大而且層次不齊。從廣義上講,凡是一個企業(yè)的網(wǎng)絡環(huán)境中有數(shù)據(jù)存放的地方都是存儲,這就包括了數(shù)據(jù)庫、服務器、用戶終端,甚至鏈接的線路都和存儲發(fā)生著緊密的關聯(lián).此外還有那些時而離線時而連線的筆記本電腦、移動硬盤、優(yōu)盤、閃存等。狹義地講,存儲就是指光盤、磁盤陣列、磁帶庫、NAS、SAN系統(tǒng)等,而無論是廣義概念上的存儲管理還是狹義概念上的存儲管理,都不是一件容易的事情,尤其是在大型的異構(gòu)網(wǎng)絡環(huán)境之中。我們使用的存儲設備是HP StorageWorks Storage系列,利用IBM 的TSM 軟件根據(jù)各應用系統(tǒng)的要求制定存儲策略。通過TSM 靈活的策略管理功能,定制數(shù)據(jù)備份、恢復和存檔,規(guī)定哪些數(shù)據(jù)需要備份或存檔、存儲在哪里以及保存多長時間等。TSM 的調(diào)度特性也消除了人工備份和跟蹤的需求.促進了存儲操作向非高峰時間的調(diào)度,從而優(yōu)化了網(wǎng)絡資源和性能。
2.5資源資產(chǎn)管理
資產(chǎn)管理包括所有IT相關的硬件軟件的資產(chǎn)清單、匯總、報表及異常情況報告等管理,資產(chǎn)管理功能從兩個方面實現(xiàn)。
一是管理的資產(chǎn)類別,包括PC機、交換機、服務器等硬件和操作系統(tǒng)、應用軟件等軟件這兩個方面。資產(chǎn)管理不僅可以實時監(jiān)視資產(chǎn)的當前運行狀況,資產(chǎn)變動,而且對于一些非IT的設備,或者一些無法直接獲取數(shù)據(jù)的設備也應納入管理范圍,允許用戶手工增加編輯這些設備。對于資產(chǎn)的類別,IT運維管理系統(tǒng)也應允許用戶自由添加、編輯和刪除類別信息,如可以允許用戶增加一個“存儲陣列柜”的資產(chǎn)類別,用戶可以自己編輯相關的屬性。這樣可以實現(xiàn)一個完整的資產(chǎn)管理。
二是基于生命周期的資產(chǎn)管理,資產(chǎn)的生命周期,主要是指資產(chǎn)的采購、入庫、領用、正常使用、維修、庫存、報廢等一系列資產(chǎn)的生命狀態(tài)。資產(chǎn)是個動態(tài)的概念,我們要隨時掌握當前有哪些設備是正常運行的,哪些處于維修或者庫存狀態(tài);谏芷诘墓芾砜梢匀娴目疾橘Y產(chǎn)的全面信息。
我們現(xiàn)在根據(jù)ITIL流程中的配置流程和更改流程,利用HP的Service Manager軟件將硬件、網(wǎng)絡設備等管理起來,通過管理可以很清楚地知道我們有哪些基礎設施,用在哪里,怎樣合理的使用這些資源等,這樣既可以節(jié)約成本也可以提高效率。
2.6信息安全管理
BS 7799信息安全管理體系標準強調(diào)風險管理的思想。指導組織建立信息安全管理體系ISMS。ISMS是一個系統(tǒng)化、程序化和文件化的管理體系,基于系統(tǒng)、全面、科學的安全風險評估,體現(xiàn)預防控制為主的思想,強調(diào)遵守國家有關信息安全的法律法規(guī)及其他合同方要求,強調(diào)全過程和動態(tài)控制,本著控制費用與風險平衡的原則合理選擇安全控制方式保護組織所擁有的關鍵信息資產(chǎn),使信息風險的發(fā)生概率和結(jié)果降低到可接受水平,確保信息的保密性、完整性和可用性,保持組織業(yè)務運作的持續(xù)性。
3 結(jié)論
基于以上的理解,有必要建立一套完善的IT運維管理系統(tǒng),使得信息管理部門能隨時掌握了解企業(yè)信息平臺發(fā)生的各種情況,在第一時間感知系統(tǒng)出現(xiàn)的故障和問題,同時應建立響應的快速反應計劃,在出現(xiàn)故障的時候迅速采取措施.恢復網(wǎng)絡或系統(tǒng)的正常運行.一套好的IT運維管理系統(tǒng)可以大大提高工作效率.保障企業(yè)各業(yè)務系統(tǒng)能夠穩(wěn)定、高效的運行,為企業(yè)創(chuàng)造更大的經(jīng)濟和社會效益。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:淺談IT運維管理的應用與實踐
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839410219.html