一 地質(zhì)錄井公司軟件應(yīng)用現(xiàn)狀
自從現(xiàn)場錄井?dāng)?shù)據(jù)實現(xiàn)實時遠(yuǎn)程傳輸以來,錄井?dāng)?shù)據(jù)的采集、傳輸、存儲、管理、發(fā)布、資料處理等一系列相關(guān)配套的生產(chǎn)應(yīng)用軟件逐漸發(fā)展起來,軟件的技術(shù)支持覆蓋范圍也逐漸變深變廣。近年來,公司在國內(nèi)外其它地區(qū)配備了近十臺服務(wù)器為甲方提供數(shù)據(jù)接收、存儲、管理、遷移、發(fā)布、查詢等服務(wù)。這些服務(wù)器處于無人值守狀態(tài),因此有必要充分利用信息技術(shù)對遠(yuǎn)程服務(wù)器進(jìn)行有效管理,監(jiān)控服務(wù)器上運行的諸多生產(chǎn)相關(guān)的應(yīng)用軟件和數(shù)據(jù)庫,實時的發(fā)現(xiàn)并解決問題,加強(qiáng)對外服務(wù)故障的響應(yīng)效率,減低維護(hù)人員的維護(hù)難度。
二 軟件系統(tǒng)的功能模塊設(shè)計
結(jié)合錄井生產(chǎn)過程中用到的軟件系統(tǒng),我們針對不同的被監(jiān)控生產(chǎn)軟件,考慮了服務(wù)器的遠(yuǎn)程操作和方便性的因素,設(shè)計了不同的監(jiān)控方案。
2.1 應(yīng)用軟件的監(jiān)控
(1)操作系統(tǒng)錯誤捕捉
主要針對數(shù)據(jù)同步軟件,因為數(shù)據(jù)量巨大和網(wǎng)絡(luò)狀況以及軟件自身設(shè)計方面的一些原因會彈出錯誤窗口,導(dǎo)致數(shù)據(jù)同步中斷。系統(tǒng)自身要對整個Windows錯誤進(jìn)行捕捉,例如:C++Runtime Library、Vistual Studio Debug、Err等;采用的是實時監(jiān)測操作系統(tǒng)的注冊窗口。根據(jù)所有窗口的運行狀態(tài)來進(jìn)行判斷而找到錯誤并進(jìn)行捕捉。通過捕捉到的錯誤窗口,得到其進(jìn)程PID號,然后再對錯誤窗口進(jìn)行處理,通常情況下只需要結(jié)束此窗體的進(jìn)程即可。
(2)系統(tǒng)服務(wù)監(jiān)控
主要針對地質(zhì)資料接收軟件等以服務(wù)的形式運行的軟件。首先通過WMI枚舉所有系統(tǒng)的服務(wù)及其運行狀態(tài)。并匹配用戶所指定的系統(tǒng)服務(wù),然后通過匹配檢測出當(dāng)前服務(wù)是否運行,如果服務(wù)沒有運行可以通過網(wǎng)絡(luò)將服務(wù)重新啟動。
(3)應(yīng)用程序監(jiān)測
主要針對錄井儀資料接收軟件等,對此類應(yīng)用程序進(jìn)行監(jiān)控,隨時了解其運行狀態(tài)。首先通過FSO(文件系統(tǒng)對象)判斷所需要監(jiān)測的應(yīng)用程序是否存在,然后通過Win32 API枚舉進(jìn)程檢測當(dāng)前應(yīng)用程序是否存在,如果不存在可以使用遠(yuǎn)程命令來把應(yīng)用程序啟動起來。
2.2 服務(wù)器的監(jiān)控
(1)系統(tǒng)進(jìn)程監(jiān)控
由于遠(yuǎn)程服務(wù)器正常情況下不會有人為因素對服務(wù)器的干擾,因此服務(wù)器的進(jìn)程是固定不變的。通過Win32 API把系統(tǒng)目前運行的進(jìn)程全部枚舉出來后,并與用戶所設(shè)定的安全進(jìn)程進(jìn)行匹配,如果不在用戶指定的安全進(jìn)程范圍內(nèi),則視為不安全進(jìn)程或可疑進(jìn)程,系統(tǒng)會自動將其進(jìn)程結(jié)束,在枚舉具體進(jìn)程時,需要與FSO相結(jié)合使用,而得到進(jìn)程所對應(yīng)的應(yīng)用程序的相關(guān)信息。
(2)遠(yuǎn)程數(shù)據(jù)庫監(jiān)測及操作
對于所有外部服務(wù)器上安裝的數(shù)據(jù)庫系統(tǒng),實時檢測連接數(shù)據(jù)庫,查看數(shù)據(jù)庫是否連接正常;通過WMI枚舉系統(tǒng)服務(wù),檢測數(shù)據(jù)庫服務(wù)是否運行正常。管理端同時可以對注冊服務(wù)器所監(jiān)測的所有MS SQL數(shù)據(jù)庫進(jìn)行簡單操作,包括數(shù)據(jù)庫視圖和表等基本信息的顯示;數(shù)據(jù)表、字段的顯示和增刪改等操作。
(3)服務(wù)器信息實時掃描
對用戶所需要監(jiān)測的信息進(jìn)行實時掃描,例如:CPU和內(nèi)存使用狀況、安裝軟件及系統(tǒng)補(bǔ)丁檢測等。并把相關(guān)信息存人本地和發(fā)送給服務(wù)器管理端。終端可以對操作系統(tǒng)本身的一些基本信息進(jìn)行監(jiān)測,例如:軟件、硬件、基本信息、開放端口、網(wǎng)絡(luò)狀況等。
(4)服務(wù)器的簡單控制
直接在服務(wù)器管理端就可以對終端系統(tǒng)信息進(jìn)行查看和操作,當(dāng)終端接收到管理端的命令后進(jìn)行解析,然后在終端進(jìn)行處理。并把處理的結(jié)果返回給管理端。包括:服務(wù)器重啟、關(guān)機(jī)、軟件系統(tǒng)重啟、關(guān)閉、系統(tǒng)進(jìn)程的結(jié)束、系統(tǒng)服務(wù)的啟動及停止、文件系統(tǒng)的查閱、高級命令操作窗等。
2.3 報警模塊設(shè)計
監(jiān)測到服務(wù)器有異常數(shù)據(jù)后,設(shè)置監(jiān)控端服務(wù)器的聲音報警,然后通過發(fā)送郵件和手機(jī)短信的方式實時地把異常數(shù)據(jù)發(fā)送給指定用戶郵箱和手機(jī)上。
三 軟件系統(tǒng)實現(xiàn)
系統(tǒng)實現(xiàn)包括3個部分:服務(wù)器終端監(jiān)測系統(tǒng)、服務(wù)器管理操作平臺、報警數(shù)據(jù)Web應(yīng)用平臺。服務(wù)器操作管理端能夠?qū)Ψ⻊?wù)器終端進(jìn)行控制操作,同時。服務(wù)器監(jiān)測終端可以對自身服務(wù)器的運行狀況、安全狀態(tài)、應(yīng)用系統(tǒng)運行狀況、數(shù)據(jù)庫運行狀況、CPU和內(nèi)存的使用狀況等進(jìn)行實時監(jiān)控并實時與服務(wù)器操作管理平臺進(jìn)行通訊。將監(jiān)測到的數(shù)據(jù)進(jìn)行實時顯示,當(dāng)出現(xiàn)不良運行狀況時服務(wù)器操作管理端將進(jìn)行報警,并對錯誤進(jìn)行記錄。當(dāng)無人值守時,可將一些工作交給服務(wù)器操作管理端來自動進(jìn)行處理,服務(wù)器終端操作管理端將會對服務(wù)器終端監(jiān)測系統(tǒng)發(fā)送命令,可對終端服務(wù)器進(jìn)行自動調(diào)整。
3.1 服務(wù)器終端監(jiān)測系統(tǒng)
服務(wù)器終端監(jiān)測系統(tǒng)運行在遠(yuǎn)程需要被監(jiān)測的服務(wù)器上面,是Client/server架構(gòu)的Client端,主要是收集所監(jiān)控服務(wù)器的信息,并把服務(wù)器端所需要的信息發(fā)送過去。
終端監(jiān)測系統(tǒng)啟動后,首先從軟件安裝目錄下讀取系統(tǒng)配置文件和參數(shù)配置文件,讀入配置信息,然后進(jìn)行網(wǎng)絡(luò)判斷。如果在網(wǎng)絡(luò)不正常的情況下就加載本地存儲的數(shù)據(jù)結(jié)構(gòu);如果網(wǎng)絡(luò)狀態(tài)正常,那么就從數(shù)據(jù)庫里面讀取數(shù)據(jù),再把本地文件與數(shù)據(jù)庫文件對比并進(jìn)行更新,以備下次網(wǎng)絡(luò)不通的情況下能夠正確配置運行。終端接收到服務(wù)器端的命令,并把執(zhí)行的結(jié)果返回到服務(wù)器端,例如:關(guān)機(jī),重啟、得到當(dāng)前服務(wù)器的相關(guān)信息、控制進(jìn)程及服務(wù)等。
3.2 服務(wù)器管理操作平臺
服務(wù)器管理操作平臺作為client/Server軟件架構(gòu)的Server端,運行在服務(wù)器上,接收終端傳送的異常數(shù)據(jù),報警并存儲到數(shù)據(jù)庫服務(wù)器上。軟件啟動后,首先從軟件安裝目錄下讀取系統(tǒng)配置文件,讀入配置信息,然后顯示主界面,等待遠(yuǎn)程終端發(fā)送數(shù)據(jù)。用戶可以選擇界面上的菜單按鈕進(jìn)行相應(yīng)的操作。
接收程序接收到異常數(shù)據(jù)后,首先寫入內(nèi)存數(shù)據(jù)隊列中,然后對內(nèi)存中的數(shù)據(jù)進(jìn)行解包分類,判斷是報警數(shù)據(jù)還是消息數(shù)據(jù)。初步分類后再進(jìn)行二次分類,判斷是哪臺服務(wù)器的報警信息、報警類型、報警時間、報警內(nèi)容等,通過分類過后的數(shù)據(jù)寫入數(shù)據(jù)庫并且在界面上進(jìn)行顯示和聲圖并茂報警。由于記錄的數(shù)據(jù)不是很簡練,那么就需要把數(shù)據(jù)進(jìn)行處理后再通過郵件和短信發(fā)送給用戶,使用戶一看即明白。消息數(shù)據(jù)經(jīng)系統(tǒng)二次分類后顯示到界面上就是用戶發(fā)送命令后得到所需要的內(nèi)容。
3.3 web應(yīng)用平臺
通過此網(wǎng)站的建設(shè),用戶只需要登錄IE瀏覽器就可以對系統(tǒng)進(jìn)行歷史數(shù)據(jù)多條件組合查詢、數(shù)據(jù)分類檢索、web服務(wù)器異常監(jiān)測、服務(wù)器報警內(nèi)容查閱。
四 應(yīng)用效果分析
服務(wù)器遠(yuǎn)程監(jiān)控系統(tǒng)的實現(xiàn)解決了錄井信息對外服務(wù)過程中的問題即當(dāng)服務(wù)器應(yīng)用系統(tǒng)及數(shù)據(jù)庫出現(xiàn)問題時,管理人員不知道,不能及時對問題進(jìn)行解決。有了這套系統(tǒng),管理員可以很方便地對服務(wù)器運行的軟件進(jìn)行維護(hù)。并可以監(jiān)測服務(wù)器的當(dāng)前運行狀態(tài),不需要登陸遠(yuǎn)程服務(wù)器就可以對服務(wù)器或?qū)?yīng)用系統(tǒng)進(jìn)行簡單地操作。從而保證了服務(wù)器的正常運行。
我們在一臺擁有互聯(lián)網(wǎng)和油田局域網(wǎng)IP地址的雙網(wǎng)卡服務(wù)器上安裝了服務(wù)器管理端操作平臺并部署了Web查詢網(wǎng)站,在其余服務(wù)器上安裝了終端監(jiān)控軟件,對網(wǎng)絡(luò)鏈接、系統(tǒng)常規(guī)進(jìn)程、生產(chǎn)應(yīng)用程序、錄井實時發(fā)布服務(wù)進(jìn)行監(jiān)控。截取運行過程中兩個月期間監(jiān)控到的應(yīng)用軟件運行故障情況如表1所示:
由此可見,該軟件系統(tǒng)在應(yīng)用過程中取得了良好的效果。在安裝有監(jiān)控軟件的服務(wù)器上,可實時監(jiān)控服務(wù)器及其上所安裝應(yīng)用軟件的運行狀況,減低了服務(wù)器管理人員每天巡視服務(wù)器的工作量,縮減了因網(wǎng)絡(luò)不暢和生產(chǎn)軟件出現(xiàn)故障后的響應(yīng)時間,提高了服務(wù)質(zhì)量。
五 結(jié)束語
下一步將繼續(xù)關(guān)注軟件運行的穩(wěn)定性以及功能上的進(jìn)一優(yōu)化。對查詢網(wǎng)站界面進(jìn)一步進(jìn)行美化和優(yōu)化,以更好地滿足管理人員的查詢。同時,加強(qiáng)對服務(wù)器管理人員的培訓(xùn),逐步擴(kuò)大推廣應(yīng)用的范圍。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:服務(wù)器遠(yuǎn)程監(jiān)控的設(shè)計與實現(xiàn)
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112154860.html