引言
服務(wù)器技術(shù)已經(jīng)發(fā)展幾十年,但隨著互聯(lián)網(wǎng)信息技術(shù)的發(fā)展。云技術(shù)和移動(dòng)平臺(tái)成為新的技術(shù)標(biāo)準(zhǔn)。為了使終端更便捷,客戶端會(huì)采用手持式移動(dòng)設(shè)備和瀏覽器,并要求相關(guān)的數(shù)據(jù)和程序須保留在“云”端。隨著云技術(shù)和移動(dòng)平臺(tái)的發(fā)展,服務(wù)器的數(shù)量和規(guī)模必將成幾何級(jí)數(shù)的增長(zhǎng)。故障和問(wèn)題也會(huì)成倍增長(zhǎng)。但和在個(gè)人使用的情況不同,網(wǎng)絡(luò)化的服務(wù)器由于同時(shí)支持眾多的操作者。運(yùn)行不同的網(wǎng)絡(luò)應(yīng)用程序。管理眾多的本地和遠(yuǎn)程設(shè)備。其設(shè)備的故障診斷就相對(duì)復(fù)雜。
UNIX本身是為復(fù)雜網(wǎng)絡(luò)化環(huán)境設(shè)計(jì)的操作系統(tǒng),而AIX操作系統(tǒng)是最大的系統(tǒng)集成商IBM開(kāi)發(fā)的第二代UNIX,具有性能完善,使用方便,擴(kuò)充性強(qiáng),適合企業(yè)關(guān)鍵業(yè)務(wù)等特點(diǎn),所以本文實(shí)例均在AIX環(huán)境下實(shí)現(xiàn)。
1、故障概述
服務(wù)器的在線模式故障是指服務(wù)器發(fā)生了一般性錯(cuò)誤。這些錯(cuò)誤雖然不至于系統(tǒng)崩潰。但影響系統(tǒng)的正常運(yùn)行,影響數(shù)據(jù)的健壯性,并有進(jìn)一步擴(kuò)大危害的可能。系統(tǒng)的問(wèn)題和故障應(yīng)該及早發(fā)現(xiàn)。并及時(shí)進(jìn)行處理和解決,避免進(jìn)一步的危害,引起嚴(yán)重后果。及早的預(yù)判。及早的發(fā)現(xiàn)。及早的排查是故障診斷的關(guān)鍵。
2、系統(tǒng)故障分析和判斷
系統(tǒng)硬件故障分析可以使用diag命令進(jìn)行分析和判斷。
在系統(tǒng)管理員狀態(tài)下運(yùn)行命令#diag進(jìn)行硬件診斷程序。檢測(cè)主機(jī)內(nèi)硬件存在的問(wèn)題。
1)基本系統(tǒng)
2)I/O設(shè)備
3)異步設(shè)備
4)圖形設(shè)備
5)SCSI設(shè)備
6)存儲(chǔ)設(shè)備
7)通信設(shè)備
8)多媒體設(shè)備
#diag —S
在所有資源上運(yùn)行診斷。
3、查看系統(tǒng)的錯(cuò)誤日志
在系統(tǒng)運(yùn)行時(shí),一些系統(tǒng)錯(cuò)誤會(huì)記錄在errlog中,其中有些錯(cuò)誤還會(huì)在終端上顯示。檢查錯(cuò)誤日志可用以下命令
4、DUMP
當(dāng)系統(tǒng)發(fā)生軟硬件故障導(dǎo)致宕機(jī)時(shí),系統(tǒng)將搜集故障發(fā)生時(shí)系統(tǒng)的內(nèi)存和處理器狀態(tài)等信息,產(chǎn)生DUMP文件,并且在液晶屏上顯示888開(kāi)始的代碼。記錄第二段開(kāi)始的故障碼,并分析DUMP狀態(tài)碼有助于分析故障原因,找到問(wèn)題所在。
5、日常檢查服務(wù)器狀態(tài)的項(xiàng)目及其相關(guān)命令
作為輔助。定期運(yùn)行檢查服務(wù)器性能的相關(guān)工具和命令,有助于掌握服務(wù)器狀態(tài),預(yù)測(cè)故障點(diǎn),相關(guān)命令包括:
Iostat
查看系統(tǒng)I/O狀態(tài)。分析CPU對(duì)各端口的服務(wù)占比,了解硬盤(pán)swap空間和內(nèi)存的數(shù)據(jù)比例關(guān)系。
Vmstat
查看系統(tǒng)虛擬內(nèi)存狀態(tài)信息。
Sar
Sat查看系統(tǒng)活動(dòng)狀態(tài)信息。
Topas
Topas可以監(jiān)控系統(tǒng)內(nèi)存,CPU,I/O端口,swap空間的情況
no 命令用來(lái)修改內(nèi)核參數(shù)。調(diào)整系統(tǒng)性能。
Svmon
svm on 命令用來(lái)查看系統(tǒng)當(dāng)前的內(nèi)存的具體使用。
6、結(jié)論
任何完好的系統(tǒng)它都不可能一點(diǎn)錯(cuò)誤或故障都沒(méi)有,網(wǎng)絡(luò)服務(wù)器系統(tǒng)在運(yùn)行時(shí)總是會(huì)或多或少的問(wèn)題出現(xiàn),雖然AIX系統(tǒng)具有自動(dòng)診斷錯(cuò)誤和故障的能力,但用戶熟悉系統(tǒng),并定期監(jiān)視診斷系統(tǒng)的運(yùn)行情況,方可避免不必要故障的發(fā)生。本文相關(guān)維護(hù)方法在IBM P520服務(wù)器,AIX 6.1操作系統(tǒng)下實(shí)現(xiàn)通過(guò)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:服務(wù)器在線模式下硬件故障診斷的方法
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112152131.html