保持服務(wù)器的正常運(yùn)行和喚醒狀態(tài),或者至少準(zhǔn)備好一旦有需要就立刻投入運(yùn)行,這個(gè)目標(biāo)可能是所有數(shù)據(jù)中心經(jīng)理們最渴望實(shí)現(xiàn)的目標(biāo)之一。
然而很少有數(shù)據(jù)中心經(jīng)理們能夠誠(chéng)實(shí)地說(shuō),他們所做的一切絕對(duì)都是為了讓系統(tǒng)的正常運(yùn)行時(shí)間最大化。專(zhuān)家們說(shuō),事實(shí)上很多經(jīng)理都把大量的時(shí)間和金錢(qián)浪費(fèi)在了很少或者不能對(duì)正常運(yùn)行時(shí)間產(chǎn)生積極作用的技術(shù)和實(shí)踐上去了。
美國(guó)金融數(shù)據(jù)服務(wù)商Six Telekurs負(fù)責(zé)IT運(yùn)營(yíng)與后勤保障的副總裁Walter Beddoe認(rèn)為,實(shí)現(xiàn)正常運(yùn)行時(shí)間的最大化既是科學(xué)也是一門(mén)管理藝術(shù)。“需要將諸多不同的東西組合在一起,包括可勝任此項(xiàng)工作的人員,利用容錯(cuò)硬件,采納動(dòng)態(tài)安全、良好的維護(hù)與變更管理實(shí)踐等。最重要的是,你必須承諾盡最大可能將一切做好!
普林斯頓一家診斷醫(yī)學(xué)成像公司Princeton Radiology的IT部門(mén)主任Alan Howard敦促其屬下不要把時(shí)間和資源浪費(fèi)在不能直接對(duì)提高正常運(yùn)行時(shí)間有貢獻(xiàn)的行為和工具上面。比方說(shuō)進(jìn)行集群的努力就是“相當(dāng)浪費(fèi)的”,還不如冗余配置再輔以工具更能實(shí)現(xiàn)全自動(dòng)化。
不能自動(dòng)化的集群——其中的同步需要手工完成——可能會(huì)引起更多的問(wèn)題,Howard說(shuō)!澳硞(gè)主節(jié)點(diǎn)一旦失靈就可能是災(zāi)難性的;與其讓主節(jié)點(diǎn)失靈再去恢復(fù)它,還不如讓備用節(jié)點(diǎn)失靈更好些!
他舉例說(shuō),他的團(tuán)隊(duì)做了一個(gè)Windows Server的集群,用作失效備援,結(jié)果卻導(dǎo)致了應(yīng)用程序的崩潰,因?yàn)樵搼?yīng)用配置文件的一個(gè)變動(dòng)未能及時(shí)拷到備用服務(wù)器上去!靶迯(fù)應(yīng)用崩潰故障所花費(fèi)的努力往往要比修復(fù)一個(gè)集群節(jié)點(diǎn)失靈故障的努力大多了!
之后,他的團(tuán)隊(duì)就不再配置傳統(tǒng)意義的集群服務(wù)器了。相反,他們配置了一個(gè)“單獨(dú)的備用服務(wù)器集群”——并將該集群全部映射到一個(gè)雙控制器的Compellent存儲(chǔ)中心SAN上,“這樣我們就能夠基本上無(wú)縫地按需遷移虛擬機(jī)了!
精心規(guī)劃
大多數(shù)數(shù)據(jù)中心經(jīng)理都同意,仔細(xì)地規(guī)劃所有與服務(wù)器相關(guān)的工作——從采購(gòu)到管理到替換,是保障系統(tǒng)可靠性的關(guān)鍵性步驟。
華盛頓大學(xué)的IT運(yùn)營(yíng)及工程設(shè)計(jì)經(jīng)理Raoul Gabiam說(shuō),生命周期管理是服務(wù)器正常運(yùn)行時(shí)間規(guī)劃的一個(gè)內(nèi)在組成部分!爸涝诤螘r(shí)、如何更換硬件,并升級(jí)軟件是非常重要的,因?yàn)檫@會(huì)影響系統(tǒng)的性能、持續(xù)性和總體的正常運(yùn)行時(shí)間。”
比方說(shuō),如果你必須做一次軟件升級(jí),那么了解清楚對(duì)硬件的需求,以及現(xiàn)有硬件的狀態(tài)就是至關(guān)重要的。你或許得購(gòu)買(mǎi)硬件來(lái)滿足軟件升級(jí)的需求,以避免出現(xiàn)更多的宕機(jī),Gabiam解釋道。
Gabiam還強(qiáng)烈地推崇標(biāo)準(zhǔn)化與協(xié)調(diào),作為確保服務(wù)器可靠運(yùn)營(yíng)的方法。“在任何人安裝任何東西或者進(jìn)行某個(gè)變動(dòng)之前,必須先走一個(gè)變動(dòng)管理流程!
變動(dòng)管理就是要了解“每件東西是如何配置的,并在實(shí)施變動(dòng)之前對(duì)變動(dòng)做出評(píng)估,”Gabiam說(shuō)!坝眠@種方法,你就總能了解清楚哪些事情是不允許的,哪些事情可能會(huì)產(chǎn)生相互影響。”
他說(shuō),遵守變動(dòng)管理的紀(jì)律,就可能預(yù)見(jiàn)到以某種方式配置服務(wù)器,或者將其安放在一個(gè)新環(huán)境中時(shí)會(huì)產(chǎn)生什么影響。
在線資源公司是一家為金融機(jī)構(gòu)提供交易服務(wù)的企業(yè),其CTO Paul Franko認(rèn)為,工作態(tài)度也會(huì)產(chǎn)生巨大作用。他說(shuō),他進(jìn)行了一項(xiàng)額外的努力,以確保常規(guī)但很關(guān)鍵的服務(wù)器相關(guān)工作能夠被認(rèn)真嚴(yán)肅地對(duì)待,并及時(shí)得到處理。
“我們提出了一套系統(tǒng)檢查與平衡機(jī)制,以確保我們的各種規(guī)則能夠被遵守,”他說(shuō)。按照Franko的說(shuō)法,經(jīng)理們必須常規(guī)性地檢查下屬的管理工作,再輔之以其他手段的雙重檢查,就可以把人工失誤降至最低限度。“是人就會(huì)犯錯(cuò),如果你沒(méi)有設(shè)置多個(gè)檢查點(diǎn),事情就會(huì)滑向錯(cuò)誤的一邊。”
分頁(yè)
推行預(yù)防性維護(hù)
常規(guī)性的預(yù)防維護(hù)措施或許是支撐服務(wù)器可靠運(yùn)行最容易,也最少痛苦的方法。“系統(tǒng)的正常運(yùn)行時(shí)間只能和整個(gè)系統(tǒng)中最弱組件的正常運(yùn)行時(shí)間一樣長(zhǎng),”Beddoe說(shuō)。長(zhǎng)此以往地執(zhí)行各項(xiàng)基本任務(wù)——升級(jí)系統(tǒng)軟件、提供有條件的電力,保證適當(dāng)?shù)睦鋮s環(huán)境——方能在不突破預(yù)算的前提下讓數(shù)據(jù)中心的服務(wù)器無(wú)故障地運(yùn)行,才可不必從其他關(guān)鍵任務(wù)組抽調(diào)人手來(lái)修復(fù)故障。
Paul Franko,在線資源公司的CTO認(rèn)為,工作態(tài)度在服務(wù)器管理中可以發(fā)揮巨大的作用。他說(shuō)他他進(jìn)行了一項(xiàng)額外的努力,以確保常規(guī)但很關(guān)鍵的服務(wù)器相關(guān)工作能夠被認(rèn)真嚴(yán)肅地對(duì)待,并及時(shí)得到處理。
Franko說(shuō),為了確保所有必須要做的工作在需要時(shí)加以貫徹,就應(yīng)該確定哪些工作是服務(wù)器維護(hù)工作,并將它們組織成明確的日程表!坝行┦虑槭潜仨毩⒖虉(zhí)行的,比如安全升級(jí),而其他一些任務(wù)批量執(zhí)行,或者每隔一段固定期限加以執(zhí)行是比較合理的!边@第二類(lèi)任務(wù)就包括軟件非關(guān)鍵性功能改進(jìn)的升級(jí)等。
Franko補(bǔ)充說(shuō),服務(wù)器的維護(hù)工作應(yīng)該這樣加以處理:維護(hù)工作本身不應(yīng)占用服務(wù)器的正常運(yùn)行時(shí)間!拔覀儾荒転榱诉M(jìn)行某些維護(hù)工作而讓系統(tǒng)的運(yùn)行速度下降,無(wú)論如何,我們都得做到這一點(diǎn)!
如果必須拆下某臺(tái)服務(wù)器進(jìn)行維護(hù)的話,F(xiàn)ranko的團(tuán)隊(duì)就會(huì)把這項(xiàng)維護(hù)工作安排到午夜或周末,用戶的需求量很低的時(shí)候進(jìn)行。在正常工作時(shí)間拆下一臺(tái)功能服務(wù)器的唯一理由只能是必須安裝或執(zhí)行關(guān)鍵性的軟件升級(jí),例如需要安裝零日安全補(bǔ)丁。
自動(dòng)執(zhí)行基本的服務(wù)器管理任務(wù)
在過(guò)去數(shù)年間,服務(wù)器的管理已變得越來(lái)越復(fù)雜,其中大部分原因是由于虛擬化及其相關(guān)技術(shù)的出現(xiàn);為了提升服務(wù)器的效率和使用率,必須設(shè)計(jì)各類(lèi)最佳實(shí)踐。
虛擬化本身有助于保護(hù)數(shù)據(jù)中心不受服務(wù)器宕機(jī)的影響。通過(guò)對(duì)服務(wù)器進(jìn)行整合,在一個(gè)共享環(huán)境中相互連接,虛擬化允許多個(gè)虛擬機(jī)運(yùn)行在不同的主機(jī)上。任何一臺(tái)主機(jī)的失靈都會(huì)導(dǎo)致工作負(fù)載在剩余的主機(jī)間進(jìn)行重新分配。“某臺(tái)服務(wù)器或許會(huì)失靈,但這并不意味著這將會(huì)影響到整個(gè)服務(wù)的提供,”Gabiam論述道。
為了更有效地管理日益擴(kuò)張的虛擬化環(huán)境,Xenos軟件、Uptime軟件、Nimsoft和Nagios企業(yè)等公司紛紛推出了旨在幫助數(shù)據(jù)中心工作人員關(guān)注服務(wù)器性能、定位出現(xiàn)的問(wèn)題,以及充分利用性能改進(jìn)機(jī)會(huì)的工具。
Beddoe覺(jué)得這樣的工具是必不可少的!澳惚仨氁心撤N讓人放心的東西,保證你的所有服務(wù)器能在任何時(shí)候做它們?cè)撟龅氖虑。?/p>
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:如何最大化服務(wù)器正常運(yùn)行時(shí)間
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112156833.html