根據企業(yè)業(yè)務工作負載和活躍程度的不同,可能會使得一臺虛擬機所需的資源呈現(xiàn)明顯的波動。但管理員們通常卻往往忽視了這一點,其所導致的結果便是虛擬機的過度配置。甚至可能導致虛擬機的性能不佳以及不必要的成本的增加。
在本文中,我們將幫助廣大讀者朋友們深入了解為什么會發(fā)生過度配置的情況;以及如何就此進行恰當?shù)脑\斷。尋找一款能夠與虛擬管理程序供應商協(xié)同合作的IT工具以便能夠讓管理員對磁盤、網絡和RAM的使用情況獲得有價值的深入洞察了解。同時,文章中還將對造成虛擬機過度配置的原因也進行深入的探討(處理器的CPU使用率一直保持在90%及以上是判斷過度配置的強大指標)。文章中,我們還將為企業(yè)推薦一些策略和流程,可用于配置“恰當規(guī)模的”虛擬機,以避免資源的浪費,并與此同時,幫助您企業(yè)確保仍然能夠為用以處理突發(fā)需求的一臺虛擬基礎設施的配置做好準備。
對于管理員來說,為虛擬機配置資源可能是一個容易被忽視的任務。而通過適當?shù)囊?guī)劃和測試,則可以幫助他們更好地分配資源,從而實現(xiàn)更穩(wěn)定的性能,改善用戶體驗,并實現(xiàn)成本的節(jié)省。
關于合理的虛擬機配置,并沒有什么簡單的方法。企業(yè)管理員可能寄希望于簡單地通過過度補償計算資源的方法來解決計算資源短缺的問題,并同時避免將來的問題。在本文中,來自TechTarget網站的撰稿人Stephen J. Bigelow將為我們廣大讀者解釋為什么說這是一種十分糟糕的做法。
Bigelow表示,VM的資源需求可以根據企業(yè)的工作負載及其活躍程度而變化。這使得配置具有適當數(shù)量的計算資源的虛擬機變得相當棘手。而且,錯誤的步驟措施還可能潛在地增加成本。盡管在分配額外的vCPU方面可能沒有前期成本,但Bigelow警告說,一家企業(yè)可能會因此在后期受到財務方面的困擾;或將通過虛擬機運營成本的提高引發(fā)許可證授權方面的大開銷。
Bigelow表示,盡管這不容易做到,但從最開始就確定每臺虛擬機的最佳資源水平是防止虛擬機過度配置的最佳方法。不要僅僅從供應商的角度來理解應該配置些什么資源;Bigelow建議管理員采取保守的措施,并在最初從分配工作負載所需的最低資源量開始。如有必要,可以隨時添加更多資源。
IT架構師布萊恩·基什(Brian Kirsch)表示說,資源的過度調撥使用可能是一種富有成效的操作。他解釋說,如果您企業(yè)的虛擬機承擔不起過度使用,可能是因為其資源沒有得到充分有效的利用。計算整合并使用諸如“CPU就緒時間”等工具來監(jiān)控您企業(yè)資源的使用情況,可以帶來更高效的虛擬機。
了解您企業(yè)的配置方案
每臺虛擬機都必須配置確保虛擬實例及其工作負載正常運行所需要的處理器、內存和存儲資源。資源的具體需求取決于工作負載及活躍程度,因此配置一臺具備了適量計算資源的虛擬機或將是一項棘手的工作。為虛擬機提供的資源太少,可能會造成工作負載的性能表現(xiàn)不佳,變得不穩(wěn)定,甚至直接崩潰。而為虛擬機提供太多的資源,則又浪費了多余的計算能力和業(yè)務成本。故而企業(yè)的IT管??理員必須是檢測虛擬機是否過度配置方面的專家,并能夠采取適當?shù)牟襟E措施,以調整資源的使用。
為什么會發(fā)生過度配置的情況?
最初,管理員會出現(xiàn)很多次配置錯誤的情況。處理或內存資源不足,無法處理工作負載,顯然需要更多的資源來完成工作。但是,在具備了足夠的資源與在工作負載不需要資源的情況下投入額外資源之間則是存在差異的。
通常會發(fā)生過度配置的原因是因為管理員們根本不知道對于一臺既定的虛擬機而言,什么資源是必要和適當?shù),特別是當其負載條件發(fā)生變化的時候;蚬芾韱T認識到虛擬機的性能可能由于無意造成的資源匱乏而受損。因此,他們最自然的反應顯然過度補償,以保證問題得到糾正,也希望借此來防止問題再次困擾他們。
這種反應是一種糟糕的做法。這表明管理員們缺乏對于應用程序的理解、規(guī)劃和測試。正確的測試有助于在生產過程中部署工作負載之前建立資源級別或邊界。一些IT工作人員也堅持認為更多的資源等于更好的工作負載表現(xiàn)。
云服務提供商VirtualQube公司的首席執(zhí)行官Scott Gorcester表示:“企業(yè)客戶和IT專業(yè)人士可能會覺得增加處理能力和內存能夠提高虛擬機的性能。但是,通過對虛擬機和應用程序性能的測試和正確分析將顯示,在某些情況下,會達到一個系統(tǒng)最佳運行的點,而在這一點上,增加更多資源要么沒有任何效果,要么甚至會產生負面影響。
例如,分配額外的vCPU可能看起來是免費的,但是一些軟件許可證授權會受到處理器數(shù)量的影響,并且增加處理器功率可能會觸發(fā)意外的許可授權費用,從而無意中提高了虛擬機的運營成本。將內存添加到一臺虛擬機可能會降低一臺服務器所能夠支持的虛擬機的總數(shù)。這限制了工作負載的整合計劃,損害了工作負載的均衡安排,并會導致企業(yè)需要購買比實際所需的更多的服務器或存儲空間。這反過來又會導致更高的維護和能源成本,并造成冷卻問題。
查找過度配置的虛擬機
在沒有首先確定虛擬機是否有過度配置的情況下,是無法修復過度配置的虛擬機的。借助一些工具,可以幫助您企業(yè)做出這一決定。IT專家依靠遠程監(jiān)控和管理(RMM)工具,如Kaseya VSA和SolarWinds虛擬化管理器,以便在需要更改虛擬機資源時提醒管理員。其他的則選擇與管理程序供應商一致的工具。
一家房地產投資公司的網絡工程師兼發(fā)行經理Aldo Cabrera表示說:“我們主要使用vRealize來了解過度配置和欠配置的系統(tǒng)。我們還擁有監(jiān)控工具,借助簡單網絡管理協(xié)議和腳本觸發(fā)器,我們可以立即洞察磁盤、網絡和RAM的使用情況。”甚至虛擬機管理程序平臺也可以包括性能計數(shù)器和監(jiān)控功能,例如vSphere的性能圖表,主機健康運行狀況儀表板、報告和警報以及其他工具,如VMware公司的esxtop命令行產品。
哪些因素實際上表明了虛擬機的過度配置?
首先,考慮處理器(CPU)的使用情況。處理器使用量出現(xiàn)臨時性的峰值是正常的,但處理器使用率持續(xù)性的一直很高——也許超過90%——表明出現(xiàn)了過度配置。請記住,創(chuàng)建更多的vCPU并將其分配給虛擬機很容易,但是,每款vCPU都必須經由安排調度并等待一款物理CPU,以便處理虛擬機的指令和數(shù)據。這導致高就緒時間(通常超過10-20%),使得vCPU需要排隊等待物理處理器資源。這種過度配置可能會降低服務器上的虛擬機的性能。
將一臺故障虛擬機的性能報告與同一服務器及跨多臺服務器上的其他虛擬機進行比較。問題的根本原因通常是太多的vCPU,太多的虛擬機,或者故障的虛擬機上配置的CPU配置限制設置造成的。需要減少分配給虛擬機的不必要的vCPU的數(shù)量。
例如,將兩款或四款vCPU分配給單線程虛擬機會浪費vCPU,因為單線程應用程序只能使用一個vCPU。增加CPU共享(優(yōu)先級)或為虛擬機設置CPU預留可以通過給予vCPU更多的物理CPU訪問提供一定幫助。并且工作負載均衡 ——將故障的虛擬機遷移到具有更多可用資源的另一臺服務器,可以減少在服務器上運行的vCPU的數(shù)量。
配置問題也經常擴展到內存分配。每臺虛擬機應該具有比虛擬機及其應用程序所需的更多內存,并且服務器需要比托管在其之上的所有虛擬機所使用的組合內存更多的總內存。為一臺虛擬機(及其應用程序)分配比起實際所需更多的內存并不會帶來多大益處。故而企業(yè)管理員需要檢查每臺虛擬機的內存使用情況和可用內存值以及活躍程度和被授予的內存大小的報告。
內存使用率始終太高(達95%)或空閑內存總是太低(5%或更少)表明了內存的不足。活躍內存通常等于授予內存,因此也就沒有足夠的可用內存。這會通過多余的磁盤交換來影響虛擬機的性能,虛擬機管理程序可能會使用積極的內存回收技術(如內存擴充)來恢復和重新使用空閑內存。相反,內存使用太低,內存空閑度過高就是過度配置了;通?梢詫⒎峙浣o虛擬機的內存減少,以便為其他虛擬機釋放資源。在某些情況下,減少不必要的高內存預留設置也可以釋放多余的內存以進行回收和重用。
存儲容量很少會直接影響性能,但是查看分配給虛擬機的邏輯單元號(LUN,logical unit number)卷,并監(jiān)視該容量的使用情況仍然不失為一種明智之舉。
將大型LUN分配給不使用它的虛擬機可能浪費昂貴的存儲容量。精簡配置可以有助于減少昂貴的存儲浪費,因為安裝的實際物理磁盤容量可能只是指定邏輯卷大小的一小部分。例如,為配置只有10 GB的一款100 GB LUN進行精簡配置,然后在物理卷填充后再添加物理內存,要便宜得多。
但是,在分配的容量用盡之前,監(jiān)控容量并添加更多的物理磁盤空是非常重要的。此外,請觀察磁盤性能因素(如延遲性),以確保存儲性能問題不影響虛擬機的性能。
恰當?shù)馁Y源分配
防止出現(xiàn)虛擬機過度配置的最佳方法是從一開始就為每個虛擬機分配最佳資源級別,但是確定虛擬機的規(guī)模大小可能很棘手。許多企業(yè)組織基于與應用程序供應商的溝通來制定初步的分配決策(以供應商對應用程序及其要求有最好的了解為假設前提)。
不過,把供應商的建議作為最終的決策可能并不明智。Gorcester說:“一家企業(yè)客戶告訴我們說,他們的軟件供應商強烈建議為虛擬機配置48個內核和128 GB的RAM。調整系統(tǒng)后,我們確定了4個CPU內核和24 GB的RAM,以獲得最佳性能。當我們超過4個內核時,用戶體驗下降,我們根本不需要超過24 GB的內存。”
IT員工的專業(yè)知識以及性能監(jiān)控,測試和調試對于建立最佳的資源配置和最佳的性價比也至關重要。
通過為工作負載分配最少的資源量以保守地開始。觀察性能,并期望工作負載的需求變化會偶爾出現(xiàn)下降。這是完全正常的。資源的不足和緊張可以很容易地通過小增量的形式進行調整。Cabrera說:“最好按照低配置或堅持最低配置的建議,稍后再執(zhí)行審查。在服務器上擁有這些服務的人可能不希望減少資源。恰當?shù)馁Y源配置規(guī)模并增加更多的資源永遠都是受歡迎的,但是想要在此之后拿走這些資源則會很難。”
利用任何資源恢復和工作負載均衡工具也是有幫助的。例如,部署諸如動態(tài)內存分配 (Dynamic memory)、內存膨脹(Memory ballooning)和透明頁共享(Transparent Page Sharing)這樣具備資源恢復功能的虛擬機管理程序。VMware公司的分布式資源調度程序(DRS)和類似工具有助于協(xié)調虛擬機的遷移,并充分利用每臺服務器的可用資源。這可以優(yōu)化環(huán)境可支持的虛擬機總數(shù),同時為這些工作負載提供最佳性能。
并不是所有的過度配置都是不好的。明智的額外資源配置可以使工作負載的性能得到平衡,改善用戶體驗,并使應用程序的利益相關者得到滿足。但是,僅僅只是在工作負載下投入更多的資源就可能造成容量能力的浪費,資金的過度開銷,甚至威脅您企業(yè)正在努力改進的性能。采用正確數(shù)據分析工具和客觀評價,對資源利用情況作出正確的決策。
知道何時過度配置資源
虛擬化的一大優(yōu)點就是能夠抽象和分享資源。這種抽象也使得能夠將資源過度投入到虛擬機中。數(shù)據中心內并不是所有的服務器都需要同時對所有可用資源進行全面的訪問,而過度的使用允許企業(yè)更好地利用這些資源并增加服務器的整合能力。
確定您企業(yè)可以超額配置使用多少的資源是在不斷變化的工作負載需求與整合目標之間的平衡。由于大多數(shù)企業(yè)和工作負載的需求是波動的,超額使用的水平并不是一個靜態(tài)值。相反,超額使用的水平應該是一個取決于一系列變量的動態(tài)值,包括應用程序的類型甚至一天中所處的時間。查看CPU的過度使用狀態(tài),并密切關注幾項關鍵指標可以幫助您企業(yè)實施動態(tài)的管理。
綜合計算
各種不同的計算顯示了每個內核虛擬機的不同值。該值可以從每個CPU內核的三臺到六七臺虛擬機。但是,這種公式需要仔細檢查。首先,通過原始數(shù)學方法,一個雙CPU機架服務器,每個插槽具有六個物理內核,啟用了超線程,可為該盒提供24個可計數(shù)的內核。基于計算的公式估計可以為您企業(yè)提供每個內核四臺虛擬機,使得每臺機架服務器總共達到96臺虛擬機,即:每個內核四臺虛擬機乘以的每臺機架式服務器的24個內核;趲讉原因,您企業(yè)不太可能會看到整合級別。
亟待解決的第一批問題之一是:您企業(yè)將要運行什么樣的工作負載?在一個繁重的基于交易事務的環(huán)境中,您企業(yè)可能有多臺虛擬機需要多個內核。如果您使用雙核或四核虛擬CPU(vCPU)運行大部分虛擬機,則必須考慮這些要素。
通過使用具有四個vCPU的四核虛擬機,您企業(yè)最初計算所需的96臺虛擬機現(xiàn)在可以減少到24臺虛擬機,但該公式可以進一步減少虛擬機的數(shù)量。假定一個核心的四臺虛擬機的使用范圍為0%至50%,平均每個核心的虛擬機為25%。但是,如果應用程序的需求使您的平均水平接近50%,那怎么辦?這將使得您的每個內核的虛擬機平均值從四個變?yōu)閮蓚,同時從每個機架式服務器最初估計的96臺虛擬機縮減到12臺虛擬機。
CPU就緒時間的度量
這是一個很大的范圍覆蓋。哪種計算是對的:12臺虛擬機還是96臺虛擬機?答案是兩者都對。過度使用是一條流暢的線路,數(shù)學計算只能給您提供一個合適的范圍。監(jiān)控才是真正的關鍵。具體來說,企業(yè)要關注CPU就緒時間。這個值是您處理CPU過度使用時最好的朋友。CPU就緒值是您的虛擬機準備使用CPU的時間量,但不能因為CPU資源正在被其他方面所使用。如果您的虛擬機具有少于2%至3%的CPU就緒時間,則您的虛擬機可以隨時訪問CPU資源。如果該值增加到5%或更高,您的虛擬機將變得CPU限制。一旦您的CPU就緒時間達到了兩位數(shù)(10%或更高),您就會遇到麻煩。在這一點上,您將需要減少主機上的工作負載,否則最終會出現(xiàn)重大的性能問題。雖然CPU就緒時間是僅適用于VMware vSphere用戶的度量標準,但其常規(guī)前提適用于所有環(huán)境。
隨著可能的爭論和CPU就緒時間的上升,使得企業(yè)有機會利用共享和資源池。需要記住的一點是,由過度配置所帶來的共享和資源池可能不會給您企業(yè)帶來額外的免費資源。是的,您可以增加某些虛擬機的可用資源,但是會對其他虛擬機造成損失。請記住,過度使用的性質使得資源被爭用成為可能。
并非所有被創(chuàng)建的虛擬機的重要性都相同的。在構建虛擬基礎架構時,企業(yè)計劃對CPU資源進行過度使用。平衡CPU資源緊張的虛擬機與具有較低需求的虛擬機;以及關鍵任務虛擬機與具有低處理優(yōu)先級的虛擬機。通過設置虛擬機的共享值或利用資源池,您企業(yè)可以允許生產服務器在爭用資源期間從較低優(yōu)先級的虛擬機提取資源。
如果您企業(yè)不是在同一臺服務器上混用虛擬機,那么在需要的時候,您無法擠壓額外的資源,因為每項工作負載都至關重要。如果您企業(yè)承受不起過度使用,資源可能會被無效地利用。過度使用是安全的,只需借助“CPU就緒時間”作為您的指南,并注意虛擬機的設置,以便您可以根據需要提取其他資源。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/
本文標題:企業(yè)虛擬機配置的最佳方案
本文網址:http://www.ezxoed.cn/html/solutions/14019321355.html