某單位負(fù)責(zé)多個應(yīng)用與管理系統(tǒng)的運(yùn)維。隨著三集五大體系的建設(shè)和電力信息化步伐的加快,一方面,越來越多的業(yè)務(wù)和應(yīng)用系統(tǒng)將在電科院上線運(yùn)行,另一方面,許多涉及海量數(shù)據(jù)運(yùn)算的系統(tǒng)對服務(wù)器性能提出了更高的要求,致使該單位對服務(wù)器數(shù)量需求將會持續(xù)增長,服務(wù)器資源越將日益緊張。
據(jù)統(tǒng)計,該單位現(xiàn)有用電信息采集、雷電定位、OA辦公、檔案管理等各種系統(tǒng)34套,使用近60臺PC服務(wù)器和2臺存儲設(shè)備,分布在10個機(jī)柜中。通過統(tǒng)計分析發(fā)現(xiàn),系統(tǒng)絕大多數(shù)采用單一的物理部署模式,即每套系統(tǒng)占用1臺服務(wù)器資源。這種部署模式存在以下問題:
1)服務(wù)器資源利用率不均衡。目前有近80%的業(yè)務(wù)系統(tǒng)存在負(fù)載低、資源浪費(fèi)的情況,這些系統(tǒng)的CPU資源平均利用率低于15%,內(nèi)存利用率低于40%,磁盤利用率低于50%。同時,根據(jù)運(yùn)維過程中的統(tǒng)計數(shù)據(jù)分析,少數(shù)的高負(fù)載的核心應(yīng)用,例如電能量系統(tǒng)、數(shù)據(jù)庫系統(tǒng)等存在計算資源長期高位負(fù)載,計算資源捉襟見肘,影響應(yīng)用及服務(wù)的性能及可靠性。
2)服務(wù)器計算資源存在顯著的數(shù)據(jù)安全隱患。由于前期建設(shè)投入有限,未對信息系統(tǒng)進(jìn)行高可用性設(shè)計,因此即使進(jìn)行了全面的數(shù)據(jù)備份及數(shù)據(jù)管理,也依然存在系統(tǒng)宕機(jī)后造成的系統(tǒng)服務(wù)不可用,無法保證業(yè)務(wù)連續(xù)性的風(fēng)險。目前僅能提供數(shù)據(jù)完整性的系統(tǒng)恢復(fù),其恢復(fù)時間取決于數(shù)據(jù)備份的容量及恢復(fù)數(shù)據(jù)規(guī)模大小,因此造成小時級別以上的服務(wù)中斷。為了滿足高級別的高可用性RTO(應(yīng)用故障切換時間)效率,構(gòu)建消滅單點(diǎn)故障的服務(wù)器資源整合平臺顯得尤為重要。
3)人力和運(yùn)作成本較高。為了保障現(xiàn)有60臺服務(wù)器穩(wěn)定可靠運(yùn)行,至少需要在網(wǎng)絡(luò)、信息系統(tǒng)和機(jī)房3個方面各配備6名運(yùn)維人員。導(dǎo)致電科院負(fù)責(zé)信息運(yùn)維的人力資源明顯緊張。現(xiàn)有服務(wù)器資源的利用率不高,造成數(shù)據(jù)中心空間、機(jī)柜、網(wǎng)線,耗電量,冷氣空調(diào)等成本存在浪費(fèi)問題。
基于以上情況,為了提升服務(wù)器利用率,提高系統(tǒng)安全可靠性,降低運(yùn)維成本,亟需開展虛擬化技術(shù)研究和實踐,借助虛擬化技術(shù)對現(xiàn)有的服務(wù)器資源進(jìn)行整合,打造高效可靠的虛擬化應(yīng)用平臺,為該單位數(shù)據(jù)中心的建設(shè)奠定技術(shù)和實踐基礎(chǔ)。
1 系統(tǒng)總體結(jié)構(gòu)設(shè)計
服務(wù)器虛擬化技術(shù)是當(dāng)前IT行業(yè)應(yīng)用非常廣泛的信息技術(shù),它通過將傳統(tǒng)物理資源抽象成邏輯資源,讓1臺服務(wù)器可以同時作為多臺邏輯上隔離的虛擬服務(wù)器,將CUP、內(nèi)存、磁盤、I/O等硬件資源池化,實現(xiàn)物理資源統(tǒng)一動態(tài)管理。通過服務(wù)器虛擬化不僅可以整合現(xiàn)有硬件資源,提高信息安全水平,同時降低數(shù)據(jù)中心的運(yùn)行和維護(hù)成本。
VMware虛擬架構(gòu)技術(shù)是目前最為流行的PC服務(wù)器虛擬化技術(shù),全球擁有超過2萬個公司用戶,以及400萬個最終用戶,其VMware vSphere軟件提供了服務(wù)器資源整合的全套解決方案。該技術(shù)可以實現(xiàn)虛擬機(jī)在不同物理機(jī)之間的無中斷動態(tài)遷移,把VMware虛擬架構(gòu)套件產(chǎn)生的虛擬服務(wù)器封裝成虛機(jī)文件并統(tǒng)一存放。并通過共享的sAN存儲架構(gòu),實現(xiàn)資源的統(tǒng)一調(diào)度管理。
VMware服務(wù)器虛擬架構(gòu)的優(yōu)勢技術(shù)主要體現(xiàn)在:
1)高可用集群技術(shù):實現(xiàn)服務(wù)器重啟和故障的自動切換。
2)動態(tài)資源調(diào)度技術(shù):通過動態(tài)調(diào)度資源池中的硬件資源,實現(xiàn)計算資源的自動分配和平衡。
3)虛擬平臺Vmotion技術(shù):在服務(wù)不中斷的條件下,實現(xiàn)服務(wù)器的動態(tài)遷移。
1.1高可用集群技術(shù)
服務(wù)器隨時可能會發(fā)生網(wǎng)絡(luò)故障、硬件故障、軟件故障,造成系統(tǒng)的可用性造成影響。VMware通過高可用集群技術(shù)來保障企業(yè)級應(yīng)用的微間斷運(yùn)行。首先在存儲層面上,VMware通過虛擬化集群文件系統(tǒng)(VMware vStorage Virtual Machine FileSystem,簡稱VMFS)構(gòu)建共享的虛機(jī)文件集合,該集合是虛擬化高可用基礎(chǔ)。通過虛擬化集群文件系統(tǒng),可以確保進(jìn)行虛擬環(huán)境交叉訪問時,保證數(shù)據(jù)的完整性和可靠性。其次,在VMware虛擬架構(gòu)中,利用VMware High Availability(簡稱HA)技術(shù),達(dá)到物理機(jī)故障的自動切換要求,主要原理為ESX主機(jī)之間能夠相互發(fā)送心跳信號來確定相互之間的連通性和運(yùn)行狀態(tài)。當(dāng)某臺ESX主機(jī)A沒有收到主機(jī)B的信號時,則判斷主機(jī)B發(fā)生了軟硬件故障或者網(wǎng)絡(luò)故障。在這種情況下,系統(tǒng)將會自動解除對主機(jī)B上虛擬機(jī)的VMDK文件解除鎖定,原本在主機(jī)B上運(yùn)行的虛擬機(jī)就會被自動遷移到其他主機(jī)上運(yùn)行。最后,VMware架構(gòu)使用容錯技術(shù)(VMware Fault Tolerance)來輔助HA實現(xiàn)完整的業(yè)務(wù)連續(xù)性。其工作原理為:對于給定的主虛擬機(jī)A,在其他ESX主機(jī)上運(yùn)行一個輔助虛擬機(jī)A',輔助虛擬機(jī)與主虛擬機(jī)共享虛擬磁盤,通過發(fā)送的日志記錄信息保持“虛擬同步”,當(dāng)輔助虛擬機(jī)沒有接收到同步信息時,輔助虛擬機(jī)將在無中斷的情況下接管并運(yùn)行應(yīng)用程序,實現(xiàn)故障的透明切換。容錯技術(shù)是迄今為止服務(wù)器虛擬化技術(shù)中最高級別的業(yè)務(wù)連續(xù)性保障策略,可以花費(fèi)最小的代價得到最高的可靠性要求。
1. 2計算資源動態(tài)調(diào)度技術(shù)
計算資源的動態(tài)調(diào)度又稱為分布式資源調(diào)度(Distributed Resource Scheduler, DRS)技術(shù)。通過DRS技術(shù),虛擬機(jī)能夠在不同的物理服務(wù)器之間根據(jù)負(fù)載,自動調(diào)度邏輯資源,達(dá)到平衡計算容量目的,同時可以根據(jù)業(yè)務(wù)需求來調(diào)整資源,提供物理基礎(chǔ)結(jié)構(gòu)所不能提供擴(kuò)展性和可用性。
VMware DRS工作原理如圖1所示,首先由用戶定義虛擬機(jī)的資源共享方式,可分為自動模式和手動模式。在自動模式下,DRS自行判斷決定物理服務(wù)器之間資源的最佳分配方式,并透明地將虛擬機(jī)遷移到最合適的服務(wù)器上。在手動模式中,VMware DRS為系統(tǒng)管理員提供一套虛擬機(jī)最優(yōu)配置方案,由管理員決定是否根據(jù)該方案對虛擬機(jī)進(jìn)行調(diào)整。資源共享方式配置完成后,DRS持續(xù)不斷地監(jiān)控資源池的利用率,當(dāng)某臺虛擬機(jī)的工作量增加,需要更多的計算資源時,VMware DRS根據(jù)之前定義的資源分配規(guī)則對虛擬機(jī)的優(yōu)先權(quán)進(jìn)行評估,如果該虛擬機(jī)通過了評估,則將此虛擬機(jī)遷移到另外一臺具有更多合適資源的服務(wù)器上,從而為它分配更多的邏輯資源。
圖1 VMware DRS動態(tài)資源調(diào)配示意圖
隨著虛擬化技術(shù)的發(fā)展,出現(xiàn)了分布式電源動態(tài)管理(Distributed Power Manager,即DPM)技術(shù)。DPM是DRS的一個組成部分,它可以讓服務(wù)器在負(fù)載較低的時候動態(tài)整合計算資源,將工作負(fù)載遷移到最少的服務(wù)器資源上,關(guān)閉不需要的服務(wù)器,從而大幅降低能耗。
1. 3虛擬平臺Vmotion技術(shù)
VMware通過Vmotion技術(shù),能夠?qū)⒄谶\(yùn)行的虛擬機(jī)能夠從一臺物理服務(wù)器瞬間遷移到另一臺服務(wù)器,達(dá)到零停機(jī)的性能要求,實現(xiàn)業(yè)務(wù)的連續(xù)性,從而能夠大幅度提高服務(wù)器的可用性和保證數(shù)據(jù)的完整性。首先,虛擬機(jī)的全部狀態(tài)信息在共享存儲中以虛擬機(jī)文件進(jìn)行封裝,多臺ESX服務(wù)器同時訪問同一個虛擬機(jī)文件。其次,VMware通過一個高速的網(wǎng)絡(luò),將源虛擬機(jī)的整個內(nèi)存和狀態(tài)信息復(fù)制和傳輸?shù)侥繕?biāo)ESX服務(wù)器后,自動終止源虛擬機(jī),并在目標(biāo)ESX服務(wù)器中重新啟動虛擬機(jī)。最后,源虛擬機(jī)的網(wǎng)絡(luò)標(biāo)識和連接也會被目標(biāo)ESX服務(wù)器虛擬化,在實時遷移之后,源虛擬機(jī)的網(wǎng)絡(luò)身份和連接能夠得到保留。
2 服務(wù)器資源整合方案的設(shè)計與實現(xiàn)
根據(jù)對某單位數(shù)據(jù)中心服務(wù)器硬件、網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、軟件及應(yīng)用的統(tǒng)計分析,提出了以下設(shè)計思路:首先,針對服務(wù)器計算資源利用率問題,通過對硬件型號、硬件配置、利用率情況、軟件部署分布、性能負(fù)載等情況進(jìn)行統(tǒng)計分析。根據(jù)統(tǒng)計結(jié)果,將計算資源調(diào)整部署到各個需要的應(yīng)用和服務(wù)上,最終達(dá)到使得每臺物理服務(wù)器的CPU/內(nèi)存資源利用效率達(dá)到75%以上的目的。其次,針對單點(diǎn)故障產(chǎn)生的數(shù)據(jù)安全隱患問題,采用分步實施的策略,實現(xiàn)業(yè)務(wù)連續(xù)性基礎(chǔ)上的應(yīng)用安全。第1步,將現(xiàn)有的數(shù)據(jù)備份和服務(wù)器整合結(jié)合起來,構(gòu)建一個將RTO時間從4h以上縮短為1h以內(nèi)的數(shù)據(jù)安全環(huán)境;第2步,將給予單點(diǎn)故障榮譽(yù)設(shè)計和數(shù)據(jù)容錯可追溯作為特色,構(gòu)建健壯和安全的數(shù)據(jù)中心,使之滿足數(shù)據(jù)一致性、完整性、高可靠性的精細(xì)化管理的要求規(guī)范。最后,將物理服務(wù)器有效地進(jìn)行計算資源整合,對符合條件的物理機(jī)進(jìn)行虛擬化,騰出若干服務(wù)器槽位,節(jié)省出至少1臺機(jī)柜的槽位空間。完成虛擬化后,對物理服務(wù)器按照業(yè)務(wù)或部門系統(tǒng)的分類,將不同的機(jī)柜資源進(jìn)行有效貼標(biāo),提升數(shù)據(jù)中心的服務(wù)器資源利用率以及可靠性管理水平。
2.1資源需求估算
該服務(wù)器虛擬化整合項目是將10臺資源利用率較低或者計算資源需求較高的服務(wù)器,采用P2V模式,遷移到2臺性能相對較高的宿主服務(wù)器上。在遷移之前需要統(tǒng)計該10臺服務(wù)器的總CPU需求、總內(nèi)存需求、總網(wǎng)絡(luò)IO需求、總磁盤IO需求等資源需求總量。根據(jù)此需求量,再選擇合適的物理服務(wù)器作為整合后的宿主服務(wù)器。由于本項目采用千兆網(wǎng)卡作為虛擬交換機(jī),并選擇千兆SAN交換機(jī)連接存儲,所以可以保證虛擬化架構(gòu)中的網(wǎng)絡(luò)IO需求和磁盤IO需求,即不需要再對磁盤和網(wǎng)絡(luò)做詳細(xì)論證,而重點(diǎn)介紹CPU和內(nèi)存的選型計算過程。
在服務(wù)器虛擬化后,可以實現(xiàn)在較少的物理服務(wù)器上運(yùn)行多臺虛擬服務(wù)器。假設(shè)需要運(yùn)行的虛擬服務(wù)器的數(shù)量為n,每臺服務(wù)器的CPU內(nèi)核數(shù)量為C,速度為V GHz, CPU利用率為f,則CPU資源需求K為:
2. 2虛擬化平臺的搭建
本項目所遷移的10臺服務(wù)器的資源如表1所示,根據(jù)式(1)和式(2),計算得出CPU的資源需求不足6 GHz,內(nèi)存需求不足8 GB,所以本項目采用2臺高性能的DELL 8710和8900機(jī)器作為虛擬化服務(wù)器,其配置為分別為4核CPU 2. 13GHz、內(nèi)存2. 13 GHz和2核2. 4 GHz、內(nèi)存:16GB。虛擬平臺軟件版本為ESXI 4. 1,使用1套IBM DS5100作為共享存儲,并為之分配3T的VMFS磁盤空間,使用1臺SAN交換機(jī)和2臺思科網(wǎng)絡(luò)交換機(jī)實現(xiàn)平臺的互聯(lián)互通。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:VMware+Esxi虛擬化技術(shù)在電力信息資源整合中的應(yīng)用(上)
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112158182.html