當(dāng)一家數(shù)據(jù)中心的運行達(dá)到其極限時,其所屬的企業(yè)組織必然要作出一些重大的決定;〞r間來為接下來可能會發(fā)生的任何狀況進(jìn)行規(guī)劃,并考慮采取一些溫和的、且成本便宜的升級和調(diào)整方案措施。
無需徹底大修的前提下改善數(shù)據(jù)中心
很少有企業(yè)組織會熱衷于花費大量資金和時間來為他們的數(shù)據(jù)中心實施重大升級。一家企業(yè)組織需要認(rèn)真考慮如何,甚至是否需要建立一處主要的數(shù)據(jù)中心的舉措。但是,在此期間,企業(yè)內(nèi)部的IT團(tuán)隊?wèi)?yīng)該做些什么呢?重大決策的制定將需要時間,但基礎(chǔ)設(shè)施仍然需要保持運行。畢竟,企業(yè)業(yè)務(wù)的運行依賴于此。
這將IT決策者們放在了一個需要延長舊的數(shù)據(jù)中心的使用年限,并同時需要對數(shù)據(jù)中心的其他更大的問題進(jìn)行梳理的位置。
為此,數(shù)據(jù)中心專家羅伯特。麥克法蘭專門撰寫了本文,以便為我們廣大讀者朋友們介紹數(shù)據(jù)中心企業(yè)組織所能夠采取的、同時又不會產(chǎn)生重大成本費用的相關(guān)措施。麥克法蘭尤其建議企業(yè)組織的數(shù)據(jù)中心將他們的目標(biāo)瞄準(zhǔn)那些尚未被充分利用的資源:數(shù)據(jù)中心的那些服務(wù)器是否被用來充分發(fā)揮了作用了呢?而借助電力供應(yīng),IT人員應(yīng)該查看電池的平衡狀態(tài)。此外,在某些情況下,行內(nèi)冷卻機(jī)組所使用的戰(zhàn)略可以緩解設(shè)施的冷卻問題。
另外,在本文中,來自TechTarget網(wǎng)站的斯蒂芬。畢格羅也同樣為我們分析了企業(yè)的IT團(tuán)隊可以用來提高數(shù)據(jù)中心的性能,而無需投入大量的時間和資金的一系列的方式。例如,為一臺服務(wù)器的本地存儲添加固態(tài)硬盤,可以清除瓶頸并中止錯誤。而與此同時,可以以很小的成本安裝傳感器,而無需耗費太多的精力。
這些舉措并不會解決當(dāng)一家數(shù)據(jù)中心在接近其效用的最后終點時,應(yīng)該如何處理的更大的問題,但這些舉措確實能夠為企業(yè)組織規(guī)劃其未來的IT基礎(chǔ)設(shè)施贏得更多的時間。
對一處老舊的數(shù)據(jù)中心實施簡單的修復(fù)和升級
當(dāng)您企業(yè)的數(shù)據(jù)中心耗盡了其空間,電力或冷卻資源時,您將需要做出一些困難的決定。而如果您企業(yè)的業(yè)務(wù)在未來幾年內(nèi)可能會被遷移;或者關(guān)于您企業(yè)的某些計算最終將會轉(zhuǎn)移到云服務(wù)或托管站點的討論的話,那么,關(guān)于這些決定的商議就變得更具挑戰(zhàn)性了。這些決定是至關(guān)重要的,其絕不屬于那種您想要靠拍腦袋就匆忙做出的決定。畢竟,一家企業(yè)組織所做出的選擇,可能涉及到極其昂貴的資本支出和運營效率。
但是,盡管這些長期性的決定正在被思索和衡量,但企業(yè)內(nèi)部的IT團(tuán)隊仍然承擔(dān)著短期的負(fù)擔(dān):他們需要保證數(shù)據(jù)中心的正常運行,而且還必須可靠地支持用戶。
那么,哪些措施才是現(xiàn)實可行的呢?哪些措施才能讓企業(yè)組織的數(shù)據(jù)中心以最小的投資實現(xiàn)獲益的最大化呢?而同樣重要的是,哪些措施會是最不具破壞性的呢?總之,您企業(yè)組織的數(shù)據(jù)中心如何才能找到最經(jīng)濟(jì)、最有效的短期內(nèi)的方法呢?
在本文中,我們將為廣大讀者朋友們介紹一套較為合理的策略,來幫助您首先對您數(shù)據(jù)中心進(jìn)行梳理,然后逐步修復(fù),最后再分階段實行的相關(guān)步驟。
1、移除不應(yīng)該存在的設(shè)備
如果一家數(shù)據(jù)中心的運行已經(jīng)達(dá)到其容量能力的極限了,那么,其IT工作人員可能會關(guān)閉并刪除那些無用的服務(wù)器。
下一步是質(zhì)疑任何顯示了低利用率的設(shè)備的重要性。例如,也許其利用率僅為10%.那么,便可以看看這些設(shè)備是否可以被虛擬化。或者也許這些設(shè)備也可以被盡數(shù)銷毀。如果其支持一款單一的應(yīng)用程序,而有一位用戶仍然認(rèn)為其運作“良好”的話,那么,可能需要花時間來與之進(jìn)行一次嚴(yán)肅的談話了。畢竟,當(dāng)一處數(shù)據(jù)中心的運行容量已經(jīng)達(dá)到其極限時,其已經(jīng)完全沒有必要再容納不必要的設(shè)備了。另外,這些措施也能為數(shù)據(jù)中心進(jìn)一步降低功耗帶來一定的效益。
當(dāng)您在查看數(shù)據(jù)中心的硬件設(shè)備時,務(wù)必要清理硬件設(shè)備的空氣過濾器,并確保電纜沒有阻塞排氣通道。這些簡單的步驟幾乎沒有任何成本,但卻可以幫助您數(shù)據(jù)中心大大提高冷卻效率,延長設(shè)備的使用壽命。如果您的數(shù)據(jù)中心存放有廢舊紙箱或其他不必要的東西,請務(wù)必要盡快處理他們,因為這些東西會造成更多的污垢灰塵堆積,進(jìn)而重新堵塞過濾器,并降低冷卻效率。
如果您企業(yè)組織的數(shù)據(jù)中心是通過通路活動地板來輸送空氣的話,請移除那些未使用的電纜。這項工作是不容易的,但您并不需要一個資本預(yù)算授權(quán)來執(zhí)行這項工作。而您可能會驚訝于這項工作的執(zhí)行所帶來的冷卻性能的前后差異。
而聘請專業(yè)的數(shù)據(jù)中心清潔服務(wù)可能是值得的。一款清潔的設(shè)施所能夠為設(shè)備運行和功耗帶來的效益將會是相當(dāng)驚人的。
2、修復(fù)了剩下的設(shè)備
當(dāng)您企業(yè)的數(shù)據(jù)中心運行接近其極限時,那么沒有什么比良好的預(yù)防性維護(hù)更為重要的了。即使這可能意味著超出了服務(wù)合同條款的特別服務(wù),也務(wù)必要充分考慮這一點。確保一切設(shè)施都在其最高性能狀態(tài)下運行可能帶來額外的費用。
更換空調(diào)過濾器。檢查所有的皮帶和軸承,確認(rèn)所有相關(guān)的一切都是干凈的。您的供應(yīng)商應(yīng)該有一套徹底的維修檢查清單,就像一名汽車機(jī)械師對汽車的維修檢查一樣。確保供應(yīng)商完全遵循該清單進(jìn)行歷次的維修檢查。而如果您企業(yè)的數(shù)據(jù)中心的運行確實已經(jīng)接近其極限邊緣,而同時又負(fù)擔(dān)不起關(guān)閉空調(diào)服務(wù)以進(jìn)行維修,那么您企業(yè)不妨選擇租用便攜式的冷卻設(shè)施,以助您渡過難關(guān)。
不間斷電源(UPS)的電池可能是數(shù)據(jù)中心最容易出現(xiàn)故障運行失敗的項目,而究其原因則是因為他們最被需要。閥控式鉛酸蓄電池(VRLA)只能維持幾年的時間,因此,如果這些電池的使用時間已經(jīng)超過三到五年了,那么,替換掉這些電池?zé)o疑是一個好主意。
在對您企業(yè)數(shù)據(jù)中心的UPS實施預(yù)防性維護(hù)之前,請務(wù)必先更換UPS或添加容量,檢查相位平衡(phasebalance)。您有可能獲得比您想象的更多的可用功率。
大型的UPS系統(tǒng)(一般在20千瓦及以上)是三相的。這意味著有三條“熱”的線纜,但幾乎所有的機(jī)柜和設(shè)備都只連接到這些相線中的一條或兩條。在美國,208伏的電路從三相電線中的任兩條獲得電源。在美國的一款120伏電路以及在歐洲的230伏線路,從任一一條相線外加一條零線獲得供電。其結(jié)果是,可以很容易地加載一個或兩個相位來接近容量,留下很少的負(fù)載連接到剩余的相位。
前面板的顯示屏可以告訴您每一相的負(fù)載,但一般的顯示將僅根據(jù)最壞情況的相位顯示負(fù)載百分比。因此,如果相位是失去了平衡,您的顯示器將顯示98%的利用率,即使20%到30%的容量能力仍然可用,且未使用。盡可能再平衡相位(目標(biāo)是在5%以內(nèi))可以從現(xiàn)有的UPS解開額外顯著的電源消耗,從而幾乎不花成本就解決了在潛力的過載問題。
在任何未使用過的機(jī)架和機(jī)柜空間安裝沖裁板,以停止昂貴的冷卻空氣的浪費。卡入式面板可以帶來冷卻效率的巨大差異。同樣地,可擴(kuò)展面板可以關(guān)閉機(jī)柜之間的縫隙,而現(xiàn)在的產(chǎn)品甚至可以密封機(jī)柜底部和地板之間的空間。
3、制定補充戰(zhàn)略
只有在上述的所有這一切工作都已經(jīng)完成后,才應(yīng)該考慮增加主要設(shè)備的問題。
如果您企業(yè)的數(shù)據(jù)中心需要更多的UPS容量,不妨可以考慮使用更小的、機(jī)架內(nèi)UPS單元。這些將是有益的,但只有當(dāng)需要的額外UPS容量是最小量的時候。即使這意味著只是一個短期的解決方案,也請使用商業(yè)級的UPS單元。每隔幾個月檢查一下這些小單元的電池,并注意他們的警報。
如果您企業(yè)的數(shù)據(jù)中心需要更多的冷卻散熱能力,那么,行級冷卻器(in-rowcooler,IRC)可能是比大型機(jī)房空調(diào)(CRAC)或空氣處理器(CRAH)更好的選擇,特別是如果現(xiàn)有的冷卻空氣是通過在地板下送風(fēng)的話。增加CRAC可能會使得更多的空氣進(jìn)入地板下,從而超出了地板充氣空間所能夠容納的空氣量,并可能由于地板的阻礙作用而增大了壓力。此外,空氣流會相互干擾,實際上降低了某些區(qū)域的冷卻效果,而并沒有改善它。
行級冷卻器被安置在機(jī)柜之間,并在機(jī)柜前的最高熱負(fù)載處直接提供冷空氣。進(jìn)一步的改善可以通過將那些具有較高的熱輸出的設(shè)備重新定位安置到高密度的機(jī)柜配置,從而降低數(shù)據(jù)中心的其他部分的負(fù)荷。另一種選擇是通過采用后門熱交換器(RDHxs),其能夠在熱空氣離開機(jī)柜前中和熱量。這兩種方案都需要冷卻水或地板外的制冷劑管道,這當(dāng)然會給數(shù)據(jù)中心帶來一些顯著的、以及潛在破壞性的安裝工程。但這些方法的優(yōu)點是,它們可以通過規(guī)劃其大小和安裝位置,以解決特定的需要。能夠?qū)⒅饕ぷ飨拗频揭粋小部分的區(qū)域,并最大限度地減少了需要購買的新設(shè)備的數(shù)量。
如果冷卻仍然是一個問題,那么則可以考慮補充加入密封遏制(Containment)。冷通道密封遏制(Cold-aislecontainment)對現(xiàn)有設(shè)施的改造通常是更好的選擇,但對于空氣的均衡也是難以控制的。熱通道遏制則避免了空氣均衡的問題,但它需要一個回風(fēng)路徑以返回到空調(diào)機(jī)。這是IRC的一個固有的設(shè)計,但如果您企業(yè)數(shù)據(jù)中心不是已經(jīng)在天花板有一個回風(fēng)壓力通風(fēng)系統(tǒng)返回到CRAC的話,其將是較為困難的。
較之實心的空氣阻擋門和面板,塑料窗簾在現(xiàn)有的空間更容易部署實現(xiàn)。他們允許漏風(fēng),這可以解決冷通道密封所帶來的空氣均衡的挑戰(zhàn)。但是,采用塑料可能不符合防火和煙霧排放的要求。
固體密封遏制,使用列末門和上述機(jī)柜板,可能更難以在現(xiàn)有的空間來部署實現(xiàn),但其要比塑料窗簾能夠提供更完整的密封遏制。在冷通道密封遏制的空氣平衡將是具有挑戰(zhàn)性的,通常意味著設(shè)計需要允許一些縫隙泄漏的存在,以避免問題。
此外,關(guān)于密封遏制,有重要的消防保護(hù)方面的考慮。如果灑水噴頭或排氣壓頭不在每個通道中,密封遏制可能會將一個通道與滅火劑隔離,而這是非法的。美國防火標(biāo)準(zhǔn)要求保護(hù)壁壘下降后自動實施煙霧檢測(不讓熔線因?qū)嶋H火災(zāi)而遇熱融化),而下降的保護(hù)壁壘會落入通道,而不會阻礙緊急疏散。為了解決這些問題,最好的辦法是重新配置火災(zāi)保護(hù)方案,但這樣可能是成本昂貴且具有破壞性的,可能不適合一個現(xiàn)實可行的短期設(shè)施規(guī)劃方案。
當(dāng)面對要將一處現(xiàn)有的數(shù)據(jù)中心的使用壽命延長幾年的需求時,第一步的措施可能會是那些您企業(yè)原本應(yīng)該一直都在采取,但到此刻為止才被迫開始采取的措施。
企業(yè)為修理一處即將報廢的設(shè)施而批準(zhǔn)龐大的預(yù)算將是很難的,而且應(yīng)該很少是必要的。當(dāng)確實是必要的時候,解決方案在本質(zhì)上需要是模塊化的,只提供必要的,并且是以最低的成本和盡可能不發(fā)生中斷。
除非絕對必要,否則千萬不要添加主要的設(shè)備。這種工作的成本將是相當(dāng)昂貴的,而且對于現(xiàn)有的系統(tǒng)是危險的,并可能會產(chǎn)生新的問題,而不是解決現(xiàn)有的問題。
將電纜、傳感器、硬盤的升級列入您企業(yè)的待辦事項清單
并不是每一個IT基礎(chǔ)設(shè)施項目都是耗時的,資本密集型的,會給企業(yè)帶來顛覆性影響的。讓我們來看看一些可以幫助您企業(yè)支撐一處數(shù)據(jù)中心的簡單的且成本低的工作任務(wù)吧。
1、升級現(xiàn)有的硬件
對于數(shù)據(jù)中心內(nèi)存和本地硬盤的戰(zhàn)略型升級有助于提高服務(wù)器的性能容量。內(nèi)存是虛擬化的一個限制資源,而服務(wù)器很少配備了全套板載。盤點您企業(yè)數(shù)據(jù)中心未使用的插槽,并為現(xiàn)有的虛擬機(jī)添加內(nèi)存,以幫助或適應(yīng)未來的服務(wù)器整合。
固態(tài)硬盤(SSD)是對戰(zhàn)略性服務(wù)器的一種本地磁盤存儲升級。固態(tài)硬盤改善了I/O和更低的延遲性,是敏感的工作負(fù)載存儲帶寬的理想選擇。如果一臺服務(wù)器上的工作負(fù)載依靠磁盤緩存,固態(tài)硬盤可以加速其性能。無需撕裂和更換所有磁盤驅(qū)動器,僅僅只需將一款固態(tài)硬盤添加到一臺服務(wù)器的本地存儲,以清除瓶頸和停止錯誤。
升級服務(wù)器固件是快速且免費的,但也具有破壞性。執(zhí)行這類升級只能解決諸如硬件或操作系統(tǒng)支持等具體的問題。清查盤點您企業(yè)數(shù)據(jù)中心的資產(chǎn),并列出一份當(dāng)前的服務(wù)器型號和固件版本的清單列表;然后檢查服務(wù)器供應(yīng)廠商的更新網(wǎng)站以下載最新的更新。通過細(xì)節(jié)或發(fā)布的更新說明確定這些更新是否能夠真正解決問題。外設(shè)接口和適配器設(shè)備也有可能需要更新固件。
內(nèi)存和磁盤升級意味著出現(xiàn)停機(jī)時間(除非采用熱插拔)和重新配置機(jī)架。“內(nèi)存升級是成本便宜且有效的,但…這不完全是就地升級(in-placeupgrade)。”網(wǎng)絡(luò)自動化技術(shù)開發(fā)商6connect公司的首席運營官兼聯(lián)合創(chuàng)始人PeteSclafani表示說。因此企業(yè)不妨在計劃的服務(wù)器停機(jī)時間內(nèi)執(zhí)行內(nèi)存和SSD升級。
磁盤容量是昂貴的,您企業(yè)可以通過刪除不必要的內(nèi)容或通過將數(shù)據(jù)遷移到較低的存儲層來防止大容量的增加。例如,不必要的數(shù)據(jù)所帶來的大量臨時目錄,可以在服務(wù)器和存儲子系統(tǒng)的/tmp和c:/temp目錄下清除。
嘗試為薄存儲部署使用一個零字節(jié)回收。“零寫入到所有已分配但未使用的空間。”位于加州阿納海姆山的一家云平臺提供商ReachIPS公司的IT運營總監(jiān)TimNoble表示說。服務(wù)器分配的一個零字節(jié)回收,永不需要存儲,從而釋放了陣列的空間。
2、重新布線
隨著網(wǎng)絡(luò)帶寬達(dá)到10千兆以太網(wǎng)(GigE),25千兆以太網(wǎng),甚至更快,這意味著1千兆以太網(wǎng)的老化類別的5和5e銅布線基礎(chǔ)設(shè)施已經(jīng)無法應(yīng)付新的數(shù)據(jù)中心的要求了。
即使為更高的帶寬網(wǎng)絡(luò)選擇了合適的硬件,也可能缺乏線纜。“人們往往忘記,當(dāng)物理網(wǎng)絡(luò)設(shè)備升級后,您企業(yè)網(wǎng)絡(luò)的布線可能無法充分利用,”Sclafani表示說。不要一下子撤掉所有老化的線纜;以太網(wǎng)線纜完全向后兼容。當(dāng)時間和預(yù)算允許時,在更快的線纜方面做出相對較小的,增量投資。
服務(wù)器將仍然保持在10千兆位以太網(wǎng),所以企業(yè)數(shù)據(jù)中心應(yīng)著眼于重點骨干網(wǎng)絡(luò),特別是基于以太網(wǎng)的iSCSI和以太網(wǎng)光纖通道存儲陣列。例如,6類線纜可以支持10千兆位至55米,而6A類線纜和7類線纜則可以處理10千兆至100米,無需新的網(wǎng)絡(luò)適配器、交換機(jī)或其它組件。
3、添加傳感器
如果您無法衡量它,您就無法對其實施管理。數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)工具則能夠監(jiān)控復(fù)雜設(shè)施的電氣和環(huán)境行為。
DCIM需要在數(shù)據(jù)中心范圍內(nèi)有策略地放置傳感器。這些工具可以針對情境事件自動觸發(fā)響應(yīng),如當(dāng)某臺服務(wù)器變得太熱時遷移工作負(fù)載;或在冷卻循環(huán)中出現(xiàn)水分泄漏時發(fā)出探測警報。傳感器的缺失或不足或?qū)?dǎo)致輸入缺口。
哪些傳感器是不可或缺的?
.溫度傳感器定位在機(jī)架和行內(nèi)的熱點位置。
.濕度傳感器真對過于干燥的空氣或冷凝水平損壞發(fā)出警告。
.當(dāng)冷卻水在熱交換器或機(jī)架上循環(huán)流通時,水分(液體)傳感器是必不可少的。
.能源使用狀況的實時監(jiān)控。
.空氣流傳感器確保風(fēng)扇和過濾器的暢通運轉(zhuǎn)。
.運動探測器檢測入侵者,并觸發(fā)安全警報和相機(jī)拍照。
.煙霧/火警傳感器保護(hù)數(shù)據(jù)中心寶貴的資產(chǎn)和生命。
.
RFID標(biāo)簽有助于自動化硬件庫存控制。
新的傳感器很容易安裝。此外,它們可以逐漸增加,從而分散了成本。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:延長數(shù)據(jù)中心使用年限的低成本方法
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839619682.html