信息技術(shù)的迅猛發(fā)展使得數(shù)據(jù)存儲量呈爆炸式增長,數(shù)據(jù)量的激增又導(dǎo)致數(shù)據(jù)中心的規(guī)模不斷擴(kuò)大,能耗成本日益突出。據(jù)美國EPA(Environmental Protection Agency)的報(bào)告指出:2006 年美國數(shù)據(jù)中心消耗6.10×109 kW·h 電力,這相當(dāng)于580 萬中等家庭的耗電量。此外在一個IT公司中,數(shù)據(jù)中心的年能源消耗成本已成為繼人力成本后的第二大成本支出,而且在隨后的幾年里將會持續(xù)增加。高能耗不僅帶來運(yùn)營成本的增加,而且容易引起設(shè)備故障。最新結(jié)果表明,約50%的設(shè)備故障和環(huán)境過熱有關(guān)。每當(dāng)溫度上升15 ℃,則磁盤的故障率提高一倍。因此Google公司的首席執(zhí)行官EricSchmidt 就曾表示:“最影響Google 設(shè)計(jì)人員的不是計(jì)算機(jī)系統(tǒng)速度而是能耗,因?yàn)橐粋數(shù)據(jù)中心能消耗一座城市的電力”。
如何做到即降低能耗,節(jié)省成本,又能滿足實(shí)際性能的需要已經(jīng)成為迫切需要解決的難題,由此引入綠色存儲的概念。綠色存儲的最終目的是利用最少的存儲容量來滿足業(yè)務(wù)的需求,從而消耗最低的能源。
1.技術(shù)分類
近年來,存儲能耗問題已經(jīng)引起人們的廣泛關(guān)注,國內(nèi)外的不少團(tuán)隊(duì)開始對其進(jìn)行研究,并取得了豐碩成果。然而目前國內(nèi)尚未有人對其進(jìn)行系統(tǒng)總結(jié),因此本文從宏觀和微觀兩個角度對綠色存儲技術(shù)的發(fā)展現(xiàn)狀進(jìn)行了系統(tǒng)分析。
1.1 宏觀方面
(1)存儲虛擬化
以往數(shù)據(jù)中心的每臺服務(wù)器都有自己專屬的存儲空間,服務(wù)器之間很難“借用”存儲空間,造成不同設(shè)備的個體利用率差別很大而總體利用率偏低。虛擬化技術(shù)就是將實(shí)際的物理存儲實(shí)體和存儲的邏輯表示分離開,將不同設(shè)備的存儲資源整合到一個統(tǒng)一的虛擬化“存儲池”中,通過整合分散的存儲空間來解決容量和管理方面的制約。
(2)重復(fù)數(shù)據(jù)刪除
重復(fù)數(shù)據(jù)刪除技術(shù)是一種數(shù)據(jù)縮減技術(shù),消除分布在存儲系統(tǒng)中相同文件或數(shù)據(jù)塊,保留惟一的數(shù)據(jù)實(shí)例。利用重復(fù)數(shù)據(jù)刪除技術(shù)可以減少對存儲空間和網(wǎng)絡(luò)帶寬的占用,使硬盤存儲成為可能。
(3)自動精簡配置
傳統(tǒng)的存儲系統(tǒng)中,當(dāng)某用戶、某應(yīng)用需要存儲空間時,需要事先預(yù)留足夠大的存儲空間以分配給該用戶或該應(yīng)用,其他用戶或應(yīng)用無法使用這些已經(jīng)分配但尚未使用的存儲空間,這將導(dǎo)致閑置空間不斷增大。因此實(shí)際上,往往采用自動精簡配置來進(jìn)行容量分配。自動精簡配置則可以根據(jù)某項(xiàng)應(yīng)用的實(shí)際需要,動態(tài)并且實(shí)時地改變存儲容量資源的劃分,因此能更加充分有效地利用存儲資源,節(jié)約總成本。
(4)MAID
MAID(大規(guī)模非活動磁盤陣列存儲)最初的理論依據(jù)來自“80/20”定律,具體來說就是80%的訪問活動圍繞著20%的物理存儲進(jìn)行。因此,那些暫時沒有數(shù)據(jù)被訪問的磁盤驅(qū)動器,完全可以進(jìn)入能耗相對較低的待機(jī)狀態(tài),甚至完全關(guān)閉,需要訪問時再“喚醒”也來得及,從而達(dá)到節(jié)能的效果。
(5)分級存儲
數(shù)據(jù)分級存儲,是指利用存儲設(shè)備的性能差異(磁盤、磁盤陣列、光盤庫、磁帶庫),將不同的數(shù)據(jù)存放在不同的存儲設(shè)備中。通常是根據(jù)數(shù)據(jù)的重要性、訪問頻率、性能、容量、保留時間等因素確定的最佳存儲策略,通過分級存儲管理軟件實(shí)現(xiàn)數(shù)據(jù)客體在存儲設(shè)備之間的自動遷移。一般方法就是將不經(jīng)常訪問的數(shù)據(jù)遷移到存儲性能較低的層次(如磁帶),節(jié)省出性能較高的存儲空間(如磁盤陣列,磁盤)存放被頻繁訪問的數(shù)據(jù),以達(dá)到更好的系統(tǒng)性能。
1.2 微觀方面
(1)細(xì)分磁盤活動狀態(tài)
基于低轉(zhuǎn)速消耗低能量的理論,將磁盤盤片轉(zhuǎn)速劃分為多個速度等級,在系統(tǒng)負(fù)載較輕時使磁盤運(yùn)轉(zhuǎn)在低速旋轉(zhuǎn)狀態(tài);而當(dāng)系統(tǒng)負(fù)載變重時,將磁盤相應(yīng)的調(diào)整到高速旋轉(zhuǎn)狀態(tài)。
缺陷:實(shí)現(xiàn)困難,僅有少數(shù)廠家能實(shí)現(xiàn)兩級轉(zhuǎn)速。
(2)減少磁頭定位開銷
磁盤的性能和能耗越來越受到磁頭定位延遲的限制,例如尋道時間和查找時間,讓磁盤盡可能地進(jìn)行順序訪問是減少磁頭定位開銷的最有效方法,Huang等人為數(shù)據(jù)創(chuàng)建多個副本并將其存儲在文件系統(tǒng)的空閑塊上,通過I/O調(diào)度的方法使用戶請求盡可能地順序訪問磁盤上的數(shù)據(jù)。
缺陷:未考慮冗余。
(3)延長磁盤處于空閑狀態(tài)的周期
節(jié)省能耗的最常見的方法是當(dāng)磁盤沒有請求時,讓磁盤處于等待狀態(tài)。然而服務(wù)器端面臨的請求太多,導(dǎo)致磁盤的平均空閑時間非常短無法滿足磁盤停止、啟動
的時間需求。所以目的就是人為地提升磁盤的空閑時間,同時又不影響系統(tǒng)系能。
提高磁盤處于空閑狀態(tài)周期的因素有以下幾部分:
①cache命中率
cache管理策略能產(chǎn)生不同的磁盤請求序列,這將嚴(yán)重影響磁盤的耗能。比如說一個讀請求所要的數(shù)據(jù)塊在cache中命中,它就不需要再去訪問磁盤,可以延長磁盤的空閑時間。
②數(shù)據(jù)流特征
讀/寫請求一起到來可能導(dǎo)致磁盤有較長的空閑期,如果讀/寫請求在時間上是均勻到來,則可能因?yàn)榭?br /> 間隔太小而不能將磁盤轉(zhuǎn)到低功耗模式。對于多磁盤,多個連續(xù)讀/寫請求指向一簇磁盤節(jié)省的能耗要比分散指向所有磁盤節(jié)省的能耗多。
不同的磁盤有不同的數(shù)據(jù)流特征,例如請求到來的時間分布,冷未命中的數(shù)量,平均請求時間間隔等。這些數(shù)據(jù)流特征又對磁盤的能耗有著較大的影響。因?yàn)槿藗儫o法知道下一時刻數(shù)據(jù)流的到來情況,先前對數(shù)據(jù)流特征的研究主要是從兩個角度出發(fā):
預(yù)測:eRAID根據(jù)前一時刻和當(dāng)前數(shù)據(jù)流狀態(tài),利用ARMA等模型預(yù)測未來工作流的可能變化。缺點(diǎn)是可靠性不高。
動態(tài)變化:根據(jù)數(shù)據(jù)流到來的狀態(tài),動態(tài)調(diào)整某些參數(shù),降低能耗。文獻(xiàn)給出了基于能耗感知的cache管理策略PA?LRU和PB?LRU。
③磁盤的冗余信息
利用磁盤間的冗余信息能夠?qū)σ粋非活躍磁盤的非阻塞讀平等的轉(zhuǎn)移成對其他活躍磁盤的讀請求(請求重定向)。
eRAID 利用RAID1的冗余特性來重定向I/O 請求,通過停止部分或整個冗余組來降低能耗,同時將系統(tǒng)性能的降低控制在一個可控的范圍內(nèi);當(dāng)鏡像磁盤處于等待狀態(tài),讀請求由主磁盤來完成,寫請求由控制緩存或活躍磁盤來延遲,當(dāng)鏡像磁盤啟動時再更新到鏡像磁盤里。
(4)數(shù)據(jù)布局
根據(jù)數(shù)據(jù)訪問方式的改變在磁盤間遷移數(shù)據(jù),典型的代表就是PDC。PDC 模型根據(jù)數(shù)據(jù)訪問頻率的差異性,周期性地將熱點(diǎn)數(shù)據(jù)遷移到部分磁盤上,并將訪
問頻率較低的數(shù)據(jù)集中于剩下的磁盤中。但是由于PDC將大多數(shù)請求都集中到了一小部分磁盤上,這樣就容易形成系統(tǒng)瓶頸,增大系統(tǒng)響應(yīng)延遲。
(5)存儲介質(zhì)的改變
隨著存儲介質(zhì)的發(fā)展,新型存儲介質(zhì)日益受到人們的關(guān)注,其中的典型應(yīng)用就是固態(tài)盤。固態(tài)盤由控制單元和FLASH芯片組成,沒有可移動的機(jī)械部件(如磁頭臂尋道,盤片旋轉(zhuǎn)),因此在性能和能耗方面有著明顯優(yōu)勢,但是在小文件寫入,使用壽命,性價比方面還有缺陷。
2.磁盤能耗的測量
通過對現(xiàn)有論文分析,對磁盤能耗的測試和優(yōu)化可以在已有磁盤能耗模型(2-參數(shù)模型,3-參數(shù)模型,粗糙-dempsey模型,dempsey模型)的基礎(chǔ)上利用磁盤仿真器disksim得到,已有磁盤能耗主要牽扯到兩方面的參數(shù),平均功率參數(shù)和時間參數(shù),平均功率參數(shù)可以通過磁盤規(guī)格得到,屬于已知內(nèi)容,需要求的是時間參數(shù),時間參數(shù)主要是靠disksim得到。
對于磁盤能耗的建;蛘呦到y(tǒng)的整體能耗建模一般是兩種方法:仿真或者黑盒建模,為了驗(yàn)證模型的正確性,需要真實(shí)的測量結(jié)果進(jìn)行校驗(yàn)。
3.結(jié)語
隨著信息技術(shù)的迅猛發(fā)展,數(shù)字信息呈爆炸式增長,數(shù)據(jù)中心的規(guī)模不斷擴(kuò)大,能耗成本日益突出。由此引入以提高所有網(wǎng)絡(luò)存儲技術(shù)的能源效率為最終目的的綠色存儲的概念,并從宏觀和微觀兩個方面,對綠色存儲技術(shù)進(jìn)行了分析。綠色存儲技術(shù)的發(fā)展不僅是IT產(chǎn)品供應(yīng)商的責(zé)任,也是終端用戶的責(zé)任,每一個用戶必須意識到自己既是綠色存儲技術(shù)發(fā)展的驅(qū)動者又是綠色存儲技術(shù)發(fā)展的實(shí)踐者,有責(zé)任有義務(wù)為節(jié)能減排保護(hù)環(huán)境做貢獻(xiàn)?梢灶A(yù)見隨著終端用戶對綠色存儲的需求不斷提高,未來會有更多的綠色存儲產(chǎn)品和解決方案面世。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:綠色存儲技術(shù)探析
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121512792.html