Facebook的Jason Taylor說,他想用閃存固態(tài)盤來作為歸檔介質(zhì),這無疑是一顆重磅炸彈,但他的理由卻是有一定道理的。
Facebook用戶在他們的相冊中保存了大量照片,并且很少訪問這些相冊。但是當(dāng)他們某天想要查看這些照片的時候,他們希望是快速而直接的,不管這些照片是否已經(jīng)保存了有五年時間之久。
理論上來說,只有一種閃存存儲融合了Taylor想要的這些屬性:低成本、長期、可靠的存儲和高速訪問。
目前有兩種歸檔介質(zhì),磁帶和磁盤,當(dāng)不訪問的時候?qū)⑵潆x線,因此幾乎沒有功耗。一旦歸檔介質(zhì)被訪問的時候,它就要消耗電能,電費是一項很重要的考量,尤其是當(dāng)你保存了數(shù)PB的數(shù)據(jù),在未來幾年內(nèi)還會突破EB級。
磁帶歸檔是多個驅(qū)動器及成百上千個離線磁帶插槽組成的磁帶庫。當(dāng)需要一份文件的時候,機(jī)械臂可以找出磁帶盒的位置,然后將它交給一個加載驅(qū)動器,加載到磁帶的適當(dāng)位置,這樣可以訪問到該文件。
讓數(shù)據(jù)容量翻番
從本質(zhì)上說,磁帶式最廉價的歸檔介質(zhì)。與磁盤驅(qū)動器不同的是,磁帶盒沒有昂貴的嵌入式驅(qū)動器或者電機(jī)。磁帶可以安全地保存數(shù)據(jù)數(shù)年甚至是數(shù)十年之久還堅固耐用。磁帶還可以壓縮數(shù)據(jù),讓磁帶盒實際存儲數(shù)據(jù)量翻一番或者翻兩番。
磁帶庫也不錯,它只有幾個耗費電能的驅(qū)動器,機(jī)械臂也不會消耗多少電能。這意味著磁帶庫只用很少的電力和冷卻就可以與一臺在線磁盤驅(qū)動器陣列保存相同量級的數(shù)據(jù)。
當(dāng)然,磁帶庫要占用數(shù)據(jù)中心空間,這需要成本,但與基于磁盤的歸檔相比,磁帶歸檔仍然在總擁有成本上低得多。
因此,一直到最近,使用磁盤來歸檔的想法都被認(rèn)為是可笑的。然而,有兩項先進(jìn)技術(shù)改變了這個局面:重復(fù)數(shù)據(jù)刪除和閑時磁盤停轉(zhuǎn)。
重復(fù)數(shù)據(jù)刪除:在刪掉重復(fù)數(shù)據(jù)字節(jié)方面,重復(fù)數(shù)據(jù)刪除要比數(shù)據(jù)壓縮好得多,它可以讓磁盤取代磁帶,用于備份和針對短期保護(hù)需求的數(shù)據(jù)存儲,例如恢復(fù)丟失的文件或者更換損壞的數(shù)據(jù)。
重復(fù)數(shù)據(jù)刪除可以實現(xiàn)對備份數(shù)據(jù)或者VDI數(shù)據(jù)高達(dá)5:1的數(shù)據(jù)精簡率(對于圖片和結(jié)構(gòu)化數(shù)據(jù)來說這個比例要稍低一些)。再加上磁盤高速訪問數(shù)據(jù)的特點,這足以引發(fā)用磁盤批量更換磁帶用于備份用途了。
閑時磁盤停轉(zhuǎn):當(dāng)需要的時候,磁盤開始旋轉(zhuǎn)并且訪問數(shù)據(jù),這個過程要比在磁帶庫中找到一個磁帶快得多,因為你要讓機(jī)械臂找到驅(qū)動器,加載,然后放到合適的位置。
盡管磁盤容量只達(dá)到了8TB,未來可能利用疊瓦磁記錄等技術(shù)來實現(xiàn)10TB容量,而且每一次容量的提高都會降低磁盤保存數(shù)據(jù)的每GB成本,但磁帶提高密度的步伐卻更快,IBM已經(jīng)展示了容量高達(dá)154TB的磁帶盒。
Wikibon顧問宣稱磁帶“面密度的增長速度接近30%,而相比之下磁盤只有9.6%”。
磁盤不旋轉(zhuǎn)就不會耗能,這意味著重復(fù)數(shù)據(jù)刪除和磁盤停轉(zhuǎn)的成本將在接近磁帶存儲的成本。雖然磁盤在用于數(shù)據(jù)歸檔方面仍然不如磁帶具有的成本效益和可靠性,但是很多情況下,歸檔數(shù)據(jù)訪問速度是一個優(yōu)先考慮的因素,磁盤開始被越來越多地采用。
不過,用戶可能會喜歡一個低成本歸檔數(shù)據(jù)而不失磁盤速度優(yōu)勢的方法。他們會說,磁盤停轉(zhuǎn)對于數(shù)據(jù)訪問來說還不夠快,這也許好于磁帶,但這就好比將散步與爬行相比一樣,你真正想要的是一種可以沖刺的存儲介質(zhì)。
一些歸檔使用實例都選擇了藍(lán)光光盤作為歸檔截至,但我們知道,這是少數(shù)情況,并非主流歸檔介質(zhì),這是Facebook的例子。
閃存的閃光點
對于歸檔技術(shù)人員來說,閃存吸引人的地方在于,將字位添加到一個閃存單元中會降低成本并提高容量。一個閃存晶圓有固定的表面積,通常來說一個閃存單元的大小是差不多的,不管是保存1字位(SLC)、2字位(MLC)或者3字位(TLC)。
這聽起來不錯,但是每一次你向閃存單元中添加一個字位,你都會降低訪問速度,并且縮短它的生命周期——也就是在再也無法使用前可以寫入的次數(shù)。
持續(xù)開發(fā)更小的閃存單元,以提高提在一個物理區(qū)域(在閃存芯片和相應(yīng)的閃存晶圓上)內(nèi)可保存數(shù)據(jù)量,會使得這個問題變得更加嚴(yán)重。
下面這張圖顯示了大小不同的MLC和TLC閃存的耐用性差異:
圖 1 閃存耐用性排名
這張圖還顯示了MLC和TLC閃存的耐用性差異,TLC閃存耐用性是以數(shù)百次寫入衡量的,MLC閃存則是以數(shù)千次寫入衡量的,因為制程工藝朝著2X納米領(lǐng)域發(fā)展,也就是29納米到20納米之間的范圍。
對于數(shù)據(jù)重寫接近于零的歸檔場景來說,這無關(guān)緊要。
閃存成本正在下滑,有些人說閃存成本下滑的速度快于磁盤成本,重復(fù)數(shù)據(jù)刪除和壓縮可以進(jìn)一步降低閃存成本。主數(shù)據(jù)閃存存儲系統(tǒng)可以利用重復(fù)數(shù)據(jù)刪除而避免影響數(shù)據(jù)訪問速度,而磁盤陣列并不會以相同的方式重新刪除冗余數(shù)據(jù),因為這會延長訪問時間。
因此,高訪問率的主數(shù)據(jù)存儲正在從磁盤向閃存遷移。但是這并不適用于歸檔,因此在歸檔場景下,磁盤和閃存都可以使用重復(fù)數(shù)據(jù)刪除。
關(guān)于TLC閃存成本下滑率的推斷顯示,大約2017年它將在成本方面趕超SAS磁盤,下滑速度仍將快于磁盤,到2020年下探到更為廉價的SATA磁盤成本,在下個十年還不太可能與之匹敵。以下表格顯示了這個趨勢:
圖 2 隨著時間推移TLC閃存和SAS磁盤的價格變動
這張來自NetApp的圖表顯示了隨著時間推移TLC閃存和SAS磁盤的價格變動。兩條曲線與SATA磁盤價格改變曲線是相關(guān)的,后者隨著時間推移保持1.0的常態(tài)。
這里可以看到,TLC閃存的成本仍然高于磁盤,磁盤的成本仍然高于磁帶。因此TLC閃存不太可能取代磁帶作為一種歸檔介質(zhì)。
宏圖愿景
Wikibon的顧問認(rèn)為,閃存也許會被用于歸檔數(shù)據(jù),但只是針對保存元數(shù)據(jù)的大型對象,批量數(shù)據(jù)仍然保存在磁帶中。他們將這種雙生技術(shù)理念稱為“Flape”。
“磁帶與閃存的結(jié)合,針對大型對象或者文件,將不僅提供更低的成本,而且性能也要高于基于磁盤的方法。”
“這種方法的關(guān)鍵,是將掩埋在磁帶盒中的元數(shù)據(jù)保存到一個閃存層中,它可以指向所需數(shù)據(jù)在磁帶中的位置。結(jié)合近線磁帶文件系統(tǒng)技術(shù),我們相信這種方法將為合適的用例提供更好的商業(yè)價值。”
圖 3 Flape的硬件成本
一張來自Wikibon關(guān)于硬件成本的表格顯示,看一看10年累積硬件成本,純磁盤歸檔的成本是550萬美元,而純磁帶的成本僅為80萬美元。
磁盤加閃存的成本可以達(dá)到730萬美元,而閃存加磁帶也就是Flape的成本為260萬美元:Flape勝出,如果你需要高速數(shù)據(jù)訪問,和最低的每GB存儲成本。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:閃存數(shù)據(jù)存儲:讓磁帶從歸檔寶座上墜落
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121516358.html