在談到大數(shù)據(jù)時代的現(xiàn)狀時,英特爾中國有限公司存儲產(chǎn)品市場經(jīng)理亢海峰認(rèn)為,需要尊重實(shí)踐,需要找出大數(shù)據(jù)面前大家面臨的關(guān)鍵問題,從中尋求更佳的解決之道。
CSF2012:英特爾中國有限公司存儲產(chǎn)品市場經(jīng)理亢海峰
當(dāng)前我們所面臨的數(shù)據(jù)和信息是變化的,數(shù)據(jù)生命周期已經(jīng)完全改變了。那么在傳統(tǒng)的數(shù)據(jù)中心方面,大家面臨什么樣的問題,如何應(yīng)對和解決?在未來的云的數(shù)據(jù)中心方面,會面臨什么樣的問題,大家又如何來解決?
在做存儲行業(yè)趨勢分析時,亢海峰指出,“來自IDC的數(shù)據(jù)顯示,未來幾年間數(shù)據(jù)量從2011年的1.8ZB,在2015年會增長為35個ZB。十年前,大家還在使用3.5英寸的盤,5.5英寸的盤,后來有了光盤和DVD,不同的介質(zhì),存儲的數(shù)據(jù)越來越多。
那么這些數(shù)據(jù)來源于什么?來源于個人和企業(yè)用戶不斷的膨脹的存儲需求,F(xiàn)在隨便一個手機(jī)就差不多八百萬象素攝像頭,意味著什么?大家每拍一張照片,就會上傳到網(wǎng)上,與朋友以不同形式的分享,類似這些數(shù)據(jù)不斷累計就形成了當(dāng)今爆炸性的數(shù)據(jù)時代。有越來越多的數(shù)據(jù)中90%是非結(jié)構(gòu)化的(主要是圖片和視頻為主)。
來自IDC的報告顯示,從2010年到2016年四種類型數(shù)據(jù)的增長情況來看,首先傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),也既是說數(shù)據(jù)中心里面常見的數(shù)據(jù)庫,運(yùn)行核心的業(yè)務(wù),核心的交易。那么,這一類稱之為傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)
其次是傳統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù),也就是企業(yè)里面有共享的文件和文檔,大家需要文件服務(wù)器,可以在一個系統(tǒng)里面共同分享知識。
再次,在數(shù)據(jù)備份方面,業(yè)務(wù)的數(shù)據(jù)量越來越大了,備份也增長很快。很多數(shù)據(jù)是大家由于長期歸檔的訴求所存在的。
最后就是共有云的數(shù)據(jù)。那么對于這種不同類型的四種數(shù)據(jù)哪一個增長最快,肯定是公有云,也是大的數(shù)據(jù)領(lǐng)域的范疇。存儲的目的是為了滿足以上不同類型數(shù)據(jù)的存儲需求。
重新定義的數(shù)據(jù)生命周期
什么叫做重新定義的數(shù)據(jù)生命周期?以前大家探討的是什么?信息生命周期.“說你有一個信息,它產(chǎn)生出來,你創(chuàng)建了這個信息,過一段時間,達(dá)到了一個價值的高峰,大家對這個信息訪問都很頻繁,都喜歡這個信息。然后過了一段時間,這個信息過時用不到了,就把數(shù)據(jù)刪除,這是傳統(tǒng)的生命周期,從出生,到高潮,到低谷,到刪除。”亢海峰說道。
而現(xiàn)在的數(shù)據(jù),隨著數(shù)據(jù)的累積,隨著時間的推移,相應(yīng)的數(shù)據(jù)越來越多得到的信息就越來越多。新一輪數(shù)據(jù)量的積累之后就獲得新的數(shù)據(jù)價值,稱之為價值的排浪,它會呈排浪的形式逐漸從數(shù)據(jù)中挖掘出信息,這一切取決于取決于大家對于信息的理解和積累。
對于存儲來講怎么劃分這種周期?“最下面的存儲介質(zhì)大家基本上放在磁帶上需要長期的歸檔.或者放在磁盤庫上,或者是大容量的,低成本的介質(zhì)上.對性能又一定需要的數(shù)據(jù)就用高速的磁盤,性能要求再高的用閃存盤,SSD等等的數(shù)據(jù)。
數(shù)據(jù)的生命周期已經(jīng)截然的改變了。今天對于數(shù)據(jù)的劃分是邏輯的劃分。第一,大量的不常訪問的數(shù)據(jù),通過磁盤的介質(zhì)進(jìn)行長期的歸檔。第二,這一層的數(shù)據(jù)一定要滿足不斷的增長,因?yàn)闆]有時間去刪除,更何況是要挖掘出來大家以前沒有的,看不到的價值。第三以后要查詢數(shù)據(jù)時就要快速讀取,能不能把長期存起來的數(shù)據(jù)迅速找到,拿到一個快速的數(shù)據(jù)層,使得實(shí)現(xiàn)數(shù)據(jù)挖掘的價值,從數(shù)據(jù)變成信息,從信息變成決策,影響未來的發(fā)展。
可見,存儲所面臨的問題和挑戰(zhàn),首先是數(shù)據(jù)太多,其次難以管理。第三是運(yùn)營支出。最后是資源鎖定利用率不高等。
在傳統(tǒng)的數(shù)據(jù)中心,大家看到了交易型的數(shù)據(jù)庫,如何來解決這樣的問題,通過網(wǎng)絡(luò)連到了一個存儲,然后為了保證這個存儲的可用性,把數(shù)據(jù)備份,而后多數(shù)據(jù)中心做實(shí)時容災(zāi),這是非常經(jīng)典的存儲架構(gòu)。,但是對于數(shù)據(jù)的存儲方面,目前主流的四個需求已經(jīng)呈現(xiàn)出來,第一個是重復(fù)數(shù)據(jù)刪除:比如每天大家生活中最常見的發(fā)郵件,大家會抄送給很多人,我們的郵件服務(wù)器上會有很多重復(fù)的郵件副本,這些數(shù)據(jù)也會占用大量空間第二:實(shí)時的壓縮:剛剛說兩個數(shù)據(jù)中心以前產(chǎn)生一百兆的數(shù)據(jù),通過千兆和萬兆傳出去,沒有問題,如果你有5個TB的,你通過網(wǎng)上傳輸,還不如拿著硬盤坐飛機(jī)過去來得快,因?yàn)槭苤朴诰W(wǎng)絡(luò)帶寬。可不可以把數(shù)據(jù)進(jìn)行壓縮后再傳過去,這也是一個解決的方式。
第三個是分層存儲,大家談到了在一個存儲里面,這個數(shù)據(jù)是不是說一開始并不是熱點(diǎn)的數(shù)據(jù),后來的由于某種需求變熱,而后變冷,存儲的介質(zhì)要求一定是不一樣的,如何按照需求來移動冷熱數(shù)據(jù)到對應(yīng)的存儲層上這也是一個存儲的需求。,
第四:是自動精簡配置也將是存儲的需求之一。
所有這些存儲功能,都需要計算的能力,要想知道什么是重復(fù)的數(shù)據(jù),必須先要計算哪些塊是一樣的,你要想刪除的話,就要進(jìn)行大量的重復(fù)數(shù)據(jù)刪除,也要進(jìn)行計算,分層的存儲也要知道哪一些數(shù)據(jù)塊熱,什么時候熱,怎么樣遷移到對應(yīng)的層次上,這些都需要用計算來感知。,現(xiàn)在的存儲完全和以前不一樣了不僅僅是一個倉庫需要更為智能,更為精細(xì)的管理員,需要管理的流程和方式,這都是需要運(yùn)用計算來實(shí)現(xiàn)的。
通過計算來實(shí)現(xiàn)的存儲看到可以達(dá)到什么樣的目的,數(shù)據(jù)壓縮可以節(jié)省80%的空間。數(shù)據(jù)重復(fù)刪除的備份量可以減少95%,數(shù)據(jù)的精簡配置大家可以釋放40-60%的空間。通過計算能力的增強(qiáng),將大幅度提升存儲的有效性。
所以對于傳統(tǒng)的數(shù)據(jù)中心而言,不斷豐富存儲的功能是大家解決很多問題的行之有效的方法,而這些方法基于存儲的計算的能力,基于CPU所提供的智能化的管理和存儲的能力。
那么,未來的數(shù)據(jù)中心如何,在未來的數(shù)據(jù)中心里面大家看到其實(shí)有不同的數(shù)據(jù),有一部分是實(shí)施業(yè)務(wù)的數(shù)據(jù)庫在運(yùn)行,還有一部分是長期歸檔的海量數(shù)據(jù)。“舉一個簡單的例子,國外的某一個數(shù)據(jù)中心,或者國內(nèi)的大網(wǎng)站,運(yùn)營商,你走到他的數(shù)據(jù)中心里面,分不清哪些是存儲,哪些是服務(wù)器,全部是標(biāo)準(zhǔn)的機(jī)架服務(wù)器,甚至是密度更高的服務(wù)器,壞了怎么辦,換下來,拿走。換新的。整個的存儲服務(wù)都是靠軟件+標(biāo)準(zhǔn)化的硬件來提供服務(wù)的。”
這些服務(wù)器集群擁有超大的容量,大家可以看到達(dá)到百P甚至是上到EB的級別,所以在大數(shù)據(jù)的領(lǐng)域橫向擴(kuò)展的存儲,也是未來的一個發(fā)展方向。過去大家都說存儲是存儲,服務(wù)器是服務(wù)器。到了今天希望通過融合的架構(gòu),標(biāo)準(zhǔn)的架構(gòu),既可以做存儲,又可以做服務(wù)器,唯一的區(qū)別是應(yīng)用模式場景不同,大家采用的配置不同。對于性能需求大的,配置更高CPU更大的緩存,對于存儲需求較大的配置更大的硬盤等。
最終的目的,對各種應(yīng)用模式和場景提供經(jīng)濟(jì)的高效的擴(kuò)展平臺。
如果大家采用更多的計算能力,大家完全可以用智能化的存儲,減少四十到五十的存儲空間,采用重復(fù)的數(shù)據(jù)刪除可以節(jié)省95%的備份數(shù)據(jù)。
目前英特爾不僅擁有存儲、網(wǎng)絡(luò)、計算、也擁有大數(shù)據(jù)分析,管理,安全等相應(yīng)的解決方案、涵蓋了大家在整個行業(yè)里面的方方面面。但是,因特爾的角色是跟大家一起來共建這個生態(tài)環(huán)境,和前端有硬件廠商,存儲廠商,軟件服務(wù)器,行業(yè)方案解決提供商,一起攜手將最好的,最優(yōu)勢的方案提供給客戶。這才最終是我們的價值所在。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:亢海峰:大數(shù)據(jù)時代的智能存儲
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112156613.html