一 引言
云計(jì)算作為當(dāng)前業(yè)界的熱點(diǎn),其主要功用之一是處理急劇增長的海量數(shù)據(jù)信息,而它之所以能夠做到這一點(diǎn)是因?yàn)槠浔澈髶碛兄鴱?qiáng)大的云存儲(chǔ)技術(shù)的有效支持。類似于云計(jì)算,云存儲(chǔ)也是基于網(wǎng)絡(luò)的能夠高效可靠地按需為用戶提供存儲(chǔ)服務(wù)。云存儲(chǔ)與存儲(chǔ)虛擬化具有密不可分的關(guān)系。為了做到動(dòng)態(tài)按需分配,云存儲(chǔ)需要在網(wǎng)絡(luò)中擁有充足的資源以位置透明的方式提供給用戶,這就需要依賴于存儲(chǔ)虛擬化技術(shù)屏蔽掉底層存儲(chǔ)硬件對(duì)上層應(yīng)用的影響,使得存儲(chǔ)資源能夠以一個(gè)“無窮無盡”的資源池的方式展現(xiàn)給用戶。
二 存儲(chǔ)虛擬化
存儲(chǔ)虛擬化的三種技術(shù)類型:基于網(wǎng)絡(luò)附加存儲(chǔ)(NAS)、存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)和Google文件系統(tǒng)(GFS)。
傳統(tǒng)的存儲(chǔ)虛擬化主要基于網(wǎng)絡(luò)附加存儲(chǔ)(Network Attached Storage,NAS)和存儲(chǔ)區(qū)域網(wǎng)絡(luò)(Storage Area Network,SAN)等存儲(chǔ)系統(tǒng)技術(shù),通過在物理存儲(chǔ)系統(tǒng)和服務(wù)器之間增加一個(gè)虛擬層,實(shí)現(xiàn)對(duì)分散的、不同品牌、不同級(jí)別的多個(gè)存儲(chǔ)系統(tǒng)的整合。NAS和SAN都是基于網(wǎng)絡(luò)為用戶提供存儲(chǔ)資源的技術(shù),但不同點(diǎn)在于NAS是采用文件系統(tǒng)管理硬件存儲(chǔ)資源,并通過網(wǎng)絡(luò)協(xié)議(例如NFS協(xié)議和CIFS協(xié)議)為用戶提供文件級(jí)的存儲(chǔ)訪問,它可以支持異構(gòu)客戶端的共享訪問;而SAN是采用專用的存儲(chǔ)網(wǎng)絡(luò)設(shè)備連接存儲(chǔ)資源硬件為用戶提供塊級(jí)的存儲(chǔ)訪問,對(duì)它的訪問需要依賴于客戶端文件系統(tǒng)。這兩種技術(shù)都使用專用的存儲(chǔ)設(shè)備作為底層硬件資源,但NAS采用網(wǎng)絡(luò)協(xié)議會(huì)降低傳輸過程中的有效載荷比從而性能不高,而SAN采用專用存儲(chǔ)網(wǎng)絡(luò)具有較高的傳輸性能但是價(jià)格較貴。另外,NAS中存儲(chǔ)的文件能夠被異構(gòu)客戶端共享訪問,而SAN卻很難做到這一點(diǎn)。
雖然基于NAS和SAN的存儲(chǔ)虛擬化方法得到了廠商的廣泛支持,在以往的存儲(chǔ)系統(tǒng)中多有應(yīng)用,但是面對(duì)云計(jì)算的海量、高可擴(kuò)展、高可靠、高性能等存儲(chǔ)需求,這些傳統(tǒng)的存儲(chǔ)虛擬化技術(shù)普遍存在著缺陷。于是,一類以Google文件系統(tǒng)(Google File System,GFS)為代表的新興的以分布式文件系統(tǒng)為基礎(chǔ)的存儲(chǔ)技術(shù)引起了業(yè)界的關(guān)注,并已經(jīng)在云存儲(chǔ)領(lǐng)域取得了比較好的效果。
類GFS的存儲(chǔ)系統(tǒng)普遍采用主到從架構(gòu),由一個(gè)或幾個(gè)管理節(jié)點(diǎn)和多個(gè)分布的存儲(chǔ)節(jié)點(diǎn)組成。不同于基于專用存儲(chǔ)設(shè)備的傳統(tǒng)存儲(chǔ)技術(shù),系統(tǒng)中的節(jié)點(diǎn)采用了遵循統(tǒng)一標(biāo)準(zhǔn)的既具有計(jì)算能力又具有存儲(chǔ)能力的PC服務(wù)器。每個(gè)存儲(chǔ)節(jié)點(diǎn)利用自己的文件系統(tǒng)對(duì)本地存儲(chǔ)資源進(jìn)行管理,再由管理節(jié)點(diǎn)通過部署在各個(gè)節(jié)點(diǎn)上的分布式文件系統(tǒng)為系統(tǒng)中所有的存儲(chǔ)資源提供統(tǒng)一的文件名字空間,構(gòu)成虛擬的存儲(chǔ)資源池,因此這類系統(tǒng)具有良好的可擴(kuò)展性,能夠應(yīng)對(duì)海量數(shù)據(jù)的存儲(chǔ)和管理。同時(shí)也具有較低的價(jià)格。在系統(tǒng)中,數(shù)據(jù)的存取以文件為單位,每個(gè)文件被采用分塊的方式保存并且存有多個(gè)副本。因此,同一文件的多個(gè)數(shù)據(jù)塊可以分布在不同的存儲(chǔ)節(jié)點(diǎn)上,這使得隸屬于同一文件的多個(gè)數(shù)據(jù)塊可以被并行地存取,具有較高的吞吐性能。另外,文件數(shù)據(jù)塊副本的分布式存儲(chǔ)提高了文件訪問的可靠性,避免了某個(gè)節(jié)點(diǎn)出現(xiàn)故障對(duì)文件正常存取的影響。同時(shí),當(dāng)某個(gè)存儲(chǔ)節(jié)點(diǎn)出現(xiàn)問題時(shí),管理節(jié)點(diǎn)會(huì)及時(shí)發(fā)現(xiàn)并將故障節(jié)點(diǎn)中的數(shù)據(jù)重新分布到其它正常節(jié)點(diǎn)中,保證節(jié)點(diǎn)級(jí)的可靠性。
與傳統(tǒng)的存儲(chǔ)虛擬化比較,類GFS的基于分布式文件系統(tǒng)的存儲(chǔ)虛擬化技術(shù)能夠更好地滿足云計(jì)算的需求,在業(yè)界有著非常廣闊的應(yīng)用前景。但是這類系統(tǒng)也具有局限性,例如不適合實(shí)時(shí)要求高的隨機(jī)數(shù)據(jù)訪問、管理節(jié)點(diǎn)容易成為系統(tǒng)瓶頸、缺少POSIX兼容接口增加應(yīng)用難度等等。
三 云存儲(chǔ)服務(wù)的三種模式
存儲(chǔ)虛擬化是云存儲(chǔ)的基礎(chǔ),但是云存儲(chǔ)并不僅僅是一個(gè)技術(shù)名詞,它更代表了新興的服務(wù)理念和運(yùn)營思路。類似于云計(jì)算的基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)三類服務(wù)模型,云存儲(chǔ)服務(wù)的模型也可以被細(xì)分為存儲(chǔ)資源即服務(wù)(Storage as a Service)、數(shù)據(jù)即服務(wù)(Data as a Service)、信息即服務(wù)(Information as a Service)等三類服務(wù)。在不同的服務(wù)中采用合適的存儲(chǔ)虛擬化技術(shù)作支撐,往往可以獲得事半功倍的效果。
存儲(chǔ)資源即服務(wù)是為用戶提供存儲(chǔ)空間的服務(wù)。當(dāng)用戶提出存儲(chǔ)空間請(qǐng)求時(shí),云存儲(chǔ)系統(tǒng)會(huì)在存儲(chǔ)資源池中劃分出用戶所需的空間供其進(jìn)行相關(guān)的存儲(chǔ)應(yīng)用開發(fā),這一點(diǎn)類似于云計(jì)算的IaaS服務(wù)。存儲(chǔ)資源即服務(wù)將底層硬件存儲(chǔ)資源進(jìn)行整合,構(gòu)建出統(tǒng)一的資源視圖,然后按需分配給用戶使用,并做到動(dòng)態(tài)彈性縮放,能夠有效地提高存儲(chǔ)資源利用率,降低用戶的存儲(chǔ)設(shè)備投資和管理成本。存儲(chǔ)資源即服務(wù)是存儲(chǔ)虛擬化技術(shù)的設(shè)計(jì)目標(biāo)之一。因此無論是傳統(tǒng)的存儲(chǔ)虛擬化技術(shù)還是新興的類GFS虛擬化技術(shù)均能較好地滿足功能需求,特別是類GFS虛擬化技術(shù)因?yàn)槠洳捎玫拇鎯?chǔ)設(shè)備具有統(tǒng)一的標(biāo)準(zhǔn),因此可以具有更優(yōu)的擴(kuò)展性。另外,在功能需求被滿足的前提下,不同存儲(chǔ)系統(tǒng)技術(shù)在成本和性能上會(huì)有些許差異。
數(shù)據(jù)即服務(wù)是為用戶提供計(jì)算數(shù)據(jù)的服務(wù)。與存儲(chǔ)資源即服務(wù)不同,它提供的服務(wù)是存儲(chǔ)的內(nèi)容而并非存儲(chǔ)空間本身。根據(jù)用戶的需求,數(shù)據(jù)即服務(wù)及時(shí)地將計(jì)算所需的數(shù)據(jù)提供給計(jì)算單元,達(dá)到數(shù)據(jù)存儲(chǔ)為計(jì)算服務(wù)的目的,這一點(diǎn)類似于云計(jì)算的PaaS服務(wù)。對(duì)于這類服務(wù),類GFS虛擬化技術(shù)具有更優(yōu)的效能,這是因?yàn)檫@類系統(tǒng)中的存儲(chǔ)節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)往往復(fù)用同一節(jié)點(diǎn)(例如Google的GFS文件系統(tǒng)和MapReduce計(jì)算模型),有效地減少了計(jì)算過程中的數(shù)據(jù)傳輸。而在傳統(tǒng)的存儲(chǔ)虛擬化系統(tǒng)中,需要額外的通道將虛擬化存儲(chǔ)中的數(shù)據(jù)傳輸?shù)接?jì)算單元中,具有較高的延遲。但是類GFS虛擬化技術(shù)具有一定的局限性,它要求計(jì)算過程能夠并行化,計(jì)算步驟可以散布到存儲(chǔ)節(jié)點(diǎn)上,因此它并非適用于所有應(yīng)用場合。
信息即服務(wù)是為用戶提供應(yīng)用信息的服務(wù)。與數(shù)據(jù)即服務(wù)不同,它提供的服務(wù)是數(shù)據(jù)經(jīng)過處理后的能夠直接交付給用戶直接應(yīng)用的信息,這一點(diǎn)類似于云計(jì)算的SaaS服務(wù)。提供這類服務(wù),除了前文提及的信息存儲(chǔ)過程外,更重要的是服務(wù)提供方式,最常見的就是為用戶提供信息查詢。對(duì)于存儲(chǔ)系統(tǒng)而言,高效的查詢過程的實(shí)現(xiàn)需要借助數(shù)據(jù)庫系統(tǒng),因此無論是傳統(tǒng)的存儲(chǔ)虛擬化技術(shù)還是新型的類GFS虛擬化技術(shù),對(duì)數(shù)據(jù)庫的支持將非常重要。在這一點(diǎn)上,天生依賴于文件系統(tǒng)的存儲(chǔ)系統(tǒng)(例如NAS存儲(chǔ)系統(tǒng)和類GFS系統(tǒng))因?yàn)槠鋽?shù)據(jù)庫應(yīng)用必須構(gòu)建于文件系統(tǒng)之上從而會(huì)導(dǎo)致額外的開銷,而那些能夠直接對(duì)塊存儲(chǔ)設(shè)備直接操作的系統(tǒng)(例如SAN系統(tǒng))則具有一定的性能優(yōu)勢。
綜上所述,存儲(chǔ)虛擬化技術(shù)類型與云存儲(chǔ)服務(wù)方模式也在不斷地發(fā)展嚴(yán)禁之中。云存儲(chǔ)核心技術(shù)的選擇必須建立在針對(duì)實(shí)際業(yè)務(wù)需求的全面評(píng)估的基礎(chǔ)之上,切不可盲目跟風(fēng),否則不但會(huì)使得云存儲(chǔ)的效果事倍功半,還會(huì)進(jìn)一步引起云計(jì)算相關(guān)領(lǐng)域的連鎖不良反應(yīng)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:海量信息的存儲(chǔ)和使用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083974482.html