隨著大數(shù)據(jù)時(shí)代的到來(lái),合理構(gòu)建可持續(xù)的存儲(chǔ)架構(gòu)已經(jīng)成為企業(yè)數(shù)據(jù)中心IT主管們面臨的頭號(hào)難題之一。經(jīng)常有人問(wèn)我,如何為成長(zhǎng)型公司的大型系統(tǒng)部署存儲(chǔ)架構(gòu),尤其是當(dāng)這些大型系統(tǒng)承載視頻、音頻、或社交類網(wǎng)站時(shí),該如何構(gòu)建存儲(chǔ)架構(gòu)?以下介紹一些我們常選擇的方法及各自的優(yōu)點(diǎn)。
構(gòu)建存儲(chǔ)架構(gòu)時(shí),要考慮許多問(wèn)題,最明顯的如存儲(chǔ)容量、訪問(wèn)速度、緩存選擇方案、服務(wù)器共享方式、訪問(wèn)協(xié)議及訪問(wèn)方法、安全及備份等等。
首先,我們認(rèn)為最好的存放地址是存放在云中,這些服務(wù)存放在云中會(huì)很安全,如Amazon S3,阿里云OSS,或 Qiniu’s 的動(dòng)態(tài)系統(tǒng)。但是,若你是自己想存儲(chǔ)數(shù)據(jù)的話,你可以選擇不同類型的存儲(chǔ)容量。
DAS-直接附加存儲(chǔ),也稱為本地硬盤(pán)存儲(chǔ),是一種最普遍、速度最快也是最為經(jīng)濟(jì)的存儲(chǔ)解決方案,F(xiàn)在已經(jīng)有4TB的硬盤(pán),再加上標(biāo)準(zhǔn)機(jī)箱可以有6-8個(gè)這樣的硬盤(pán),所以,若服務(wù)器是RAID5 配置的話,很容易就能達(dá)到20TB 以上。同時(shí)使用多個(gè)服務(wù)器的話,也很容易就能達(dá)到100TB,但是管理起來(lái)并不容易。所以,DAS是本地?cái)?shù)據(jù)庫(kù)存儲(chǔ)、NFS共享存儲(chǔ)及其它簡(jiǎn)單系統(tǒng)最好的存儲(chǔ)選擇方案。要想找一個(gè)比較簡(jiǎn)單的存儲(chǔ)方案,這不失為一項(xiàng)最佳選擇。
NAS-網(wǎng)絡(luò)附加存儲(chǔ)也比較盛行,由兩部分組成。最常見(jiàn)的情況就是 簡(jiǎn)單的服務(wù)器之間的NFS 共享,這種存儲(chǔ)方式采用上文所述的大型TB硬盤(pán),能存儲(chǔ)簡(jiǎn)單的共享圖片甚至視頻,也能夠達(dá)到十幾TB 的存儲(chǔ)量。
NAS的第二種解決方案,則是商業(yè)解決組件,如NetAppFiler, 其存儲(chǔ)容量可達(dá)幾百TB,是一個(gè)強(qiáng)大的NFS解決方案,這些通常運(yùn)用于大型系統(tǒng),但是缺點(diǎn)是,當(dāng)系統(tǒng)擴(kuò)展受成本限制時(shí),對(duì)此類存儲(chǔ)進(jìn)行擴(kuò)展會(huì)花費(fèi)很大的成本。
SAN-存儲(chǔ)區(qū)域網(wǎng)絡(luò),常被認(rèn)為是NAS的“大哥”。但是,由于其成本太大且難以管理,所以,互聯(lián)網(wǎng)行業(yè)通常不選擇此解決方案。此外,該種存儲(chǔ)不能夠很好的響應(yīng)互聯(lián)網(wǎng)公司的共享需求,因?yàn)檫@種方案只連接幾臺(tái)高IO要求服務(wù)器如Oracle數(shù)據(jù)庫(kù)聯(lián)系在一起。
群集存儲(chǔ) - 在不用NFS 的情況下,這種方式越來(lái)越多的被用于解決共享問(wèn)題。這種存儲(chǔ)方案最好的優(yōu)勢(shì)在于,由于是群集存儲(chǔ),所以可以允許存儲(chǔ)冗余存在,而這在DAS 或NAS系統(tǒng)中是很難實(shí)現(xiàn)的。常用的群集存儲(chǔ)方式包括RedHat公司擁有的GlusterFS, 以及MogileFS。
這些系統(tǒng)通常管理起來(lái)很復(fù)雜,而且也有很多限制,如文件存放,空間管理及訪問(wèn)方法。例如,GlusterFS 就是由客戶端進(jìn)行管理,且以FUSE掛載,而MogileFS則根本無(wú)法掛載,因?yàn)樗捎玫氖菐?kù)驅(qū)動(dòng)API,由PHP進(jìn)行訪問(wèn)的等等。
群集存儲(chǔ)容量可以擴(kuò)大,甚至擴(kuò)展到100TB,通常用于中等大小的圖片或視頻系統(tǒng),前提是已經(jīng)知道了它的限制和復(fù)雜性。
分布式存儲(chǔ) – 是群集系統(tǒng)的一個(gè)遠(yuǎn)房“表親”,完全分布式的系統(tǒng)和Google File System比較接近, 在這個(gè)系統(tǒng)中,所有的文件、分布、復(fù)制、空間等都自動(dòng)由系統(tǒng)進(jìn)行管理?蛻敉ǔMㄟ^(guò)內(nèi)核驅(qū)動(dòng)程序安裝該系統(tǒng),整個(gè)分布式系統(tǒng)就像是SAN或NAS一樣工作。
這些通常都是功能強(qiáng)大的商業(yè)化系統(tǒng),如北京的Loongstore(龍存科技)。它們通常至少需要幾個(gè)服務(wù)器才能開(kāi)展工作,因?yàn)樗麄兺ǔP枰粋(gè)或更多的集群,并且其他服務(wù)器作為管理服務(wù)器來(lái)運(yùn)行,除多個(gè)集群之外,多個(gè)存儲(chǔ)節(jié)點(diǎn)也可以。但是,他們可以擴(kuò)展到1PB甚至更大,是大型系統(tǒng)擴(kuò)展的理想選擇,并具有很高的冗余特性及極高的性能。
Flickr 或 Evernote 的API存儲(chǔ) – 可達(dá)500TB 甚至1PB, 對(duì)于某些特定存儲(chǔ)需求,如圖片存儲(chǔ),甚至可能用到幾個(gè)基于文件的API系統(tǒng),盡管大多數(shù)情況下是用于用戶目錄的增長(zhǎng)。Flickr和Evernote 都發(fā)布了各自的系統(tǒng)架構(gòu),基本上都是基于HTTP文件存儲(chǔ)的分布式集中管理系統(tǒng)。
在這些系統(tǒng)中,客戶端調(diào)用目錄尋找文件,然后獲得一個(gè)URL反饋,指向在服務(wù)器或群集服務(wù)器上的需要進(jìn)行讀/寫(xiě)的文件。然后,客戶端再發(fā)一個(gè)HTTP請(qǐng)求來(lái)讀取這個(gè)文件,這個(gè)請(qǐng)求由單個(gè)服務(wù)器或一個(gè)小的群集服務(wù)器(使用復(fù)制或冗余RAID)進(jìn)行處理,從本質(zhì)上來(lái)說(shuō),這是一個(gè)共享存儲(chǔ)系統(tǒng),可以無(wú)限制擴(kuò)展。但是,同其它共享存儲(chǔ)系統(tǒng)一樣,都面臨著文件移動(dòng),管理難等挑戰(zhàn)。
Amazon S3 使用的就是類似于這樣的一個(gè)系統(tǒng),使用基于HTTP的存儲(chǔ)及你的內(nèi)部目錄了解你的文件存儲(chǔ)地址。
Facebook-最優(yōu)秀的擴(kuò)展案例就是Facebook系統(tǒng), 該系統(tǒng)設(shè)計(jì)用于存放幾十億的文件,每秒處理幾百萬(wàn)的請(qǐng)求。 該系統(tǒng)有點(diǎn)像 NFS/GFS 系統(tǒng),在硬盤(pán)格式、有線網(wǎng)絡(luò)格式上都采用了最佳的選擇方案,在網(wǎng)絡(luò)和硬盤(pán)上采取最短的文件傳輸路徑。你不會(huì)想在不久的將來(lái)構(gòu)建一個(gè)這樣的系統(tǒng),但是,花時(shí)間去研究一下,你會(huì)發(fā)現(xiàn)很有趣。
您會(huì)發(fā)現(xiàn),成長(zhǎng)型公司可選擇多種不同的存儲(chǔ)方式。但是,只有前幾種存儲(chǔ)方案對(duì)于成長(zhǎng)型公司是比較實(shí)際的,DAS, NAS及群集存儲(chǔ)。每種存儲(chǔ)方案有其各自的優(yōu)缺點(diǎn)。云絡(luò)科技很高興與您一起選擇、構(gòu)建并運(yùn)行最適合您的解決方案。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:中小企業(yè)如何選擇存儲(chǔ)架構(gòu)?
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083939738.html