你知道什么是FLAPE?如果不知道,你可能已經(jīng)跟不上最新的歸檔技術(shù)發(fā)展。請(qǐng)看存儲(chǔ)專家Jon Toigo對(duì)于歸檔以及如何避免無(wú)意將垃圾信息歸檔保存是怎么說(shuō)的。
數(shù)據(jù)歸檔的想法——將其放置在一個(gè)安全節(jié)能,合理組織的信息庫(kù)里,以備將來(lái)某一天的突然需要——聽(tīng)起來(lái)夠直白了吧。然而即使是這樣一個(gè)簡(jiǎn)單的想法也是充滿了問(wèn)題,需要提前做好深思熟慮的。本文討論的一些決策可能會(huì)影響到你的歸檔項(xiàng)目的成敗。
在大多數(shù)關(guān)于歸檔的討論中的一個(gè)典型問(wèn)題就是,數(shù)據(jù)的組織方式和格式是否經(jīng)得起時(shí)間的考驗(yàn)。如果數(shù)據(jù)歸類的方式在以后需要發(fā)生改變,那怎么辦——例如,對(duì)某些類型數(shù)據(jù)管控和保留的規(guī)則發(fā)生了變化。或者用于創(chuàng)建某種數(shù)據(jù)的應(yīng)用程序不再被新的操作系統(tǒng)或硬件平臺(tái)支持,比方說(shuō)10年后?難道在可預(yù)見(jiàn)的未來(lái)你都必須保留一份現(xiàn)有應(yīng)用程序和處理器的副本嗎?這些實(shí)際問(wèn)題都需要簡(jiǎn)單而有效的解決對(duì)策。
從數(shù)據(jù)歸檔方法的發(fā)展上思考這些問(wèn)題的答案是有助益的。在過(guò)去,數(shù)據(jù)歸類并放入存檔是根據(jù)元數(shù)據(jù)(metadata),或數(shù)據(jù)的數(shù)據(jù)。一個(gè)數(shù)據(jù)集或文件,根據(jù)其元數(shù)據(jù),如果在30、60、90天或更長(zhǎng)時(shí)間內(nèi)沒(méi)有被訪問(wèn)到或修改,就會(huì)被簡(jiǎn)單地遷移出生產(chǎn)系統(tǒng)的存儲(chǔ)空間,轉(zhuǎn)入歸檔存儲(chǔ)。然而,這種方法沒(méi)有任何粒度的區(qū)別。它完全不顧數(shù)據(jù)的重要性,與特定業(yè)務(wù)流程的相關(guān)性,或者與任何數(shù)據(jù)保留的法規(guī)法律的關(guān)聯(lián)性。所以這個(gè)過(guò)程有可能保存下來(lái)的有可能是垃圾文件,互聯(lián)網(wǎng)cookies和瀏覽器殘余,甚至是很久以前測(cè)試、開發(fā)過(guò)程中創(chuàng)建的臨時(shí)虛擬機(jī)的鏡像文件。
最起碼的一點(diǎn)是,除非你有一個(gè)“數(shù)據(jù)清潔”的程序到位,并幫助清除掉那些雜物,否則你的存檔系統(tǒng)注定會(huì)像你的主存儲(chǔ)系統(tǒng)一樣,在經(jīng)過(guò)一段時(shí)間后充滿了各種垃圾。這使得將來(lái)在存檔系統(tǒng)中搜索和使用有用信息更具挑戰(zhàn)。
對(duì)于無(wú)顆粒數(shù)據(jù)選擇的一種可選方案是基于誰(shuí)創(chuàng)建它來(lái)進(jìn)行分類。如果甲喬在會(huì)計(jì)部門工作,從喬甲的工作站中出來(lái)的所有數(shù)據(jù)都可以被作為“會(huì)計(jì)類數(shù)據(jù)”,并經(jīng)由為該類數(shù)據(jù)所制定的存檔策略進(jìn)行處理。然而,這種做法也為以后留下了麻煩,例如,當(dāng)甲喬的職位發(fā)生變化,從會(huì)計(jì)部門到銷售部門(對(duì)數(shù)據(jù)歸檔的策略完全不同),或者當(dāng)甲喬喜歡上社交媒體,他在推特和博客中分享關(guān)于他的孩子和愛(ài)好的信息開始和他的合法工作文件一起存檔。你不得不再次面對(duì)存檔系統(tǒng)滿是垃圾,數(shù)據(jù)搜索使用很難的結(jié)果。
根據(jù)部門工作流程的數(shù)據(jù)分類
數(shù)據(jù)分類的最佳方式是把概念作為最大的粒度:按部門的工作流程創(chuàng)建數(shù)據(jù)分類,而不是按用戶角色來(lái)分類數(shù)據(jù)。然后在元數(shù)據(jù)中設(shè)置像“數(shù)據(jù)上次訪問(wèn)時(shí)間”和“數(shù)據(jù)最后修改時(shí)間”這樣的觸發(fā)器,以確定何時(shí)將相關(guān)文件轉(zhuǎn)移到存檔系統(tǒng)。一些新興的分層存儲(chǔ)架構(gòu),如FLAPE(flash plus tape,閃存加磁帶),可以使你在把數(shù)據(jù)寫入主存儲(chǔ)系統(tǒng)(閃存,硬盤或兩者的組合)的同時(shí)就把數(shù)據(jù)也保存到歸檔系統(tǒng),這樣,你無(wú)需以后再次把數(shù)據(jù)移到歸檔系統(tǒng),而是保存在主存儲(chǔ)系統(tǒng)中的文件在達(dá)到其歸檔點(diǎn)后會(huì)被簡(jiǎn)單地刪除。
作為一項(xiàng)規(guī)則,今天的歸檔管理員會(huì)盡量規(guī)避那些可能有“時(shí)限”的數(shù)據(jù)格式。文件系統(tǒng)看起來(lái)相當(dāng)穩(wěn)定,但是用于存儲(chǔ)數(shù)據(jù)位的“容器”,要使得它們?cè)陔x開了最初創(chuàng)建它們的原軟件后,依然能夠被使用——例如,有些商業(yè)文件格式,如Adobe PDF,或部分仍然處于試驗(yàn)階段的“標(biāo)準(zhǔn)”XML容器——這依然是個(gè)問(wèn)題。一家重要的國(guó)家檔案館幾年前選擇了Adobe PDF作為他們的數(shù)據(jù)容器,卻對(duì)此決定后悔不迭。因?yàn)锳dobe在他們決定后的兩年就改變了PDF格式,他們?yōu)榇瞬坏貌粚?duì)每一個(gè)數(shù)據(jù)進(jìn)行“解”攝取,重新格式化,然后重新攝取的工作,花費(fèi)了比以前多出30多倍的時(shí)間和工作量。
另一個(gè)挑戰(zhàn)則可能來(lái)自于早期對(duì)文件系統(tǒng)的穩(wěn)定性和永久性的假設(shè)。實(shí)際上,文件系統(tǒng)也一直在改變,新的文件系統(tǒng),被每一個(gè)今天流行的操作系統(tǒng)引入并利用,伴隨著新的功能特性,例如作為存儲(chǔ)方法一部分的重復(fù)數(shù)據(jù)刪除和壓縮,或作為數(shù)據(jù)保護(hù)方法的糾刪編碼。文件系統(tǒng)扁平化趨勢(shì)隨著網(wǎng)絡(luò)的發(fā)展有可能預(yù)示著傳統(tǒng)的分層或基于樹的文件系統(tǒng)模型將會(huì)在較短的時(shí)間內(nèi)被新的范式所取代,那時(shí)所有數(shù)據(jù)都以對(duì)象進(jìn)行保存,在一個(gè)類數(shù)據(jù)庫(kù)的結(jié)構(gòu)中自描述或自索引。
對(duì)象存儲(chǔ)的歸檔
新的商業(yè)技術(shù),如Caringo Software的SWARM或Spectra Logic的Black Pearl,說(shuō)明作為傳統(tǒng)存儲(chǔ)歸檔方法替代品的對(duì)象存儲(chǔ)市場(chǎng)正在孕育出真正成熟的解決方案。盡管如此,截止本文寫作之時(shí)市場(chǎng)上依然沒(méi)有占主導(dǎo)地位的架構(gòu)模式,而標(biāo)準(zhǔn)化的工作也還處于起步階段。假以時(shí)日,對(duì)象存儲(chǔ)和歸檔將會(huì)有很大的交疊。
將所有數(shù)據(jù)集作為對(duì)象對(duì)待的雙重優(yōu)點(diǎn):
1.待存儲(chǔ)的數(shù)據(jù)集可以有大量豐富的元數(shù)據(jù),可以對(duì)數(shù)據(jù)對(duì)象進(jìn)行更精確地識(shí)別和分類,進(jìn)而可以把非常精細(xì)的策略應(yīng)用于數(shù)據(jù)的保持和維護(hù)。
2.整個(gè)存儲(chǔ)基礎(chǔ)設(shè)施和其上的數(shù)據(jù)可以被完整地進(jìn)行管理,無(wú)需任何特殊軟件或設(shè)備提供數(shù)據(jù)保護(hù)或保存。這是因?yàn)閿?shù)據(jù)保護(hù)的規(guī)則已經(jīng)被寫進(jìn)了特定類型的所有數(shù)據(jù)對(duì)象的元數(shù)據(jù)中。
例如,Caringo的SWARM技術(shù),可以通過(guò)糾刪編碼將存儲(chǔ)數(shù)據(jù)的復(fù)制對(duì)象的各部分分散到整個(gè)存儲(chǔ)基礎(chǔ)設(shè)施中,并在其元數(shù)據(jù)中加入檢索標(biāo)示。這樣,當(dāng)某一存儲(chǔ)設(shè)備發(fā)生故障時(shí),存儲(chǔ)對(duì)象依然能夠通過(guò)那些正常設(shè)備上存儲(chǔ)的部分來(lái)進(jìn)行重建。而對(duì)于其他不需要這種保護(hù)功能的數(shù)據(jù)類型,可以把存儲(chǔ)對(duì)象的元數(shù)據(jù)句柄中簡(jiǎn)單地設(shè)置成鏡像策略。這樣,數(shù)據(jù)的保障策略可以很容易地分配,使得存儲(chǔ)基礎(chǔ)設(shè)施成為歸檔和主存儲(chǔ)的一個(gè)通用平臺(tái)。
出現(xiàn)這種“歸檔就位”的策略,其中一個(gè)原因是可以推動(dòng)大數(shù)據(jù)分析。另一個(gè)原因是存儲(chǔ)服務(wù)的成本被包含其中。而對(duì)于歸檔管理員,簡(jiǎn)化日后數(shù)據(jù)歸類和保存的方法是其意義所在。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:關(guān)于歸檔的幾個(gè)最新技術(shù)
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121517756.html