1. 引言
圖靈獎(jiǎng)獲得者吉姆·格雷(Jim Gray)在其獲獎(jiǎng)演說(shuō)[1]中指出:由于互聯(lián)網(wǎng)的發(fā)展,未來(lái)每十八個(gè)月新產(chǎn)生的數(shù)據(jù)量將是有史以來(lái)數(shù)據(jù)量之和。人類(lèi)社會(huì)產(chǎn)生的數(shù)據(jù)信息一方面來(lái)自于互聯(lián)網(wǎng),一方面來(lái)自于日常生產(chǎn)及各種科學(xué)試驗(yàn),例如科學(xué)計(jì)算和仿真、飛行動(dòng)力學(xué)、核爆炸仿真、太空探測(cè)及醫(yī)療影像數(shù)據(jù)等每天所產(chǎn)生的數(shù)據(jù)信息更是大到了驚人的程度[2]。
信息存儲(chǔ)系統(tǒng)朝無(wú)限的帶寬、無(wú)限的容量和無(wú)限的處理能力(Infinite Bandwidth, Infinite Capacity, Infinite Processing Capability),即“3i”方向發(fā)展,提出“Anytime, Anywhere, Anything”的目標(biāo),即要求數(shù)據(jù)在任意時(shí)間、任意地點(diǎn)實(shí)現(xiàn)任意數(shù)據(jù)訪問(wèn)。存儲(chǔ)產(chǎn)品不再是附屬于服務(wù)器的輔助設(shè)備,而成為互聯(lián)網(wǎng)中最主要的花費(fèi)所在。信息技術(shù)正從以計(jì)算為核心的計(jì)算時(shí)代進(jìn)入到以存儲(chǔ)為核心的存儲(chǔ)時(shí)代,網(wǎng)絡(luò)化存儲(chǔ)將成為未來(lái)存儲(chǔ)市場(chǎng)的熱點(diǎn)。甚至有人說(shuō):網(wǎng)絡(luò)存儲(chǔ)已成為繼計(jì)算機(jī)浪潮和互聯(lián)網(wǎng)浪潮之后的第三次浪潮。而目前的云存儲(chǔ)服務(wù)是網(wǎng)絡(luò)存儲(chǔ)發(fā)展的必然趨勢(shì)。
首先介紹云存儲(chǔ)服務(wù)的意義與重要性,然后介紹國(guó)內(nèi)外目前在可證明數(shù)據(jù)持有和恢復(fù)技術(shù)方面的研究現(xiàn)狀,在第四部分討論了云存儲(chǔ)服務(wù)的安全性與可靠性需求,并研究云存儲(chǔ)服務(wù)對(duì)可證明數(shù)據(jù)持有及恢復(fù)方案的特殊要求,最后進(jìn)行總結(jié)。
2. 云存儲(chǔ)服務(wù)
目前對(duì)云存儲(chǔ)(Cloud Storage)的定義眾說(shuō)紛紜,還沒(méi)有一個(gè)統(tǒng)一的定義,但是云存儲(chǔ)的特點(diǎn)可概括為:
高德納(Gartner)咨詢公司預(yù)測(cè)到2012年,20%的公司將不再擁有自己的IT資產(chǎn)而轉(zhuǎn)向云。在日立數(shù)據(jù)系統(tǒng)公司公布的《2010年十大存儲(chǔ)投資方向》報(bào)告[4]中,云存儲(chǔ)位列第二。該公司聲稱:“2010年,人們對(duì)云的認(rèn)識(shí)將繼續(xù)提升,私有云的構(gòu)建者和公共云服務(wù)提供商也將持續(xù)關(guān)注彈性、可靠性、多租戶和安全性等問(wèn)題。我們預(yù)計(jì),隨著安全性、多租戶和付費(fèi)模式等關(guān)鍵功能的不斷演進(jìn),未來(lái)用戶將會(huì)越來(lái)越多地采用云存儲(chǔ)!贝鎯(chǔ)市場(chǎng)具有無(wú)限的潛力,而云存儲(chǔ)是信息存儲(chǔ)的一種趨勢(shì),它可為用戶帶來(lái)如下好處:
云存儲(chǔ)的主要特色是容量規(guī)模大,使用多少,支付多少,上不封頂,下不設(shè)限。有了云存儲(chǔ),永遠(yuǎn)也不會(huì)出現(xiàn)存儲(chǔ)空間不足的情況。對(duì)存儲(chǔ)需求不可預(yù)測(cè)、需要廉價(jià)存儲(chǔ)陣列或低成本長(zhǎng)期存檔的用戶來(lái)說(shuō),按需購(gòu)買(mǎi)存儲(chǔ)容量的云存儲(chǔ)與一次性購(gòu)買(mǎi)整套存儲(chǔ)系統(tǒng)相比顯然會(huì)帶來(lái)更多的方便和效益。并且,云存儲(chǔ)在為用戶節(jié)省初始投資的同時(shí)也節(jié)約了社會(huì)資源與能源。
云存儲(chǔ)具有眾多優(yōu)點(diǎn),但是因?yàn)橛脩魧?duì)云存儲(chǔ)服務(wù)的安全性、可靠性及可用性等問(wèn)題有所懷疑,所以目前還沒(méi)有得到人們的廣泛認(rèn)可與使用。特別地,在微軟弄丟了Sidekick用戶的數(shù)據(jù),SwissDisk的文件管理器出現(xiàn)崩潰故障,Amazon S3宕機(jī)頻繁,曾經(jīng)一次持續(xù)了8個(gè)小時(shí),哪個(gè)用戶還敢將數(shù)據(jù)托付給云存儲(chǔ)服務(wù)呢?即便是著名品牌服務(wù)商也沒(méi)有擔(dān)保其云存儲(chǔ)服務(wù)的安全性與可靠性。
引用美國(guó)前總統(tǒng)羅納德·里根的一句名言,“要我相信你,請(qǐng)你先證明給我看(Trust but verify)”。所以在云存儲(chǔ)中,讓用戶可以驗(yàn)證服務(wù)提供者正確地持有其數(shù)據(jù),且如果檢測(cè)發(fā)生錯(cuò)誤時(shí)可以恢復(fù)其數(shù)據(jù)是一件很有意義的研究工作。
如果用戶都信任云存儲(chǔ)服務(wù)提供者,或者是服務(wù)提供者確實(shí)做到了安全可靠地存儲(chǔ)用戶的數(shù)據(jù),那么云存儲(chǔ)將具有無(wú)限的潛力,它在為用戶帶來(lái)方便和效益的同時(shí),也為社會(huì)節(jié)約了大量的資源與能源。
3. 可證明數(shù)據(jù)持有與恢復(fù)技術(shù)
可證明數(shù)據(jù)持有和恢復(fù)技術(shù)是驗(yàn)證不可信的存儲(chǔ)服務(wù)器是否正確地持有(保存)數(shù)據(jù),避免存儲(chǔ)服務(wù)提供者刪除、篡改數(shù)據(jù),并確保存儲(chǔ)數(shù)據(jù)的可恢復(fù)性。目前的研究工作主要集中在可證明數(shù)據(jù)持有(Provable Data Possession, PDP)方案和可恢復(fù)證明(Proof Of Retrievability, POR)方案。PDP和POR方案的主要區(qū)別是:PDP方案可檢測(cè)到存儲(chǔ)數(shù)據(jù)是否完整,但無(wú)法確保數(shù)據(jù)可恢復(fù)性;POR方案保證了存儲(chǔ)數(shù)據(jù)的可恢復(fù)性。通常,考核數(shù)據(jù)持有性證明方案優(yōu)劣的指標(biāo)有:
(1)計(jì)算復(fù)雜度,包括用戶預(yù)處理文件、服務(wù)器生成證據(jù)及用戶驗(yàn)證等開(kāi)銷(xiāo);
(2)通信復(fù)雜性,指用戶與服務(wù)器之間的數(shù)據(jù)傳輸量;
(3)存儲(chǔ)需求,指用戶與服務(wù)器需要的額外的存儲(chǔ)空間;
(4)允許的數(shù)據(jù)更新,包括數(shù)據(jù)修改、插入、添加、刪除;如果不支持更新,就只能用于靜態(tài)數(shù)據(jù),一旦存儲(chǔ)就不再改變,比如歸檔存儲(chǔ);
(5)允許驗(yàn)證的次數(shù),是否支持公開(kāi)驗(yàn)證;
(6)檢測(cè)到錯(cuò)誤后是否可恢復(fù),比如是否使用糾刪碼/糾錯(cuò)碼等;
(7)安全性證明,確保方案的安全性;
(8)是否需要訪問(wèn)數(shù)據(jù)塊以及需要訪問(wèn)多少數(shù)據(jù)塊等。
下面將根據(jù)評(píng)價(jià)指標(biāo)綜述PDP方案和POR方案及其相關(guān)工作在國(guó)內(nèi)外的研究現(xiàn)狀。
3.1 PDP方案
文獻(xiàn)[5]最早提出遠(yuǎn)程數(shù)據(jù)的完整性檢查,使用基于RSA的Hash函數(shù)對(duì)整個(gè)文件計(jì)算Hash值。其原理為:令N為RSA模數(shù),F(xiàn)為代表文件的大整數(shù),g∈ZN*,檢查者保存a = gF mod N;在挑戰(zhàn)中,檢查者生成任意元素r并發(fā)送gr到服務(wù)器,服務(wù)器返回s = (gr)F mod N,檢查者計(jì)算ar,并驗(yàn)證等式s = ar mod N是否成立。因?yàn)樵摲椒ɑ诠密碼技術(shù),所以方案的計(jì)算開(kāi)銷(xiāo)很大;特別當(dāng)存儲(chǔ)文件大的時(shí)候,該方案的計(jì)算開(kāi)銷(xiāo)更大。文獻(xiàn)[6]的原理與此相同,但其目的是阻止數(shù)據(jù)傳輸中的欺騙。
約翰·霍普金斯大學(xué)(Johns Hopkins University)的Ateniese等人在這方面做了一些研究工作,他們?cè)谖墨I(xiàn)[7]中第一次正式定義PDP方案,文中提出的兩個(gè)PDP方案都是使用同態(tài)可驗(yàn)證標(biāo)簽(Homomorphic Verifiable Tags),用戶為每個(gè)數(shù)據(jù)塊生成一個(gè)Tag,將此Tag連同數(shù)據(jù)存放在服務(wù)器上。驗(yàn)證時(shí),用戶隨機(jī)選擇一些塊向服務(wù)器發(fā)出挑戰(zhàn),要求服務(wù)器返回持有這些塊的證據(jù)。服務(wù)器利用請(qǐng)求塊及相應(yīng)的標(biāo)簽生成持有證據(jù),因?yàn)橥瑧B(tài)性,多個(gè)文件塊的標(biāo)簽可以聚合成一個(gè)值,因此極大地節(jié)省了響應(yīng)帶寬。用戶通過(guò)驗(yàn)證響應(yīng)信息確認(rèn)數(shù)據(jù)擁有,而不需要檢索數(shù)據(jù)。提出的方案只需要用戶維護(hù)常量的元數(shù)據(jù)信息,服務(wù)器的開(kāi)銷(xiāo)也近似為一個(gè)常量,挑戰(zhàn)應(yīng)答只要1Kbit左右,實(shí)驗(yàn)表明方案的性能受限于磁盤(pán)I/O而不是密碼計(jì)算。文中作者第一次提出公開(kāi)驗(yàn)證的方法。但是該方案在生成證據(jù)時(shí)使用基于RSA的模指運(yùn)算,也沒(méi)有考慮數(shù)據(jù)更新問(wèn)題。并且該方案的多個(gè)服務(wù)器可以共謀(collusion attacks),所以不適用于多復(fù)本協(xié)議。
他們?cè)谖墨I(xiàn)[8]中提出在隨機(jī)預(yù)言模型(Random Oracle Model)下使用任何具有同態(tài)屬性的鑒定協(xié)議(Identification Protocol)構(gòu)造公鑰同態(tài)線性認(rèn)證器(Homomorphic Linear Authenticator,HLA)的通用機(jī)制,并表明怎樣將任何公鑰HLA轉(zhuǎn)化為公開(kāi)可驗(yàn)證的存儲(chǔ)證明方案(Proofs of storage, PoS),使通信復(fù)雜度與文件長(zhǎng)度無(wú)關(guān),并且支持無(wú)限次驗(yàn)證。但是該方案也是基于公鑰密碼技術(shù),所以計(jì)算開(kāi)銷(xiāo)比較大。在文獻(xiàn)[9]中,他們提出基于對(duì)稱密碼技術(shù)構(gòu)造PDP方案。該方案在初始化的時(shí)候,由用戶設(shè)定要挑戰(zhàn)的次數(shù)和內(nèi)容,將響應(yīng)作為元數(shù)據(jù)存放在用戶端,因此,更新次數(shù)和挑戰(zhàn)次數(shù)都是有限的。而且只支持append-類(lèi)型的插入,也不支持公開(kāi)驗(yàn)證。同時(shí),他們所在的研究小組第一次提出多復(fù)本PDP(multiple-replica PDP, MR-PDP)方案[10],允許用戶通過(guò)挑戰(zhàn)應(yīng)答協(xié)議驗(yàn)證服務(wù)器存儲(chǔ)文件t個(gè)復(fù)本:(1)每個(gè)復(fù)本是可用的;(2)使用t倍的存儲(chǔ)空間存儲(chǔ)數(shù)據(jù)的t個(gè)復(fù)本。MR-PDP擴(kuò)展了文獻(xiàn)[7]的單拷貝的情況,還可以增加新的復(fù)本,而不需要對(duì)文件進(jìn)行預(yù)處理。該方案首先將數(shù)據(jù)加密,然后將加密數(shù)據(jù)與t個(gè)不同的隨機(jī)掩碼異或,當(dāng)數(shù)據(jù)量大時(shí)會(huì)帶來(lái)較大的計(jì)算開(kāi)銷(xiāo),而且每個(gè)服務(wù)器要分別響應(yīng)挑戰(zhàn),其開(kāi)銷(xiāo)也很大。該方案仍然基于RSA,也沒(méi)有考慮數(shù)據(jù)更新問(wèn)題。
清華大學(xué)的舒繼武教授等人提出的數(shù)據(jù)持有性檢查(data possession checking,DPC)[11]是國(guó)內(nèi)第一篇關(guān)于數(shù)據(jù)持有性證明的論文。方案的基本思想是在一次挑戰(zhàn)中,檢查者指定文件中c個(gè)隨機(jī)位置的數(shù)據(jù)塊和一個(gè)密鑰k2,服務(wù)器根據(jù)這些數(shù)據(jù)塊和密鑰k2由單向Hash函數(shù)h(·)計(jì)算出一個(gè)Hash值,并和一個(gè)與之對(duì)應(yīng)的校驗(yàn)塊一起返回給檢查者,檢查者檢查Hash值和校驗(yàn)塊是否匹配以確定應(yīng)答是否有效。為了避免檢查者為每個(gè)挑戰(zhàn)記住c個(gè)隨機(jī)位置和密鑰,每次挑戰(zhàn)的位置由偽隨機(jī)置換g(·)根據(jù)一個(gè)密鑰k1生成,并且第j次挑戰(zhàn)的k1和k2可由第j-1次挑戰(zhàn)的k1和k2得到,這樣檢查者只需為每個(gè)文件記住兩個(gè)密鑰即可。同時(shí)提出一個(gè)基于校驗(yàn)塊循環(huán)隊(duì)列的挑戰(zhàn)更新機(jī)制,通過(guò)更新挑戰(zhàn)允許動(dòng)態(tài)增加檢查者可發(fā)起的有效挑戰(zhàn)的次數(shù)。分析表明檢查者端的存儲(chǔ)開(kāi)銷(xiāo)和檢查者和服務(wù)器間的通信開(kāi)銷(xiāo)均為常數(shù)量級(jí).測(cè)試結(jié)果表明一次置信度為99.4%的持有性檢查的計(jì)算開(kāi)銷(xiāo)為1.8ms,和磁盤(pán)I/O開(kāi)銷(xiāo)相比可以忽略不計(jì)。方案通過(guò)避免使用公鑰密碼系統(tǒng),將文件預(yù)處理的計(jì)算開(kāi)銷(xiāo)降低了3個(gè)數(shù)量級(jí)。但是他們沒(méi)有提供安全性證明。
布朗大學(xué)(Brown University)的Erway等人提出兩種動(dòng)態(tài)數(shù)據(jù)持有性證明方案(Dynamic PDP, DPDP)[12]實(shí)現(xiàn)數(shù)據(jù)更新。一種使用基于等級(jí)的鑒別跳表(Rank-based authenticated skip lists),一種基于RSA樹(shù)結(jié)構(gòu)。他們的主要工作是實(shí)現(xiàn)動(dòng)態(tài)性,即實(shí)現(xiàn)插入操作。整個(gè)方案仍然是基于RSA的模指運(yùn)算。
文獻(xiàn)[13]利用基于RSA的Hash函數(shù)的同態(tài)性,可以在初始化時(shí)間開(kāi)銷(xiāo)與用戶的存儲(chǔ)開(kāi)銷(xiāo)間進(jìn)行權(quán)衡,該方案也是基于RSA,用戶和存儲(chǔ)服務(wù)器都有模指運(yùn)算,計(jì)算開(kāi)銷(xiāo)太大。文獻(xiàn)[14]提出利用同態(tài)Hash構(gòu)建同態(tài)標(biāo)簽實(shí)現(xiàn)無(wú)限次數(shù)據(jù)持有性驗(yàn)證,其缺點(diǎn)在于沒(méi)有考慮數(shù)據(jù)的動(dòng)態(tài)性。文獻(xiàn)[15]提出利用代數(shù)簽名實(shí)現(xiàn)數(shù)據(jù)持有性驗(yàn)證,該方案簡(jiǎn)單高效,其基本方案只支持有限次數(shù)據(jù)驗(yàn)證,作者提出一種挑戰(zhàn)更新方案。文獻(xiàn)[16]提出一種高效的數(shù)據(jù)持有性證明,作者還提出一種基于RSA的挑戰(zhàn)更新機(jī)制,但它們的缺點(diǎn)仍然在于沒(méi)有考慮數(shù)據(jù)的動(dòng)態(tài)性。
3.2 POR方案
RSA實(shí)驗(yàn)室的Juels和EMC公司的Kaliski第一次提出POR的概念[17],并提出基于“哨兵”(sentinel)的POR方案。其基本思想是首先將文件加密并使用糾錯(cuò)碼編碼,在編碼后的文件中隨機(jī)插入和文件數(shù)據(jù)不可區(qū)分的“哨兵”;檢查者在挑戰(zhàn)時(shí)要求服務(wù)器返回在這些隨機(jī)位置的“哨兵”。他們證明只要服務(wù)器以大于一定值的概率作出有效應(yīng)答,則文件是可恢復(fù)的。因?yàn)槊刻魬?zhàn)一次就消耗一個(gè)崗哨,并且沒(méi)有挑戰(zhàn)更新機(jī)制,因此只能進(jìn)行有限次的挑戰(zhàn)。因?yàn)榫幋a及增加的“哨兵”導(dǎo)致文件的膨脹率達(dá)到15%。
加州大學(xué)圣地亞哥分校的Shacham和德克薩斯大學(xué)奧斯汀分校的Waters在文獻(xiàn)[18]中提出的兩個(gè)方案也是使用同態(tài)標(biāo)簽:一個(gè)方案基于偽隨機(jī)函數(shù),不支持公開(kāi)驗(yàn)證;另一個(gè)方案基于BLS簽名[19],支持公開(kāi)驗(yàn)證。他們使用糾刪碼編碼,但是沒(méi)有考慮數(shù)據(jù)更新問(wèn)題。
在文獻(xiàn)[20]中,Dodis等人第一次提出POR碼,并對(duì)其進(jìn)行形式化及理論分析工作,給出了幾個(gè)將POR碼轉(zhuǎn)換為POR方案的方法。他們提出在安全性與其它參數(shù)(如使用次數(shù)、挑戰(zhàn)位置和服務(wù)器存儲(chǔ)開(kāi)銷(xiāo)等)之間進(jìn)行權(quán)衡的方案,但文中沒(méi)有特別考慮通信開(kāi)銷(xiāo)及計(jì)算開(kāi)銷(xiāo),也沒(méi)有考慮數(shù)據(jù)更新問(wèn)題。
RSA實(shí)驗(yàn)室的Bowers等人在文獻(xiàn)[23]中提出的HAIL方案在多個(gè)存儲(chǔ)服務(wù)提供者之間作數(shù)據(jù)副本或冗余,然后使用POR方案檢測(cè)數(shù)據(jù)是否被破壞。當(dāng)檢測(cè)到某一服務(wù)提供者的數(shù)據(jù)被破壞時(shí),可以利用其它服務(wù)器的數(shù)據(jù)進(jìn)行恢復(fù)。作者提出將MAC碼嵌入奇偶校驗(yàn)塊中。首先HAIL使用分散碼(dispersal code)將文件塊分散到不同服務(wù)器上,因?yàn)镸AC和奇偶校驗(yàn)塊都可以基于UHFs (universal hash functions),因此就可能創(chuàng)建一個(gè)塊同時(shí)是MAC和奇偶校驗(yàn)塊,基于這個(gè)思想,作者構(gòu)造保護(hù)完整性的糾錯(cuò)碼IP-ECC,結(jié)合PRFs, ECCs及UHFs,實(shí)現(xiàn)糾錯(cuò)碼的同時(shí)也是一種抵抗破壞的MAC碼。文中對(duì)攻擊模型有一個(gè)重要的約束條件:在一個(gè)給定的時(shí)間段,只能控制n個(gè)服務(wù)器中的b個(gè),這樣的一個(gè)時(shí)間段叫做epoch,那么過(guò)了n/b個(gè)epoch,數(shù)據(jù)可能都被破壞。HAIL方案保護(hù)靜態(tài)數(shù)據(jù)的完整性,不能進(jìn)行數(shù)據(jù)更新,也不能進(jìn)行公開(kāi)驗(yàn)證。
Curtmola等人集成前向糾錯(cuò)碼(forward errorcorrecting codes,F(xiàn)EC)到PDP方案中,他們考慮不同的FEC編碼有不同的性能、靈活性、糾錯(cuò)碼效率和數(shù)據(jù)輸出格式等.他們認(rèn)為RS編碼效率太低,所以將原始文件交換位置,從中選擇一部分進(jìn)行RS編碼,從而提高編碼效率;而且攻擊者不知道冗余碼是從哪些塊計(jì)算得到的,可以提高安全性。
3.3其它方案
圣塔克萊拉大學(xué)(Santa Clara University)的Schwarz和加州大學(xué)圣克魯茲分校(UCSC)的Miller在文獻(xiàn)[24]中提出使用線性糾刪碼將數(shù)據(jù)編碼,使用代數(shù)簽名(algebraic signature)對(duì)塊計(jì)算指紋。因?yàn)榇鷶?shù)簽名具同態(tài)屬性,而且ECC是線性碼,所以只要在相同的域上計(jì)算簽名和奇偶校驗(yàn),就可以使用數(shù)據(jù)的簽名計(jì)算得到唯一的奇偶校驗(yàn)的代數(shù)簽名。他們考慮的是P2P的環(huán)境下,將數(shù)據(jù)編碼后分條存放在Internet上的普通機(jī)器上,他們沒(méi)有給出方案的安全性證明。
HP實(shí)驗(yàn)室的Lillibridge等人在文獻(xiàn)[25]中提出利用Internet的普通機(jī)器實(shí)現(xiàn)P2P備份系統(tǒng)。每個(gè)計(jì)算機(jī)有一個(gè)伙伴集,并且由一個(gè)簡(jiǎn)單的中心服務(wù)器來(lái)尋找伙伴。每個(gè)計(jì)算機(jī)周期地向中心服務(wù)器更新它的身份及需要的伙伴,中心服務(wù)器向它提供侯選伙伴集,該計(jì)算機(jī)再聯(lián)系這些伙伴。為保證機(jī)密性,數(shù)據(jù)發(fā)送給伙伴機(jī)前使用對(duì)稱密碼技術(shù)加密,并且使用Reed-Solomon糾錯(cuò)碼在伙伴機(jī)器間進(jìn)行冗余糾錯(cuò)。數(shù)據(jù)擁有者可以向伙伴機(jī)器發(fā)起挑戰(zhàn),判斷該伙伴是否完整保存數(shù)據(jù),類(lèi)似于PDP方案,驗(yàn)證時(shí)使用MAC碼,額外的存儲(chǔ)開(kāi)銷(xiāo)比較大。
HP實(shí)驗(yàn)室的Shah等人在文獻(xiàn)[26]中提出了基于數(shù)據(jù)委托的方案;诩用芪募腗AC,第三方審計(jì)者通過(guò)挑戰(zhàn)應(yīng)答驗(yàn)證存儲(chǔ)服務(wù)提供者持有一個(gè)加密的文件。因?yàn)樘魬?zhàn)是預(yù)計(jì)算的,只能進(jìn)行有限次的驗(yàn)證,元數(shù)據(jù)也隨挑戰(zhàn)次數(shù)線性增長(zhǎng);并且方案只能用于加密的文件,要求審計(jì)者維護(hù)長(zhǎng)期的狀態(tài)信息。在文獻(xiàn)[27]中他們提出了具有隱私保護(hù)特性的方案,即不向第三方泄露任何信息。該方案也只能用于加密的文件,也要對(duì)整個(gè)文件計(jì)算MAC以及使用MAC驗(yàn)證數(shù)據(jù)持有性,有較大的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo),且沒(méi)有考慮數(shù)據(jù)更新問(wèn)題及相關(guān)數(shù)據(jù)恢復(fù)技術(shù)。
布朗大學(xué)(Brown University)的Heitzmann等人在文獻(xiàn)[28]中提出驗(yàn)證服務(wù)器響應(yīng)的數(shù)據(jù)與用戶執(zhí)行的更新是否一致。該方案不同于PDP方案,其目標(biāo)不在于檢測(cè)到數(shù)據(jù)破壞,而是驗(yàn)證服務(wù)器響應(yīng)的數(shù)據(jù)與Client執(zhí)行的更新一致,因此,響應(yīng)數(shù)據(jù)只被用于驗(yàn)證完整性,并且只在請(qǐng)求文件的時(shí)候才執(zhí)行。方案使用鑒別跳表維護(hù)認(rèn)證信息,支持簡(jiǎn)單快速的更新。他們實(shí)現(xiàn)了一個(gè)在Amazon S3上的原型系統(tǒng),用戶只需存放一個(gè)Hash值,存儲(chǔ)開(kāi)銷(xiāo)為O(1),服務(wù)器的計(jì)算開(kāi)銷(xiāo)是O(log(n))。
Sebe等人在文獻(xiàn)[29]中提出的方案基于Diffie-Hellman問(wèn)題,要求用戶為每個(gè)塊存放N位RSA模位數(shù),因此其存儲(chǔ)開(kāi)銷(xiāo)隨塊數(shù)線性增長(zhǎng),并且協(xié)議要求服務(wù)器訪問(wèn)整個(gè)文件。
新加坡國(guó)立大學(xué)(National University of Singapore)的Chang和Xu在文獻(xiàn)[30]中提出Remote Integrity Check (RIC),RIC方案結(jié)合文獻(xiàn)[6]中基于RSA的方案和文獻(xiàn)[31]中基于ECC的鑒定器,它不是POR系統(tǒng),但是所有在RIC下證明安全的方案也可用于POR系統(tǒng)。RIC的目標(biāo)在于只需要驗(yàn)證者存放少量的額外信息就可以定期地檢測(cè)遠(yuǎn)程服務(wù)是否保存了一個(gè)大文件。但是他們的方案也繼承了文獻(xiàn)[6]和[31]中方案的缺陷,基于公鑰密碼技術(shù),并且要求對(duì)整個(gè)文件取冪,計(jì)算開(kāi)銷(xiāo)很大。
在文獻(xiàn)[32]中,Yamamoto等人也提出使用基于RSA的同態(tài)Hash函數(shù)進(jìn)行數(shù)據(jù)持有性驗(yàn)證,同時(shí)作者還提出使用批驗(yàn)證提高效率。
伊利諾理工大學(xué)(Illinois Institute of Technology)的Wang和伍斯特理工學(xué)院(Worcester Polytechnic Institute)的Lou在文獻(xiàn)[33]中第一次在云計(jì)算環(huán)境下考慮數(shù)據(jù)存儲(chǔ)的安全性,他們提出的方案可以定位發(fā)生錯(cuò)誤的服務(wù)器,并實(shí)現(xiàn)了部分?jǐn)?shù)據(jù)更新操作,在接下來(lái)的工作[34]中,他們提出結(jié)合基于BLS[19]的同態(tài)鑒別器和MHT,支持公開(kāi)驗(yàn)證和數(shù)據(jù)更新。在文獻(xiàn)[35]中,他們考慮的是引入一個(gè)第三方的審計(jì)者,結(jié)合隨機(jī)掩碼技術(shù)實(shí)現(xiàn)隱私保護(hù),不向第三方審計(jì)者泄露信息。但是他們的數(shù)據(jù)持有性證明方案都是基于公鑰密碼技術(shù),且沒(méi)有考慮相關(guān)數(shù)據(jù)恢復(fù)技術(shù)。
3.4方案比較
根據(jù)方案的評(píng)價(jià)指標(biāo),一些方案的對(duì)比見(jiàn)表1,首先PDP方案一般不提供數(shù)據(jù)恢復(fù)技術(shù),另外上述的各種方案或者基于公鑰密碼技術(shù),所以計(jì)算開(kāi)銷(xiāo)很大,或者無(wú)數(shù)據(jù)更新方法,只能用于靜態(tài)歸檔存儲(chǔ),或者挑戰(zhàn)次數(shù)有限,不支持公開(kāi)驗(yàn)證。評(píng)價(jià)指標(biāo)如下:
表1 方案的各項(xiàng)指標(biāo)比較
如果考慮數(shù)據(jù)可恢復(fù)性時(shí),必然會(huì)增加用戶和服務(wù)器的計(jì)算開(kāi)銷(xiāo),那么為了公平,這里的計(jì)算開(kāi)銷(xiāo)只指發(fā)起挑戰(zhàn)與響應(yīng)的計(jì)算開(kāi)銷(xiāo)。而且不同的可恢復(fù)方案,其冗余度與糾錯(cuò)能力也有不同。總之,根據(jù)國(guó)內(nèi)外研究現(xiàn)狀可知,現(xiàn)有方案存在如下一些缺陷:
4. 云存儲(chǔ)服務(wù)對(duì)方案的需求研究
云存儲(chǔ)服務(wù)體系結(jié)構(gòu)如圖2所示,它是一種面向服務(wù)的體系結(jié)構(gòu),由用戶與存儲(chǔ)服務(wù)提供者組成。用戶將數(shù)據(jù)存放在服務(wù)提供者的服務(wù)器上,然后定期或不定期地驗(yàn)證其數(shù)據(jù)是否仍然完整無(wú)誤。
一般來(lái)說(shuō),對(duì)于云存儲(chǔ)服務(wù)提供者,他可能會(huì):
(1) 為了節(jié)約成本,丟棄不被訪問(wèn)或者訪問(wèn)較少的數(shù)據(jù),或者將在線數(shù)據(jù)遷移到二級(jí)磁帶等低速存儲(chǔ)設(shè)備上;
(2) 掩蓋由于管理失誤、硬件故障或者受到攻擊而引起的數(shù)據(jù)丟失事件;
(3) 篡改用戶數(shù)據(jù),或者泄漏用戶數(shù)據(jù);
(4) 不能達(dá)到聲稱的性能、可靠性,比如聲稱存放了t份復(fù)本,而事實(shí)上只有一份拷貝。
因此,對(duì)于用戶來(lái)說(shuō),云存儲(chǔ)服務(wù)安全性和可靠性主要集中在如下幾個(gè)方面:
(1) 數(shù)據(jù)的機(jī)密性保障;
(2) 數(shù)據(jù)的完整性保護(hù);
(3) 數(shù)據(jù)的可用性與可靠性保障。
數(shù)據(jù)的機(jī)密性可以通過(guò)加密實(shí)現(xiàn),完整性通過(guò)對(duì)數(shù)據(jù)計(jì)算摘要。但是,如何讓用戶確信其數(shù)據(jù)仍然正確無(wú)誤地存放在云存儲(chǔ)服務(wù)提供者的存儲(chǔ)設(shè)備上,我們稱之為存儲(chǔ)服務(wù)的數(shù)據(jù)持有性驗(yàn)證,這是一個(gè)亟待攻克的研究課題。此外,檢測(cè)到數(shù)據(jù)受到破壞后,必須研究相應(yīng)的恢復(fù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行恢復(fù)。因此,根據(jù)云存儲(chǔ)服務(wù)的特點(diǎn)及其廣泛的應(yīng)用領(lǐng)域,云存儲(chǔ)服務(wù)對(duì)可證明數(shù)據(jù)持有方案有以下幾方面的需求:
(1) 云存儲(chǔ)服務(wù)中高效且安全的數(shù)據(jù)持有性證明與恢復(fù)方案的設(shè)計(jì)。一方面要提高數(shù)據(jù)持有性證明方案的計(jì)算、通信、存儲(chǔ)效率;一方面提高檢測(cè)效率,以高概率和精度檢測(cè)到錯(cuò)誤并實(shí)現(xiàn)數(shù)據(jù)恢復(fù)。
(2) 支持更廣泛使用環(huán)境的云存儲(chǔ)技術(shù)研究。一方面可以使用任意聯(lián)網(wǎng)的設(shè)備,如PDA、手機(jī)、無(wú)線電話、上網(wǎng)本等驗(yàn)證數(shù)據(jù)是否正確存放并且可用,即實(shí)現(xiàn)適用于無(wú)線網(wǎng)絡(luò)環(huán)境的方案;因?yàn)闊o(wú)線設(shè)備的計(jì)算與存儲(chǔ)能力非常有限,所以對(duì)方案設(shè)計(jì)的要求較高。一方面要適用于各類(lèi)數(shù)據(jù)集,包括適用于海量數(shù)據(jù)集的方案。
(3) 有效地支持?jǐn)?shù)據(jù)更新的云存儲(chǔ)方案研究。數(shù)據(jù)更新操作主要包括數(shù)據(jù)修改、插入、添加、刪除,動(dòng)態(tài)數(shù)據(jù)更新對(duì)于存儲(chǔ)服務(wù)是一項(xiàng)非常重要的特征,它將決定用戶是否選擇使用該服務(wù)。
(4) 提供服務(wù)質(zhì)量保證的云存儲(chǔ)方案研究。一方面提供不同質(zhì)量的服務(wù);一方面用戶可以利用性能跟蹤工具以及多復(fù)本協(xié)議等來(lái)評(píng)價(jià)服務(wù)提供者的質(zhì)量,以達(dá)到服務(wù)器聲稱的性能及質(zhì)量。比如,聲稱數(shù)據(jù)帶寬為100KB/s,就可以達(dá)到100KB/s,如果聲稱是t份復(fù)本,則確實(shí)擁有t份復(fù)本。
(5) 針對(duì)不同類(lèi)型云存儲(chǔ)方案安全性證明方法的研究。因?yàn)樵拼鎯?chǔ)方案的設(shè)計(jì)大部分是采用了現(xiàn)代密碼技術(shù),所以其安全性證明可分為兩種:基于標(biāo)準(zhǔn)模型與基于隨機(jī)預(yù)言模型的安全性證明。但是,根據(jù)威脅模型及使用環(huán)境的不同,比如有些環(huán)境下存在一些動(dòng)態(tài)的攻擊者,那么安全性證明還要考慮到威脅的動(dòng)態(tài)性。因此,不同類(lèi)型的與儲(chǔ)存方案需要有符合相應(yīng)安全要求的安全性證明方法。
5. 結(jié)論
目前,因?yàn)榘踩耘c可靠性問(wèn)題,云存儲(chǔ)服務(wù)還不為用戶廣泛接納與采用。國(guó)內(nèi)對(duì)云存儲(chǔ)的研究工作還相當(dāng)?shù)娜狈Γ坏┰拼鎯?chǔ)的安全性與可靠性得到保障,它將具有廣泛而巨大的應(yīng)用前景。本文綜述了可證明數(shù)據(jù)持有及恢復(fù)技術(shù)在國(guó)內(nèi)外的研究現(xiàn)狀,根據(jù)一系列的評(píng)價(jià)指標(biāo)對(duì)已有方案進(jìn)行比較,指出目前方案存在的不足,從而明確應(yīng)該改進(jìn)的方向。然后考慮云存儲(chǔ)服務(wù)的特殊需求,對(duì)可證明數(shù)據(jù)持有及恢復(fù)技術(shù)提出了一些新的要求,可以明確在云存儲(chǔ)環(huán)境下可證明數(shù)據(jù)持有及恢復(fù)技術(shù)的研究方向。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:云存儲(chǔ)服務(wù)中可證明數(shù)據(jù)持有及恢復(fù)技術(shù)研究
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083972060.html