密碼學(xué)的研究進(jìn)展是令人鼓舞的,但對(duì)云計(jì)算中的數(shù)據(jù)進(jìn)行加密操作還沒(méi)有切實(shí)可行的解決方案。由羅納德L.李維斯特(Ronald L.Rivest)提供的“選種和篩選系統(tǒng)(Chaffing and Winnowing)”即技術(shù)保密而不加密算法將成為一種可行的解決方案,能從云計(jì)算中受益,該技術(shù)的提出是基于分組通信系統(tǒng),其不適用所有云服務(wù)模式,如:SaaS,PaaS或IaaS。
1.簡(jiǎn)介
1.1 可提供外包的計(jì)算密集型任務(wù)
計(jì)算密集型任務(wù)可以利用云服務(wù)的可擴(kuò)展性,低成本等優(yōu)勢(shì),外包給遠(yuǎn)程的云服務(wù)提供商(CSP)。在互聯(lián)網(wǎng)廣告業(yè)務(wù)中,無(wú)論是在線購(gòu)物網(wǎng)站,社交網(wǎng)站或一個(gè)簡(jiǎn)單的房地產(chǎn)搜索網(wǎng)站,都是通過(guò)事件日志來(lái)了解客戶的行為模式的,如他們的會(huì)話持續(xù)時(shí)間,頻率和數(shù)量,用戶在不同的關(guān)鍵點(diǎn)上花費(fèi)的時(shí)間不同將產(chǎn)生不同的數(shù)據(jù)日志和搜索關(guān)鍵詞。
許多數(shù)字廣告和營(yíng)銷(xiāo)公司會(huì)細(xì)分用戶和客戶的數(shù)據(jù)日志,并在此基礎(chǔ)上收集和分析這些日志,往往這些日志中會(huì)包含敏感的信息和客戶數(shù)據(jù)。因此云服務(wù)消費(fèi)者(SCS)將這樣的任務(wù)外包到遠(yuǎn)程的CSP是非常危險(xiǎn)的,無(wú)論是黑客的外部入侵還是內(nèi)部人員惡意盜用,一旦這些數(shù)據(jù)落入他人之手,將會(huì)給SCS帶來(lái)不小的損失。
1.2 MapReduce類(lèi)似于IaaS
MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。概念“Map(映射)”和“Reduce(化簡(jiǎn))”以及它們的主要思想,都是從函數(shù)式編程語(yǔ)言里借來(lái)的,還有從矢量編程語(yǔ)言里借來(lái)的特性。它極大地方便了編程人員在不會(huì)分布式并行編程的情況下,將自己的程序運(yùn)行在分布式系統(tǒng)上。當(dāng)前的軟件實(shí)現(xiàn)是一個(gè)Map(映射)函數(shù),用來(lái)把一組鍵值對(duì)映射成一組新的鍵值對(duì),指定并發(fā)的Reduce(函數(shù)),用來(lái)保證所有映射的鍵值對(duì)中的每一個(gè)共享相同的鍵組。這樣一個(gè)典型的編程模型,尤其是對(duì)于網(wǎng)絡(luò)日志解析,將有幾個(gè)主要部分:
(1)數(shù)據(jù)收集。
如Apache Flume,F(xiàn)acebook's Scribe chukwa等一系列分布式,可靠性和可利用率高的服務(wù),通常有三層:代理層,是負(fù)責(zé)收集各種來(lái)源的數(shù)據(jù);采集層,是負(fù)責(zé)總匯這些數(shù)據(jù);流層,是負(fù)責(zé)簡(jiǎn)化數(shù)據(jù)并以流的形式發(fā)送至CSP。
(2)數(shù)據(jù)解析。
Hadoop和MapReduce服務(wù)一樣,兩者都采用WebLog數(shù)據(jù)解析模式概述了一種典型的CSC架構(gòu)(如圖1)。Hadoop是一種能夠運(yùn)行在廉價(jià)硬件之上的分布式文件系統(tǒng),而且它提供高傳輸率來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集的應(yīng)用程序。Hadoop放寬了POSIX接口的要求,這樣可以以流的形式訪問(wèn)文件系統(tǒng)中的數(shù)據(jù)。
圖1 典型的CSC架構(gòu)
(3)數(shù)據(jù)存儲(chǔ)。
以上數(shù)據(jù)解析服務(wù)的輸出可以導(dǎo)出成特定的存儲(chǔ)格式。
(4)數(shù)據(jù)分析。
最后的數(shù)據(jù)分析可以使用ApacheHive,Apache Pig或SQL查詢語(yǔ)言。
1.3 Chamng and Winnowing(選種和篩選系統(tǒng))
該詞來(lái)自于農(nóng)業(yè),是用來(lái)表示小麥從谷殼分離的過(guò)程,這一技術(shù)的首次提出是實(shí)現(xiàn)保密而不加密的數(shù)據(jù)發(fā)送。
選種和篩選系統(tǒng)是自我強(qiáng)化系統(tǒng)的孿生組成部分。此系統(tǒng)不需要加密。該技術(shù)由發(fā)送錯(cuò)誤包到數(shù)據(jù)庫(kù)(發(fā)送終端)和終端刪除錯(cuò)誤包組成。錯(cuò)誤包混淆假信息并且發(fā)送難解信息到認(rèn)證收件人之外的任何人。每一個(gè)合法的信息包在源頭處都會(huì)被分派一個(gè)獨(dú)一無(wú)二的序列號(hào)和認(rèn)證碼(MAC)。每個(gè)序列號(hào)和認(rèn)證碼是管理者已知的。一旦一個(gè)虛假的數(shù)據(jù)包被加入發(fā)送源頭,就開(kāi)始進(jìn)行選種過(guò)程(谷物是植物最容易掉落的部分,就像小麥在磨面過(guò)程中分離一樣)。源數(shù)據(jù)包可能和正確信息有相同的格式,或者組成相同的序列號(hào),但它的認(rèn)證碼是無(wú)效的。除非在終端比較認(rèn)證碼,否則無(wú)法識(shí)別合法數(shù)據(jù)包和源數(shù)據(jù)包。因此注冊(cè)碼也是比較真信息包和源信息包的唯一途經(jīng)。
簡(jiǎn)單地說(shuō),通信雙方都有一個(gè)共同的密鑰,發(fā)送方發(fā)送實(shí)際的數(shù)據(jù)包和一些任意值與其他一些數(shù)據(jù)包的簽名,接收方接收數(shù)據(jù)然后通過(guò)共同密鑰計(jì)算每一個(gè)數(shù)據(jù)包的簽名,然后分離出無(wú)用的數(shù)據(jù)包。因此通信雙方是采用明確的文字和其他一些假包來(lái)迷亂第三者,而技術(shù)上的分組是不經(jīng)過(guò)加密的。
這種技術(shù)可以適用于實(shí)現(xiàn)云計(jì)算的隱私,特別是在IaaS中,因?yàn)樵谶h(yuǎn)程CSP服務(wù)上操作加密解密數(shù)據(jù)還尚未可行。
2.框架結(jié)構(gòu)的實(shí)現(xiàn)
下面是實(shí)現(xiàn)無(wú)加密模式下CSC數(shù)據(jù)機(jī)密性的幾個(gè)重要環(huán)節(jié):
(1)數(shù)據(jù)收集。
CSC有多個(gè)數(shù)據(jù)代理收集數(shù)據(jù),所有的這些代理可以共享一個(gè)公共解密,并且使用該密鑰可以簽署產(chǎn)生日志文件。CSC也可以有一些假的代理,假數(shù)據(jù)和假密鑰簽名產(chǎn)生的日志文件。所有這些日志文件由收集節(jié)點(diǎn)匯集和簡(jiǎn)化并發(fā)送到MapReduce集群。
(2)數(shù)據(jù)解析。
MapReduce集群從混淆的數(shù)據(jù)中解析出真實(shí)的數(shù)據(jù),并將結(jié)果返回到CSC的數(shù)據(jù)存儲(chǔ)器中。這里最值得注意的是如何編寫(xiě)高效并且松耦合的程序來(lái)識(shí)別真簽名數(shù)據(jù)和假簽名數(shù)據(jù)。
(3)數(shù)據(jù)存儲(chǔ)。
MapReduce將真實(shí)的數(shù)據(jù)解析后保存到CSC指定的數(shù)據(jù)存儲(chǔ)空間中以便以后分析使用。
(4)數(shù)據(jù)分析。
CSC的數(shù)據(jù)分析器與數(shù)據(jù)代理共享著相同的密鑰,CSC數(shù)據(jù)分析器通過(guò)密鑰與數(shù)字簽名仔細(xì)從結(jié)果中過(guò)濾掉假數(shù)據(jù)。
圖2為具有虛假數(shù)據(jù)的CSC架構(gòu)。
圖2 具有虛假數(shù)據(jù)的CSC架構(gòu)
任何CSP的外部攻擊者,或者不受信任的CSP本身由于缺乏密鑰還不能將密集型任務(wù)解析成真實(shí)的數(shù)據(jù)。
3.結(jié)束語(yǔ)
值得注意的是,可以通過(guò)CSC所需的保密程度來(lái)逐步添加虛假數(shù)據(jù)的信息量,因此日志分析是一個(gè)密集型任務(wù)而不是分析假日志。
可以通過(guò)進(jìn)一步分析這一技術(shù)來(lái)適用于其他云服務(wù)模型,如SaaS和PaaS。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:無(wú)加密模式下對(duì)云數(shù)據(jù)的隱私保密
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839511160.html