引言
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)的快速發(fā)展,以及智能終端、網(wǎng)絡(luò)社會(huì)、數(shù)字地球等信息體的普及和建設(shè),全球數(shù)據(jù)量出現(xiàn)爆炸式增長(zhǎng),僅在2011年就達(dá)到1.8萬(wàn)億GB。IDC(IntemetData Center,互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)中心)預(yù)計(jì),到2020年全球數(shù)據(jù)量將增加50倍。毋庸置疑,大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)。一方面,云計(jì)算為這些海量的、多樣化的數(shù)據(jù)提供存儲(chǔ)和運(yùn)算平臺(tái),同時(shí)數(shù)據(jù)挖掘和人工智能從大數(shù)據(jù)中發(fā)現(xiàn)知識(shí)、規(guī)律和趨勢(shì),為決策提供信息參考。大數(shù)據(jù)的發(fā)展將進(jìn)一步擴(kuò)大信息的開(kāi)放程度,隨之而來(lái)的隱私數(shù)據(jù)或敏感信息的泄露事件時(shí)有發(fā)生。面對(duì)大數(shù)據(jù)發(fā)展的新特點(diǎn)、新挑戰(zhàn),如何保障數(shù)據(jù)安全是我們需要研究的課題。
1 大數(shù)據(jù)的特征
大數(shù)據(jù)通常被認(rèn)為是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù)。隨著對(duì)大數(shù)據(jù)研究的進(jìn)一步深入,大數(shù)據(jù)不僅指數(shù)據(jù)本身的規(guī)模,也包括數(shù)據(jù)采集工具、數(shù)據(jù)存儲(chǔ)平臺(tái)、數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)衍生價(jià)值等要素。其主要特點(diǎn)有以下幾點(diǎn):
1.1數(shù)據(jù)量大
大數(shù)據(jù)時(shí)代,各種傳感器、移動(dòng)設(shè)備、智能終端和網(wǎng)絡(luò)社會(huì)等無(wú)時(shí)無(wú)刻不在產(chǎn)生數(shù)據(jù),數(shù)量級(jí)別已經(jīng)突破TB,發(fā)展至PB乃至ZB,統(tǒng)計(jì)數(shù)據(jù)量呈千倍級(jí)別上升。據(jù)估計(jì),2012年全球產(chǎn)生的數(shù)據(jù)量將達(dá)到2.7ZB,2015年將超過(guò)8ZB。
1.2類(lèi)型多樣
當(dāng)前大數(shù)據(jù)不僅僅是數(shù)據(jù)量的井噴性增長(zhǎng),而且還包含數(shù)據(jù)類(lèi)型的多樣化發(fā)展。以往數(shù)據(jù)大都以二維結(jié)構(gòu)呈現(xiàn),但隨著互聯(lián)網(wǎng)、多媒體等技術(shù)的快速發(fā)展和普及,視頻、音頻、圖片、郵件、HTML,RFID,GPS和傳感器等產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù),每年都以60%速度增長(zhǎng)。預(yù)計(jì),非結(jié)構(gòu)化數(shù)據(jù)將占數(shù)據(jù)總量的80%以上。
1.3運(yùn)算高效
基于云計(jì)算的Hadoop大數(shù)據(jù)框架,利用集群的威力高速運(yùn)算和存儲(chǔ),實(shí)現(xiàn)了一個(gè)分布式運(yùn)行系統(tǒng),以流的形式提供高傳輸率來(lái)訪問(wèn)數(shù)據(jù),適應(yīng)了大數(shù)據(jù)的應(yīng)用程序。而且,數(shù)據(jù)挖掘、語(yǔ)義引擎、可視化分析等技術(shù)的發(fā)展,可從海量的數(shù)據(jù)中深度解析,提取信息,掌控?cái)?shù)據(jù)增值的“加速器”。
1.4產(chǎn)生價(jià)值
價(jià)值是大數(shù)據(jù)的終極目的。大數(shù)據(jù)本身是一個(gè)“金礦”,可以從大數(shù)據(jù)的融合中獲得意想不到的有價(jià)值的信息。特別是激烈競(jìng)爭(zhēng)的商業(yè)領(lǐng)域,數(shù)據(jù)正成為企業(yè)的新型資產(chǎn),企業(yè)都在追求數(shù)據(jù)最大價(jià)值化。同時(shí),大數(shù)據(jù)價(jià)值也存在密度低的特性,需要對(duì)海量的數(shù)據(jù)進(jìn)行挖掘分析才能得到真正有用的信息,形成用戶(hù)價(jià)值。以監(jiān)控視頻為例,連續(xù)播放的畫(huà)面中,可以產(chǎn)生價(jià)值信息的數(shù)據(jù)可能僅僅是一兩秒。
2 大數(shù)據(jù)面臨的安全挑戰(zhàn)
正如Gartner所說(shuō):“大數(shù)據(jù)安全是一場(chǎng)必要的斗爭(zhēng)。在大數(shù)據(jù)時(shí)代,無(wú)處不在的智能終端、互動(dòng)頻繁的社交網(wǎng)絡(luò)和超大容量的數(shù)字化存儲(chǔ),不得不承認(rèn)大數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)領(lǐng)域,逐漸成為一種生產(chǎn)要素發(fā)揮著重要作用,成為未來(lái)競(jìng)爭(zhēng)的至高點(diǎn)。大數(shù)據(jù)所含信息量較高,雖然相對(duì)價(jià)值密度較低,但是對(duì)它里面所蘊(yùn)藏的潛在信息,隨著快速處理和分析提取技術(shù)的發(fā)展,可以快速捕捉到有價(jià)值的信息以提供參考決策。然而,大數(shù)據(jù)掀起新一輪生產(chǎn)率提高和消費(fèi)者盈余浪潮的同時(shí),隨之而來(lái)的是信息安全的挑戰(zhàn)。
2.1網(wǎng)絡(luò)化社會(huì)使大數(shù)據(jù)易成為攻擊目標(biāo)
網(wǎng)絡(luò)化社會(huì)的形成,為大數(shù)據(jù)在各個(gè)行業(yè)領(lǐng)域?qū)崿F(xiàn)資源共享和數(shù)據(jù)互通搭建平臺(tái)和通道;谠朴(jì)算的網(wǎng)絡(luò)化社會(huì)為大數(shù)據(jù)提供了一個(gè)開(kāi)放的環(huán)境,分布在不同地區(qū)的資源可以快速整合,動(dòng)態(tài)配置,實(shí)現(xiàn)數(shù)據(jù)集合的共建共享。而且,網(wǎng)絡(luò)訪問(wèn)便捷化和數(shù)據(jù)流的形成,為實(shí)現(xiàn)資源的快速?gòu)椥酝扑秃蛡(gè)性化服務(wù)提供基礎(chǔ)。正因?yàn)槠脚_(tái)的暴露,使得蘊(yùn)含著海量數(shù)據(jù)和潛在價(jià)值的大數(shù)據(jù)更容易吸引黑客的攻擊。也就是說(shuō),在開(kāi)放的網(wǎng)絡(luò)化社會(huì),大數(shù)據(jù)的數(shù)據(jù)量大且相互關(guān)聯(lián),對(duì)于攻擊者而言,相對(duì)低的成本可以獲得“滾雪球”的收益。近年來(lái)在互聯(lián)網(wǎng)上發(fā)生的用戶(hù)賬號(hào)的信息失竊等連鎖反應(yīng)可以看出,大數(shù)據(jù)更容易吸引黑客,而且一旦遭受攻擊,失竊的數(shù)據(jù)量也是巨大的。
2.2非結(jié)構(gòu)化數(shù)據(jù)對(duì)大數(shù)據(jù)存儲(chǔ)提出新要求
在大數(shù)據(jù)之前,我們通常將數(shù)據(jù)存儲(chǔ)分為關(guān)系型數(shù)據(jù)庫(kù)和文件服務(wù)器兩種。而當(dāng)前大數(shù)據(jù)洶涌而來(lái),數(shù)據(jù)類(lèi)型的千姿百態(tài)也使我們措手不及。對(duì)于將占數(shù)據(jù)總量80%以上的非結(jié)構(gòu)化數(shù)據(jù),雖然NoSQL數(shù)據(jù)存儲(chǔ)具有可擴(kuò)展性和可用性等優(yōu)點(diǎn),利于趨勢(shì)分析,為大數(shù)據(jù)存儲(chǔ)提供了初步解決方案,但是NoSQL數(shù)據(jù)存儲(chǔ)仍存在以下問(wèn)題:一是相對(duì)于嚴(yán)格訪問(wèn)控制和隱私管理的SQL技術(shù),目前NoSQL還無(wú)法沿用SQL的模式,而且適應(yīng)NoSQL的存儲(chǔ)模式并不成熟;二是雖然NoSQL軟件從傳統(tǒng)數(shù)據(jù)存儲(chǔ)中取得經(jīng)驗(yàn),但NoSQL仍然存在各種漏洞,畢竟它使用的是新代碼;三是由于NoSQL服務(wù)器軟件沒(méi)有內(nèi)置足夠的安全,所以客戶(hù)端應(yīng)用程序需要內(nèi)建安全因素,這又反過(guò)來(lái)導(dǎo)致產(chǎn)生了諸如身份驗(yàn)證、授權(quán)過(guò)程和輸入驗(yàn)證等大量的安全問(wèn)題。
2.3技術(shù)發(fā)展增加了安全風(fēng)險(xiǎn)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和人工智能的發(fā)展,服務(wù)器、防火墻、無(wú)線路由等網(wǎng)絡(luò)設(shè)備和數(shù)據(jù)挖掘應(yīng)用系統(tǒng)等技術(shù)越來(lái)越廣泛,為大數(shù)據(jù)自動(dòng)收集效率以及智能動(dòng)態(tài)分析性提供方便。但是,技術(shù)發(fā)展也增加了大數(shù)據(jù)的安全風(fēng)險(xiǎn)。一方面,大數(shù)據(jù)本身的安全防護(hù)存在漏洞。雖然云計(jì)算對(duì)大數(shù)據(jù)提供了便利,但對(duì)大數(shù)據(jù)的安全控制力度仍然不夠,API(Application Programming Interface,應(yīng)用程序編程接口)訪問(wèn)權(quán)限控制以及密鑰生成、存儲(chǔ)和管理方面的不足都可能造成數(shù)據(jù)泄漏。而且大數(shù)據(jù)本身可以成為一個(gè)可持續(xù)攻擊的載體,被隱藏在大數(shù)據(jù)中的惡意軟件和病毒代碼很難被發(fā)現(xiàn),從而達(dá)到長(zhǎng)久攻擊的目的。另一方面,攻擊的技術(shù)提高了。在用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術(shù)獲取價(jià)值信息的同時(shí),攻擊者也在利用這些大數(shù)據(jù)技術(shù)進(jìn)行攻擊。
3 大數(shù)據(jù)安全的應(yīng)對(duì)策略
當(dāng)然,大數(shù)據(jù)也為數(shù)據(jù)安全的發(fā)展提供了新機(jī)遇。大數(shù)據(jù)正在為安全分析提供新的可能性,對(duì)海量數(shù)據(jù)的分析有助于更好地跟蹤網(wǎng)絡(luò)異常行為,對(duì)實(shí)時(shí)安全和應(yīng)用數(shù)據(jù)結(jié)合在一起的數(shù)據(jù)進(jìn)行預(yù)防性分析,可防止詐騙和黑客人侵。網(wǎng)絡(luò)攻擊行為總會(huì)留下蛛絲馬跡,這些痕跡都以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,從大數(shù)據(jù)的存儲(chǔ)、應(yīng)用和管理等方面層層把關(guān),可以有針對(duì)性地應(yīng)對(duì)數(shù)據(jù)安全威脅。
3.1大數(shù)據(jù)存儲(chǔ)安全策略
基于云計(jì)算架構(gòu)的大數(shù)據(jù),數(shù)據(jù)的存儲(chǔ)和操作都是以服務(wù)的形式提供。目前,大數(shù)據(jù)的安全存儲(chǔ)采用虛擬化海量存儲(chǔ)技術(shù)來(lái)存儲(chǔ)數(shù)據(jù)資源,涉及數(shù)據(jù)傳輸、隔離、恢復(fù)等問(wèn)題。解決大數(shù)據(jù)的安全存儲(chǔ),一是數(shù)據(jù)加密。在大數(shù)據(jù)安全服務(wù)的設(shè)計(jì)中,大數(shù)據(jù)可以按照數(shù)據(jù)安全存儲(chǔ)的需求,被存儲(chǔ)在數(shù)據(jù)集的任何存儲(chǔ)空間,通過(guò)SSL(Secure Sockets Layer,安全套接層協(xié)議層)加密,實(shí)現(xiàn)數(shù)據(jù)集的節(jié)點(diǎn)和應(yīng)用程序之間移動(dòng)保護(hù)大數(shù)據(jù)。在大數(shù)據(jù)的傳輸服務(wù)過(guò)程中,加密為數(shù)據(jù)流的上傳與下載提供有效的保護(hù)。應(yīng)用隱私保護(hù)和外包數(shù)據(jù)計(jì)算,屏蔽網(wǎng)絡(luò)攻擊。目前,PGP和TrueCrypt等程序都提供了強(qiáng)大的加密功能。二是分離密鑰和加密數(shù)據(jù)。使用加密把數(shù)據(jù)使用與數(shù)據(jù)保管分離,把密鑰與要保護(hù)的數(shù)據(jù)隔離開(kāi)。同時(shí),定義產(chǎn)生、存儲(chǔ)、備份、恢復(fù)等密鑰管理生命周期。三是使用過(guò)濾器。通過(guò)過(guò)濾器的監(jiān)控,一旦發(fā)現(xiàn)數(shù)據(jù)離開(kāi)了用戶(hù)的網(wǎng)絡(luò),就自動(dòng)阻止數(shù)據(jù)的再次傳輸。四是數(shù)據(jù)備份。通過(guò)系統(tǒng)容災(zāi)、敏感信息集中管控和數(shù)據(jù)管理等產(chǎn)品,實(shí)現(xiàn)端對(duì)端的數(shù)據(jù)保護(hù),確保大數(shù)據(jù)損壞情況下有備無(wú)患和安全管控。
3.2大數(shù)據(jù)應(yīng)用安全策略
隨著大數(shù)據(jù)應(yīng)用所需的技術(shù)和工具快速發(fā)展,大數(shù)據(jù)應(yīng)用安全策略主要從以下幾方面著手:一是防止APT(Advanced Persistent Threat,高級(jí)持續(xù)性威脅)攻擊。借助大數(shù)據(jù)處理技術(shù),針對(duì)APT安全攻擊隱蔽能力強(qiáng)、長(zhǎng)期潛伏、攻擊路徑和渠道不確定等特征,設(shè)計(jì)具備實(shí)時(shí)檢測(cè)能力與事后回溯能力的全流量審計(jì)方案,提醒隱藏有病毒的應(yīng)用程序。二是用戶(hù)訪問(wèn)控制。大數(shù)據(jù)的跨平臺(tái)傳輸應(yīng)用在一定程度上會(huì)帶來(lái)內(nèi)在風(fēng)險(xiǎn),可以根據(jù)大數(shù)據(jù)的密級(jí)程度和用戶(hù)需求的不同,將大數(shù)據(jù)和用戶(hù)設(shè)定不同的權(quán)限等級(jí),并嚴(yán)格控制訪問(wèn)權(quán)限。而且,通過(guò)單點(diǎn)登錄的統(tǒng)一身份認(rèn)證與權(quán)限控制技術(shù),對(duì)用戶(hù)訪問(wèn)進(jìn)行嚴(yán)格的控制,有效地保證大數(shù)據(jù)應(yīng)用安全。三是整合工具和流程。通過(guò)整合工具和流程,確保大數(shù)據(jù)應(yīng)用安全處于大數(shù)據(jù)系統(tǒng)的頂端。整合點(diǎn)平行于現(xiàn)有的連接的同時(shí),減少通過(guò)連接企業(yè)或業(yè)務(wù)線的SIEM工具的輸出到大數(shù)據(jù)安全倉(cāng)庫(kù),以防止這些被預(yù)處理的數(shù)據(jù)被暴露算法和溢出加工后的數(shù)據(jù)集。同時(shí),通過(guò)設(shè)計(jì)一個(gè)標(biāo)準(zhǔn)化的數(shù)據(jù)格式簡(jiǎn)化整合過(guò)程,同時(shí)也可以改善分析算法的持續(xù)驗(yàn)證。四是數(shù)據(jù)實(shí)時(shí)分析引擎。數(shù)據(jù)實(shí)時(shí)分析引擎融合了云計(jì)算、機(jī)器學(xué)習(xí)、語(yǔ)義分析、統(tǒng)計(jì)學(xué)等多個(gè)領(lǐng)域,通過(guò)數(shù)據(jù)實(shí)時(shí)分析引擎,從大數(shù)據(jù)中第一時(shí)間挖掘出黑客攻擊、非法操作、潛在威脅等各類(lèi)安全事件,第一時(shí)間發(fā)出警告響應(yīng)。
3.3大數(shù)據(jù)管理安全策略
云計(jì)算專(zhuān)家李志霄博士說(shuō):“數(shù)據(jù)安全三分靠技術(shù),七分靠管理。”閻通過(guò)技術(shù)來(lái)保護(hù)大數(shù)據(jù)的安全必然重要,但管理也很關(guān)鍵。大數(shù)據(jù)的管理安全策略主要有:一是規(guī)范建設(shè)。大數(shù)據(jù)建設(shè)是一項(xiàng)有序的、動(dòng)態(tài)的、可持續(xù)發(fā)展的系統(tǒng)工程,一套規(guī)范的運(yùn)行機(jī)制、建設(shè)標(biāo)準(zhǔn)和共享平臺(tái)建設(shè)至關(guān)重要。規(guī)范化建設(shè)可以促進(jìn)大數(shù)據(jù)管理過(guò)程的正規(guī)有序,實(shí)現(xiàn)各級(jí)各類(lèi)信息系統(tǒng)的網(wǎng)絡(luò)互連、數(shù)據(jù)集成、資源共享,在統(tǒng)一的安全規(guī)范框架下運(yùn)行。二是建立以數(shù)據(jù)為中心的安全系統(tǒng);谠朴(jì)算的大數(shù)據(jù)存儲(chǔ)在云共享環(huán)境中,為了大數(shù)據(jù)的所有者可以對(duì)大數(shù)據(jù)使用進(jìn)行控制,可以通過(guò)建設(shè)一個(gè)基于異構(gòu)數(shù)據(jù)為中心的安全方法,從系統(tǒng)管理上保證大數(shù)據(jù)的安全。三是融合創(chuàng)新。大數(shù)據(jù)是在云計(jì)算的基礎(chǔ)上提出的新概念,大數(shù)據(jù)時(shí)代應(yīng)以智慧創(chuàng)新理念融合大數(shù)據(jù)與云計(jì)算,以智能管道與聚合平臺(tái)為基礎(chǔ),提升數(shù)據(jù)流量規(guī)模、層次及內(nèi)涵,在大數(shù)據(jù)流中提升知識(shí)價(jià)值洞察力。積極創(chuàng)造大數(shù)據(jù)公司技術(shù)融合平臺(tái),尋找數(shù)據(jù)洪流大潮中新的立足點(diǎn),特別是在數(shù)據(jù)挖掘、人工智能、機(jī)器學(xué)習(xí)等新技術(shù)的創(chuàng)新應(yīng)用融合創(chuàng)新。
4 結(jié)束語(yǔ)
大數(shù)據(jù)是信息化時(shí)代的“石油”。大數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)的速度與能力將成為這個(gè)時(shí)代的核心競(jìng)爭(zhēng)力之一,而大數(shù)據(jù)面臨的安全挑戰(zhàn)卻不容忽視。只有大數(shù)據(jù)技術(shù)和大數(shù)據(jù)安全“兩條腿”走路時(shí),大數(shù)據(jù)才可以真正成為這個(gè)時(shí)代的驅(qū)動(dòng)力量。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全研究
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112189770.html