分布式數(shù)據(jù)庫系統(tǒng)的研究開始于20世紀(jì)70年代中期,當(dāng)時(shí)美國計(jì)算機(jī)公司研制了第一個(gè)分布式數(shù)據(jù)庫系統(tǒng)的原型SDD-1。這個(gè)系統(tǒng)是在1976-1978年進(jìn)行設(shè)計(jì)和研發(fā)的,之后在1979年實(shí)現(xiàn)了在DEC-10和DEC-20計(jì)算機(jī)上的部署和使用。它幾乎包括了分布式數(shù)據(jù)庫系統(tǒng)的全部理論和實(shí)現(xiàn)技術(shù),是分布式數(shù)據(jù)庫系統(tǒng)發(fā)展的典范。目前已經(jīng)有一些同構(gòu)分布和異構(gòu)分布的分布式數(shù)據(jù)庫系統(tǒng)的原型。
我國對分布式數(shù)據(jù)庫的研究始于80年代,雖然起步晚,但是起點(diǎn)比較高。目前已經(jīng)研發(fā)出的原型系統(tǒng)無論是性能上還是功能上都已經(jīng)達(dá)到世界平均水平。經(jīng)過將近幾十年的發(fā)展,分布式數(shù)據(jù)庫系統(tǒng)的理論和技術(shù)已經(jīng)非常成熟,而且技術(shù)難點(diǎn)問題也已經(jīng)攻克。在九十年代已經(jīng)有產(chǎn)品開始進(jìn)入市場,但是由于當(dāng)時(shí)系統(tǒng)復(fù)雜性對于完全透明的分布式數(shù)據(jù)庫還很難達(dá)到,所以當(dāng)時(shí)分布式數(shù)據(jù)庫系統(tǒng)基本上沒有進(jìn)入實(shí)用化階段。
分布式數(shù)據(jù)庫系統(tǒng)極大的滿足了當(dāng)今信息系統(tǒng)應(yīng)用的需求,同時(shí)也符合當(dāng)今企業(yè)組織的管理思想和方式。對那些管理上集中而地域上分散的跨國集團(tuán)、大機(jī)關(guān)、大企業(yè),例如全球性的或全國性的銀行、公司、保險(xiǎn)業(yè)、連鎖店、各類交通運(yùn)輸業(yè),以及全國性的人、財(cái)、資源、環(huán)境管理機(jī)構(gòu)和軍事國防部門等需求極其強(qiáng)烈。在這些組織當(dāng)中,既要有各部門的局部控制和分散管理,同時(shí)也需要整個(gè)組織的全局控制以及高層次的協(xié)同管理。因此,分布式數(shù)據(jù)庫系統(tǒng)是未來數(shù)據(jù)庫的必然趨勢。
一、分布式存儲(chǔ)的定義
分布式存儲(chǔ),是將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)獨(dú)立的存儲(chǔ)設(shè)備上。傳統(tǒng)的存儲(chǔ)系統(tǒng)采用集中式地的服務(wù)器來存放所有的數(shù)據(jù),因此,存儲(chǔ)服務(wù)器的性能就成為系統(tǒng)性能的瓶頸,同時(shí)也是安全性和可靠性的關(guān)鍵點(diǎn),無法滿足大規(guī)模存儲(chǔ)的需要。分布式存儲(chǔ)采用可擴(kuò)展的系統(tǒng)結(jié)構(gòu),同時(shí)利用多臺(tái)存儲(chǔ)服務(wù)器來分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)數(shù)據(jù)的存儲(chǔ)位置信息,它不但提高了系統(tǒng)的可用性、可靠性和存取效率,還易于擴(kuò)展存儲(chǔ)設(shè)備。
分布式系統(tǒng)主要支持分布式的處理,它是多處理機(jī)結(jié)構(gòu)體系,通過計(jì)算機(jī)網(wǎng)絡(luò)把多個(gè)處理機(jī)連接起來,把一個(gè)任務(wù)分解為多個(gè)子任務(wù)然后分布到多個(gè)處理機(jī)上同時(shí)執(zhí)行,最終將結(jié)果生成出來,返回給業(yè)務(wù)系統(tǒng)。分布式系統(tǒng)主要包括操作系統(tǒng)、編譯系統(tǒng)、文件系統(tǒng)、程序設(shè)計(jì)和分布式數(shù)據(jù)庫系統(tǒng)等。分布式系統(tǒng)在進(jìn)行任務(wù)處理時(shí),首先將一個(gè)計(jì)算的任務(wù)拆分成多個(gè)子任務(wù),將多個(gè)子任務(wù)分發(fā)到多個(gè)處理機(jī)上同時(shí)進(jìn)行處理,最終合并子任務(wù)處理的結(jié)果,把最終結(jié)果提交給業(yè)務(wù)系統(tǒng)使用。這一點(diǎn)與并行系統(tǒng)相似,但它和并行系統(tǒng)也存在著區(qū)別,分布式系統(tǒng)是將子任務(wù)單獨(dú)進(jìn)行處理,獨(dú)立執(zhí)行,相互之間幾乎沒有任何影響,例如其中的一個(gè)子任務(wù)在進(jìn)行業(yè)務(wù)處理時(shí),由于某方面原因,導(dǎo)致結(jié)果錯(cuò)誤或者數(shù)據(jù)異常,無法返回正確的結(jié)果,但對其他的子任務(wù)卻沒有任何影響,其他子任務(wù)仍能正常運(yùn)行,返回正確的結(jié)果。所以,分布式系統(tǒng)是允許最終的結(jié)果有一定的錯(cuò)誤和誤差,并且對實(shí)時(shí)性要求也不高的系統(tǒng)。
它通常包括如下三個(gè)基本特點(diǎn):
1) 分布式數(shù)據(jù)庫系統(tǒng)中最重要是的分層控制結(jié)構(gòu),分層控制結(jié)構(gòu)是整個(gè)分布式數(shù)據(jù)庫系統(tǒng)管理的基礎(chǔ),它通常以全局?jǐn)?shù)據(jù)庫為核心,使各個(gè)局部數(shù)據(jù)庫管理系統(tǒng)都擁有管理本地?cái)?shù)據(jù)庫的自主權(quán)。
2) 數(shù)據(jù)庫獨(dú)立性是整個(gè)分布式數(shù)據(jù)庫的核心,而且對數(shù)據(jù)的分布式透明性進(jìn)行了定義和介紹。分布式透明性是指程序的正確性不受數(shù)據(jù)轉(zhuǎn)移的絲毫影響,仿佛數(shù)據(jù)是集中式存儲(chǔ)的,完全沒有被分散。只是在使用數(shù)據(jù)時(shí),同時(shí)從分布在不同物理位置上的數(shù)據(jù)庫進(jìn)行提取數(shù)據(jù),然后將提取出來的數(shù)據(jù)進(jìn)行合并,返回給業(yè)務(wù)系統(tǒng)使用,數(shù)據(jù)的訪問速度比集中式數(shù)據(jù)庫速度要慢,降低了數(shù)據(jù)處理的效率。
3) 數(shù)據(jù)的冗余特性是分布式數(shù)據(jù)庫系統(tǒng)新增的主要特性,這也是分布式數(shù)據(jù)庫和集中式數(shù)據(jù)庫的一個(gè)主要區(qū)別。增加數(shù)據(jù)的冗余度主要出于幾個(gè)方面:一方面,我們在不同的數(shù)據(jù)庫節(jié)點(diǎn)上保留相同的數(shù)據(jù)可以使用戶訪問數(shù)據(jù)時(shí)直接使用本地?cái)?shù)據(jù),使本地?cái)?shù)據(jù)庫的應(yīng)用增強(qiáng)。另一方面,當(dāng)某個(gè)數(shù)據(jù)庫節(jié)點(diǎn)一旦發(fā)生故障或者損壞時(shí),我們可以通過使用其他的數(shù)據(jù)庫節(jié)點(diǎn)來進(jìn)行復(fù)制數(shù)據(jù),從而保證了數(shù)據(jù)庫節(jié)點(diǎn)的正常運(yùn)行,對分布式數(shù)據(jù)庫系統(tǒng)的穩(wěn)定性和安全性提供了有力的保障。
二、分布式數(shù)據(jù)庫的概念
近年來,計(jì)算機(jī)技術(shù)突飛猛進(jìn),計(jì)算機(jī)的使用越來越廣。單計(jì)算機(jī)系統(tǒng)的服務(wù)器越來越無法滿足人們對計(jì)算機(jī)性能和功能上的需求,因此,通過計(jì)算機(jī)網(wǎng)絡(luò)連接多臺(tái)計(jì)算機(jī)服務(wù)器組成分布式環(huán)境是當(dāng)今數(shù)據(jù)庫的發(fā)展趨勢。隨著企業(yè)發(fā)展的不斷壯大,企業(yè)趨向于分散化,傳統(tǒng)的集中式軟件系統(tǒng)已無法滿足企業(yè)的需要,開始逐步從集中式過渡到分布式。分布式數(shù)據(jù)庫必然成為數(shù)據(jù)庫技術(shù)的主要研究方向。
另一方面,在21世紀(jì)經(jīng)濟(jì)發(fā)展中,信息是企業(yè)發(fā)展和擴(kuò)大的核心因素。由于企業(yè)發(fā)展不斷壯大,企業(yè)結(jié)構(gòu)分散化加劇,使得傳統(tǒng)的數(shù)據(jù)庫部署方式已無法滿足企業(yè)的需要,數(shù)據(jù)庫的分布式部署方式已經(jīng)成為企業(yè)數(shù)據(jù)庫的核心,也是未來數(shù)十年之內(nèi)的發(fā)展方向。
分布式數(shù)據(jù)庫由一組數(shù)據(jù)節(jié)點(diǎn)構(gòu)成,這些數(shù)據(jù)庫節(jié)點(diǎn)在邏輯上是同一個(gè)數(shù)據(jù)庫,但是物理上這些數(shù)據(jù)庫節(jié)點(diǎn)卻是分散在不同地理位置,通過計(jì)算機(jī)網(wǎng)絡(luò)將其連接起來,并統(tǒng)一由分布式數(shù)據(jù)庫管理系統(tǒng)進(jìn)行數(shù)據(jù)的管理,管理所有節(jié)點(diǎn)上的數(shù)據(jù)。
按功能進(jìn)行劃分,分布式數(shù)據(jù)庫系統(tǒng)主要包括分布式數(shù)據(jù)庫管理系統(tǒng)和分布式數(shù)據(jù)庫。分布式數(shù)據(jù)庫使用計(jì)算機(jī)網(wǎng)絡(luò)將分散在各地的各個(gè)數(shù)據(jù)庫節(jié)點(diǎn)連接起來形成一個(gè)統(tǒng)一的邏輯集合。分布式數(shù)據(jù)庫主要包括局部應(yīng)用和全局應(yīng)用:分布應(yīng)用(或全局應(yīng)用)主要是指對兩個(gè)以上結(jié)點(diǎn)上的數(shù)據(jù)庫執(zhí)行應(yīng)用;而局部應(yīng)用僅對本結(jié)點(diǎn)的數(shù)據(jù)庫執(zhí)行應(yīng)用。只有支持全局應(yīng)用的才被稱為分布式數(shù)據(jù)庫系統(tǒng)。它主要對分布式環(huán)境下數(shù)據(jù)進(jìn)行管理和維護(hù),使數(shù)據(jù)保持一致。
三、分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)
分布式數(shù)據(jù)庫系統(tǒng)的體系結(jié)構(gòu)主要由局部概念層、局部內(nèi)層、全局外層以及全局概念層等幾部分組成的,分布式數(shù)據(jù)庫是通過網(wǎng)絡(luò)通訊、全局?jǐn)?shù)據(jù)庫管理系統(tǒng)以及局部數(shù)據(jù)庫管理系統(tǒng)同時(shí)進(jìn)行管理的。三者共同構(gòu)成了分布式數(shù)據(jù)庫的管理系統(tǒng)。通過對它們的實(shí)現(xiàn),支撐了整個(gè)分布式數(shù)據(jù)庫體系。
分布式數(shù)據(jù)庫系統(tǒng)是傳統(tǒng)的集中式數(shù)據(jù)庫系統(tǒng)在計(jì)算機(jī)網(wǎng)絡(luò)方面的的延伸。因此,分布式數(shù)據(jù)庫不僅具有傳統(tǒng)集中式數(shù)據(jù)庫的全部特點(diǎn),同時(shí)它又比集中式數(shù)據(jù)庫技術(shù)實(shí)現(xiàn)上要求更高,實(shí)現(xiàn)更加復(fù)雜。
分布式數(shù)據(jù)庫系統(tǒng)主要?jiǎng)澐譃橐韵滤膶幽J,如下圖所示。這四層主要包括:全局概念外層、全局視圖(或稱全局外層)、局部內(nèi)層以及局部概念層等基本部分。各個(gè)層次之間擁有各自的聯(lián)系,進(jìn)行不同映射。
分布式數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)圖
分布式數(shù)據(jù)庫是整個(gè)企業(yè)私有云架構(gòu)在數(shù)據(jù)存儲(chǔ)方面的關(guān)鍵核心,它的實(shí)現(xiàn)對于私有云平臺(tái)的實(shí)現(xiàn)至關(guān)重要,尤其是云計(jì)算ERP的實(shí)現(xiàn)。ERP系統(tǒng)最關(guān)鍵的核心就是數(shù)據(jù),而數(shù)據(jù)的存儲(chǔ)一直是系統(tǒng)的性能瓶頸,只有從根本上解決數(shù)據(jù)存儲(chǔ)問題才能徹底解決ERP系統(tǒng)的性能瓶頸。分布式數(shù)據(jù)庫從根本上解決了數(shù)據(jù)的存儲(chǔ),通過把不同的業(yè)務(wù)系統(tǒng)模塊的數(shù)據(jù)部署到不同的數(shù)據(jù)庫服務(wù)器上,從而減少了單個(gè)數(shù)據(jù)庫的并發(fā)操作和海量數(shù)據(jù)的處理,從根本上提升了性能。所以,分布式存儲(chǔ)是未來ERP數(shù)據(jù)存儲(chǔ)的發(fā)展方向。
本文主要介紹了分布式數(shù)據(jù)庫的定義、特點(diǎn)、分類、系統(tǒng)結(jié)構(gòu)等方面,通過對分布式數(shù)據(jù)庫核心技術(shù)的研究,后期我們將設(shè)計(jì)在私有云平臺(tái)方面的數(shù)據(jù)的分布式架構(gòu),實(shí)現(xiàn)云計(jì)算ERP數(shù)據(jù)存儲(chǔ)在分布式數(shù)據(jù)庫上的應(yīng)用。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:企業(yè)私有云在RS10中的應(yīng)用之二:云計(jì)算中的分布式存儲(chǔ)
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839710570.html