一 分布式數(shù)據(jù)庫系統(tǒng)概述
分布式數(shù)據(jù)庫系統(tǒng)是在集中式數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上發(fā)展起來的,是計算機技術(shù)和網(wǎng)絡(luò)技術(shù)結(jié)合的產(chǎn)物。分布式數(shù)據(jù)庫系統(tǒng)適合于單位分散的部門,允許各個部門將其常用的數(shù)據(jù)存儲在本地,實施就地存放本地使用,從而提高響應(yīng)速度,降低通信費用;诰W(wǎng)絡(luò)基礎(chǔ)上的分布式數(shù)據(jù)庫系統(tǒng)經(jīng)常對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)分片。從數(shù)據(jù)意義上講,數(shù)據(jù)分布的合理與否不僅影響著訪問的局部性,而且也制約著數(shù)據(jù)查詢及事務(wù)處理的效率。
在分布式數(shù)據(jù)庫中,數(shù)據(jù)存儲包括數(shù)據(jù)分片和數(shù)據(jù)分配兩個部分。數(shù)據(jù)分片和分布是分布式數(shù)據(jù)庫中兩個重要慨念,分布式數(shù)據(jù)庫大部分問題均與數(shù)據(jù)分片和分布有關(guān),它們對整個系統(tǒng)的可用性、可靠性、及效率都有極大的影響,同時也與分布式數(shù)據(jù)庫系統(tǒng)的其他方面密切相關(guān),尤其是分布式查詢處理問題。以關(guān)系數(shù)據(jù)庫為例,在關(guān)系型分布式數(shù)據(jù)庫系統(tǒng)(RDDB)中,數(shù)據(jù)分片是從邏輯上將全局關(guān)系劃分為邏輯片斷即子關(guān)系,而數(shù)據(jù)分配就是再以一定的冗余度將子關(guān)系分配到多個結(jié)點上,數(shù)據(jù)存儲即數(shù)據(jù)分片與數(shù)據(jù)分配的總和。數(shù)據(jù)分片是一種對關(guān)系的劃分,在集中式數(shù)據(jù)庫中可以將所有的表視為一個總?cè)直淼倪壿嬜颖恚側(cè)直硎沁@些子表的并集,其屬性包括這些子表的所有屬性,元組包括這些子表的所有元組,對應(yīng)的在這個總?cè)直砩显M的非空值呈塊狀區(qū)域分布。數(shù)據(jù)分配則是將這些子表以不同的冗余度存放在一個或多個場地或節(jié)點,這兩者間的區(qū)別在于集中式數(shù)據(jù)庫不存在數(shù)據(jù)復(fù)制的問題,不需要存在多副本,但也會出現(xiàn)表名不同。但表屬性和屬性值完全相同。
二 分布式數(shù)據(jù)庫的設(shè)計
如何在不同的計算機上分布文獻(xiàn)資料的數(shù)據(jù)和程序才能提高系統(tǒng)效率,增加系統(tǒng)的可靠性和可用性。這是我們面臨的重要問題。為了增加系統(tǒng)的可靠性。系統(tǒng)就必須使數(shù)據(jù)重復(fù),也就是系統(tǒng)應(yīng)保持幾個相同的副本,每個副本放在不同的結(jié)點內(nèi)形成數(shù)據(jù)重復(fù),數(shù)據(jù)重復(fù)不但可以增加系統(tǒng)的堅定性,還可以提高系統(tǒng)的并行性。借助于多個副本,幾個結(jié)點可以并行地處理有關(guān)查詢。然而,系統(tǒng)存在著多副本就必須要保證全部副本的一致性結(jié)果會增加系統(tǒng)的總開銷。因此,我們必須認(rèn)真考慮文獻(xiàn)資料數(shù)據(jù)資源共享的合理分布。
而在分布式數(shù)據(jù)庫中,由于數(shù)據(jù)的分布和冗余,使得查詢處理中需要考慮站點間傳輸數(shù)據(jù)的通信費用,所以除了考慮CPU代價和I\O代價之外。還應(yīng)該包括數(shù)據(jù)在網(wǎng)絡(luò)上的傳輸代價。即總代價=CPU代價+I\O代價+通信代價。因此,分布式數(shù)據(jù)庫進(jìn)行分布式設(shè)計時,一個重要原則是使數(shù)據(jù)和應(yīng)用程序?qū)崿F(xiàn)最大程度的本地性,這樣就可以使應(yīng)用數(shù)據(jù)盡可能地本地化,以減少通信開支。對于建立在各場所的分布式數(shù)據(jù)庫,不需要過分進(jìn)行限制,但也必須要有規(guī)范的設(shè)計要求。
(1)硬件規(guī)范,必須支持局域網(wǎng)乃至Internet的包括聲音,文字,圖像的交流,支持IE或Netscape瀏覽web界面,支持開放性數(shù)據(jù)源的建立。
(2)數(shù)據(jù)庫形式規(guī)范,原則上Access、Paradox,甚至文本文件都可以進(jìn)行數(shù)據(jù)傳輸,但必須保證自己有開放式數(shù)據(jù)源的特征及關(guān)系繼承的特征。
(3)域的統(tǒng)一和分類、分科的統(tǒng)一,數(shù)據(jù)庫在各個分布場所必須有統(tǒng)一的域結(jié)構(gòu),以確保給用戶提供完整統(tǒng)一的視圖,科目分類的命名必須要求規(guī)范,以確保查詢和統(tǒng)計工作的準(zhǔn)確性,在方便工作的條件下,可以不要求唯一確定的主關(guān)鍵字。
三 傳統(tǒng)數(shù)據(jù)庫存在的問題
隨著計算機技術(shù)的發(fā)展和應(yīng)用的深入,分布式技術(shù)在構(gòu)建企業(yè)級應(yīng)用程序中更為廣泛流行。是因為分布式數(shù)據(jù)庫存儲方式給企業(yè)帶來了很多的方便以及好處。在沒興起分布式浪潮之前,由于傳統(tǒng)的數(shù)據(jù)存儲方式過于簡單化,過于集中管理而造成了大量數(shù)據(jù)的堆積。這樣一來一個公司或企業(yè)要使用大量的數(shù)據(jù)就需要大量的存儲數(shù)據(jù)的介質(zhì),而導(dǎo)致服務(wù)器的回應(yīng)下降乃至崩潰,這樣一來就會有大量數(shù)據(jù)會隨著服務(wù)器的崩潰而丟失,而數(shù)據(jù)對于大型企業(yè)來說數(shù)據(jù)量會很大,數(shù)據(jù)的丟失,沒有了數(shù)據(jù)的對照會使企業(yè)的業(yè)績虧損,更嚴(yán)重的說也可能導(dǎo)致企業(yè)倒閉。這種方式存儲還不能解決的問題就是異地的存儲,有的企業(yè)會有很多的分公司,這樣一來就傳統(tǒng)的數(shù)據(jù)存儲就會帶來大量人力、資金的浪費。這些問題的存在也促進(jìn)了分布式數(shù)據(jù)庫的發(fā)展。
四 剖析分布式數(shù)據(jù)庫存儲的優(yōu)勢
分布式數(shù)據(jù)庫顧名思義,具有分布數(shù)據(jù)的功能,實際上它的數(shù)據(jù)存儲方式是物理上是分布的,邏輯上是集中的。也就是說分布式數(shù)據(jù)就是指數(shù)據(jù)和程序可以不位于一個服務(wù)器上,而是分散到多個服務(wù)器,以網(wǎng)絡(luò)上分散分布的地理信息數(shù)據(jù)及受其影響的數(shù)據(jù)庫操作為研究對象的一種理論計算模型。而分布式數(shù)據(jù)庫數(shù)據(jù)存儲是在不同地域或者不同網(wǎng)絡(luò)之間的存儲,進(jìn)而達(dá)到數(shù)據(jù)共享,數(shù)據(jù)交換的目的。分布式數(shù)據(jù)存儲是先經(jīng)過一個“鈍化”,然后“序列化”成文件從內(nèi)存中的一端傳到網(wǎng)絡(luò)的另一端,到另一端后在激活的一系列過程,詳細(xì)的說數(shù)據(jù)流在加工過程中產(chǎn)生的臨時文件或加工過程中需要查找的信息。數(shù)據(jù)以某種格式記錄在計算機內(nèi)部或外部存儲介質(zhì)上。數(shù)據(jù)存儲要命名,這種命名要反映信息特征的組成含義。數(shù)據(jù)流反映了系統(tǒng)中流動的數(shù)據(jù),表現(xiàn)出動態(tài)數(shù)據(jù)的特征;數(shù)據(jù)存儲反映系統(tǒng)中靜止的數(shù)據(jù),表現(xiàn)出靜態(tài)數(shù)據(jù)的特征。這就是它的存儲過程。
五 總結(jié)分布式數(shù)據(jù)庫存儲的優(yōu)勢
分布式數(shù)據(jù)的優(yōu)勢也正體現(xiàn)在這“分布”這兩個字,讓操作終端的人感覺不到數(shù)據(jù)庫的分散,當(dāng)然這也需要好的網(wǎng)絡(luò)的努持。使使用者感覺是在本地數(shù)據(jù)庫操作一樣。這樣既方便又快捷,使維護起來不用操作大量的數(shù)據(jù)。它綜合了計算機(Computer)、通訊(Communication)、顯示(CRT)和控制(Control)等4項技術(shù),其基本思想是分散控制,集中操作、分級管理、配置靈活、高可靠性,易于維護等基本特點,從而實現(xiàn)了異地存儲的實現(xiàn)。
六 結(jié)語
通過分布式數(shù)據(jù)庫的學(xué)習(xí),對分布式數(shù)據(jù)庫有了初步的了解和掌握,學(xué)到了分布式存儲、交換、事務(wù)處理、網(wǎng)絡(luò)存儲等機制和方法。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:淺談分布式數(shù)據(jù)庫的數(shù)據(jù)存儲
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112154858.html