1、引言
由于企業(yè)信息系統(tǒng)是逐步建立起來的,因此基于不同時期的計算機技術(shù)而建立起來的各領(lǐng)域信息系統(tǒng)采用了不同的數(shù)據(jù)庫系統(tǒng),且自成一體。并以不同的數(shù)據(jù)模式描述數(shù)據(jù),使用不同的語言描述數(shù)據(jù)存儲和操縱事務(wù),它們無法通過計算機網(wǎng)絡(luò)實現(xiàn)系統(tǒng)間的信息交換和結(jié)合,因此企業(yè)信息系統(tǒng)中形成了多個異構(gòu)的、分散的數(shù)據(jù)庫系統(tǒng),并出現(xiàn)了大量的信息孤島。在現(xiàn)有的異構(gòu)數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上,為了有效地實現(xiàn)各個數(shù)據(jù)庫系統(tǒng)之間的信息共享、傳遞和反饋,解決企業(yè)信息系統(tǒng)中的信息孤島現(xiàn)象,我們有必要對數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)進行再加工,集成異構(gòu)數(shù)據(jù)庫系統(tǒng),形成綜合的、面向分析的操作平臺,從而更好地支持企業(yè)的決策分析。數(shù)據(jù)倉庫技術(shù)就是解決異構(gòu)數(shù)據(jù)庫信息集成的有效方案,因為數(shù)據(jù)倉庫可以從異構(gòu)的數(shù)據(jù)庫系統(tǒng)中使用統(tǒng)一的全局模式來描述數(shù)據(jù),并將這些數(shù)據(jù)集成在數(shù)據(jù)倉庫中,用戶可以通過數(shù)據(jù)倉庫提供的統(tǒng)一的數(shù)據(jù)接口進行統(tǒng)計分析,最終支持決策者的決策過程。
2、數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)倉庫是面向主題的、集成的、隨時間變化的、非易失性的數(shù)據(jù)集合,它用于支持管理層的決策過程。數(shù)據(jù)倉庫的創(chuàng)建和使用都是圍繞著主題的,數(shù)據(jù)倉庫中的數(shù)據(jù)不是將業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)簡單集合,而是對各種源數(shù)據(jù)進行抽取、篩選、清理、綜合而得到的數(shù)據(jù)集合目。數(shù)據(jù)倉庫中所存儲的數(shù)據(jù)不經(jīng)常進行更新處理,它主要用于查詢和分析。與傳統(tǒng)的數(shù)據(jù)庫相比,數(shù)據(jù)倉庫的主要特點表現(xiàn)在:集成了面向主題的綜合數(shù)據(jù)、帶有數(shù)據(jù)集成性質(zhì)、數(shù)據(jù)不常更新、數(shù)據(jù)是隨時間不斷加載的。
3、異構(gòu)數(shù)據(jù)庫集成的實現(xiàn)方案
數(shù)據(jù)倉庫技術(shù)作為異構(gòu)數(shù)據(jù)庫集成的解決方案,不僅可以通過數(shù)據(jù)抽取和轉(zhuǎn)移工具將位于不同地域、不同操作系統(tǒng)平臺、不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)按照一定的數(shù)據(jù)模式集成在一起,同時能夠保證數(shù)據(jù)的一致性。下面將給出異構(gòu)數(shù)據(jù)庫集成的解決方案。
3.1異構(gòu)數(shù)據(jù)庫的集成方法
該方法的基本思想是:在原有的不同領(lǐng)域信息系統(tǒng)的基礎(chǔ)上,按照決策者的決策需求確定查詢主題,定義基于數(shù)據(jù)倉庫的新的數(shù)據(jù)全局模式,從異構(gòu)數(shù)據(jù)庫中通過數(shù)據(jù)抽取和轉(zhuǎn)換工具將數(shù)據(jù)抽取出來,以一定的格式裝載到數(shù)據(jù)倉庫中。同時按照決策者和用戶的查詢需求編寫應(yīng)用程序,最后以查詢報告或表格形式反饋給決策者或用戶。
3.2定義新的數(shù)據(jù)模型
由于數(shù)據(jù)倉庫注重的是數(shù)據(jù)查詢,設(shè)計的目的是使用戶能夠盡可能地直接訪問到數(shù)據(jù),因此數(shù)據(jù)是按照決策分析的主題來組織的,每個主題對應(yīng)一個宏觀的分析領(lǐng)域。因此數(shù)據(jù)的概念模型是多維數(shù)據(jù)模型,這樣可以用多維分析的方法從多角度、多層次對數(shù)據(jù)進行統(tǒng)計分析。
為實現(xiàn)異構(gòu)數(shù)據(jù)庫的數(shù)據(jù)集成, 須首先通過數(shù)據(jù)的抽取和轉(zhuǎn)換工具將位于不同操作系統(tǒng)平臺、不同數(shù)據(jù)組織形式的數(shù)據(jù)按照 定的數(shù)據(jù)模型集成到數(shù)據(jù)倉庫中,其目的就是保證數(shù)據(jù)倉庫中數(shù)據(jù)的一致性。
(1)抽取
為了將來自不同數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)集成到數(shù)據(jù)倉庫中,必須首先從外部數(shù)據(jù)庫將有關(guān)數(shù)據(jù)抽取出來。數(shù)據(jù)的抽取是數(shù)據(jù)倉庫成功的關(guān)鍵。為了將數(shù)據(jù)抽取出來,我們必須按照已確定的新的數(shù)據(jù)模型來抽取數(shù)據(jù),因為在新的數(shù)據(jù)模型中描述了哪些數(shù)據(jù)需要抽取。
在此基礎(chǔ)上我們需要編寫數(shù)據(jù)的抽取程序。該抽取程序的基本功能就是利用OBDC技術(shù)訪問異構(gòu)數(shù)據(jù)庫并將不同數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)抽取出來。具體的實現(xiàn)方法是:
① 利用ODBC數(shù)據(jù)源管理器根據(jù)不同的數(shù)據(jù)庫系統(tǒng)創(chuàng)建相應(yīng)的數(shù)據(jù)源;
② 在相應(yīng)的抽取程序中根據(jù)該數(shù)據(jù)源讀取源數(shù)據(jù)庫中的數(shù)據(jù)。
(2)轉(zhuǎn)換
從源數(shù)據(jù)庫中抽取出來的數(shù)據(jù)必須依據(jù)事先定義好的標(biāo)準(zhǔn)數(shù)據(jù)格式進行數(shù)據(jù)的轉(zhuǎn)換。由于企業(yè)信息系統(tǒng)中同一個數(shù)據(jù)可能存放在不同子系統(tǒng)的數(shù)據(jù)庫中,這些數(shù)據(jù)庫之間是分散和異構(gòu)的,因此就會出現(xiàn)數(shù)據(jù)名稱、數(shù)據(jù)單位、數(shù)據(jù)類型甚至數(shù)據(jù)值不一致的情況,如果這些數(shù)據(jù)被抽取到數(shù)據(jù)倉庫中,必然會造成數(shù)據(jù)的不真實性,為此有必要對這些抽取的數(shù)據(jù)進行徹底地轉(zhuǎn)換。
數(shù)據(jù)轉(zhuǎn)換的基本思想是:首先建立數(shù)據(jù)轉(zhuǎn)換規(guī)則集和元數(shù)據(jù)庫。抽取出來的數(shù)據(jù)必須按照數(shù)據(jù)轉(zhuǎn)換規(guī)則集和元數(shù)據(jù)庫中定義的標(biāo)準(zhǔn)對數(shù)據(jù)進行轉(zhuǎn)換或修補以適應(yīng)新標(biāo)準(zhǔn),然后才能將數(shù)據(jù)裝載到數(shù)據(jù)倉庫中。數(shù)據(jù)轉(zhuǎn)換規(guī)則集的表結(jié)構(gòu)見表1。
元數(shù)據(jù)庫存放的是關(guān)于數(shù)據(jù)的數(shù)據(jù),即對抽取出來的數(shù)據(jù)的描述與說明,是數(shù)據(jù)轉(zhuǎn)換的一個重要依據(jù),數(shù)據(jù)被抽取出來后,如果在元數(shù)據(jù)庫中存在該數(shù)據(jù),則要按照元數(shù)據(jù)中定義的標(biāo)準(zhǔn)數(shù)據(jù)格式處理數(shù)據(jù)。否則就要籌建新的數(shù)據(jù)標(biāo)準(zhǔn)并存儲到元數(shù)據(jù)庫中。
4、結(jié)束語
采用數(shù)據(jù)倉庫技術(shù)解決異構(gòu)數(shù)據(jù)庫的集成問題應(yīng)該是一個好的解決方案。因為ODBC技術(shù)為訪問異構(gòu)數(shù)據(jù)庫提供了統(tǒng)一的方式。同時也為各異構(gòu)數(shù)據(jù)庫之間的協(xié)作和多個異構(gòu)數(shù)據(jù)庫之間的操作提供了系統(tǒng)平臺;而數(shù)據(jù)倉庫的建立,不僅實現(xiàn)了企業(yè)信息系統(tǒng)中信息的集成,同時為充分利用這些綜合數(shù)據(jù)、歷史數(shù)據(jù),為企業(yè)決策系統(tǒng)提供信息源打下了良好的基礎(chǔ)。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:數(shù)據(jù)倉庫在異構(gòu)數(shù)據(jù)庫集成中的應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/solutions/1401937345.html