1 常規(guī)數(shù)據(jù)倉(cāng)庫的不足
業(yè)界公認(rèn)的數(shù)據(jù)倉(cāng)庫概念是創(chuàng)始人W.H.Inmon在《數(shù)據(jù)倉(cāng)庫》一書中對(duì)數(shù)據(jù)倉(cāng)庫的定義:數(shù)據(jù)倉(cāng)庫就是面向主題的、集成的、不可更新的、隨時(shí)間不斷變化的數(shù)據(jù)集合。
但是,常規(guī)的數(shù)據(jù)倉(cāng)庫也有其不足:
(1)常規(guī)數(shù)據(jù)倉(cāng)庫是被動(dòng)的,分析數(shù)據(jù)和作決策都要用戶手工參與,在用OLAP技術(shù)進(jìn)行多維分析時(shí)往往是由用戶提出分析要求再回答這些問題;(2)常規(guī)數(shù)據(jù)倉(cāng)庫的實(shí)時(shí)性較差,通常只能分析歷史數(shù)據(jù),而且數(shù)據(jù)抽取周期過長(zhǎng),極大地降低了企業(yè)的應(yīng)變能力,難以反映瞬息萬變的市場(chǎng)變化,實(shí)時(shí)數(shù)據(jù)倉(cāng)庫的出現(xiàn)改變了這個(gè)局面。
2 主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫的提出
傳統(tǒng)數(shù)據(jù)庫的時(shí)間變化周期通常為一天或一周,但是網(wǎng)絡(luò)使得現(xiàn)在的商業(yè)操作即時(shí)化,對(duì)數(shù)據(jù)變化周期的要求愈加苛刻。因此,Michaem Haisten提出了實(shí)時(shí)數(shù)據(jù)倉(cāng)庫 JRTDW(Real-Time Data Warehouse)概念,也就是所謂的“零延遲數(shù)據(jù)倉(cāng)庫環(huán)境”的一部分。許有志 這樣描述主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫的系統(tǒng)數(shù)據(jù)流:當(dāng)OLTP系統(tǒng)中有操作性事務(wù)發(fā)生后,該事務(wù)中所改變的數(shù)據(jù)將被實(shí)時(shí)部分的監(jiān)控模塊捕捉。監(jiān)控模塊將數(shù)據(jù)傳輸至操作數(shù)據(jù)存儲(chǔ)(ODS)。在ODS中,數(shù)據(jù)將被存放一定的時(shí)間。正如Samuel S.Conn所提出的,下一代數(shù)據(jù)倉(cāng)庫是以加速信息循環(huán)周期、消除信息延時(shí),使不同水平的用戶能更用效地利用及時(shí)信息而出現(xiàn)的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫。
3 主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫的研究
3.1 一般改進(jìn)型主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫
傳統(tǒng)數(shù)據(jù)倉(cāng)庫是由ODS(Operational Data Store)、數(shù)據(jù)倉(cāng)庫、數(shù)據(jù)集市和BI工具組成。OLTP系統(tǒng)中的操作型數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫的非響應(yīng)期批處理載入到ODS中。張磊和王備戰(zhàn)認(rèn)為一般的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫有服務(wù)器容易負(fù)載、觸發(fā)機(jī)制性能低、同步機(jī)制代價(jià)高、數(shù)據(jù)庫效率低以及數(shù)據(jù)驗(yàn)證開銷大等缺點(diǎn),于是提出一種改進(jìn),主要是改進(jìn)或增加了以下幾個(gè)模塊:實(shí)時(shí)監(jiān)控模塊、數(shù)據(jù)集成模塊、數(shù)據(jù)存儲(chǔ)模塊和實(shí)時(shí)分析模塊。改進(jìn)的模型通過EAI提供的實(shí)時(shí)監(jiān)控模塊來監(jiān)控操作型事務(wù)中改變的數(shù)據(jù)。監(jiān)控模塊捕捉的數(shù)據(jù)傳輸?shù)皆鰪?qiáng)的ODS模塊中。數(shù)據(jù)在ODS中存放一定的時(shí)間,一是與數(shù)據(jù)倉(cāng)庫中的數(shù)據(jù)進(jìn)行整合處理,二是進(jìn)行時(shí)段性分析。最終,實(shí)時(shí)數(shù)據(jù)將被導(dǎo)入非實(shí)時(shí)部分中,執(zhí)行傳統(tǒng)數(shù)據(jù)倉(cāng)庫的功能,整合歷史數(shù)據(jù),用于戰(zhàn)略查詢。
3.2 基于SOA的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫
SOA,面向服務(wù)的體系結(jié)構(gòu)(service oriented architecture)是一個(gè)組件模型,它將應(yīng)用程序的不同功能單元稱為服務(wù),通過這些服務(wù)之間定義良好的接口和契約聯(lián)系起來;赟OA的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫思想是采用Web Services技術(shù)實(shí)現(xiàn)跨平臺(tái)的、無縫共享的、實(shí)時(shí)的數(shù)據(jù)交換。基于SOA的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫系統(tǒng)最關(guān)鍵的體現(xiàn)是Web Services,它建立在一系列與平臺(tái)無關(guān)的協(xié)議之上,包括HTTP,XML,UDDI,WSDL,SOAP。這些協(xié)議在源數(shù)據(jù)庫、EAI中間件和數(shù)據(jù)倉(cāng)庫之間,是SOA技術(shù)實(shí)現(xiàn)方式。SOA要求動(dòng)態(tài)的定位和調(diào)用服務(wù),這可以通過UDDI,WSDL,SOAP實(shí)現(xiàn)。SOA要求服務(wù)接口契約的平臺(tái)無關(guān)性,XML可以實(shí)現(xiàn)。私有UD2D I注冊(cè)中心包含了所有關(guān)于Web服務(wù)的描述文件,對(duì)這些服務(wù)的調(diào)用均要首先在注冊(cè)中心搜索以決定調(diào)用的端口和方式。SOAP封裝WSDL描述的服務(wù),實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)傳輸。但是該實(shí)時(shí)數(shù)據(jù)倉(cāng)庫會(huì)在出現(xiàn)超出負(fù)載和web服務(wù)安全通信機(jī)制問題,同時(shí)數(shù)據(jù)集成也會(huì)成為瓶頸。
3.3 基于多Agent的主動(dòng)數(shù)據(jù)倉(cāng)庫
所謂多Agent系統(tǒng)是指一個(gè)由多個(gè)自治運(yùn)行的Agent組成的集體,由多個(gè)Agent組成的智能群體的重要之處在于通過Agent之間的相互對(duì)話和相互協(xié)商工作有效地完成共同的任務(wù)。在徐有志等人的研究中,提出了基于MAS的系統(tǒng)模型的多Agent數(shù)據(jù)倉(cāng)庫結(jié)構(gòu),它通過多個(gè)Agent之間的交互來完成數(shù)據(jù)抽取、傳輸以及數(shù)據(jù)查詢,該系統(tǒng)模型分4個(gè)層次:數(shù)據(jù)監(jiān)控層、數(shù)據(jù)處理層、數(shù)據(jù)查詢層、用戶交互層。在該系統(tǒng)模型中,多Agent間協(xié)同采用顯式協(xié)同,即基于通信的協(xié)同。Agent間通過KQML語言實(shí)現(xiàn)彼此問的交互協(xié)同,共同完成目標(biāo)。
3.4 基于分析規(guī)則的主動(dòng)數(shù)據(jù)倉(cāng)庫
常規(guī)的數(shù)據(jù)倉(cāng)庫應(yīng)用中,分析和決策較多地依賴于用戶參與。王子紅 等為了在自動(dòng)決策以及實(shí)時(shí)性等方面對(duì)常規(guī)的數(shù)據(jù)倉(cāng)庫進(jìn)行改進(jìn),提出了一種基于分析規(guī)則的主動(dòng)數(shù)據(jù)倉(cāng)庫體系結(jié)構(gòu),它在常規(guī)的數(shù)據(jù)倉(cāng)庫的基礎(chǔ)上引進(jìn)了分析規(guī)則,通過對(duì)主動(dòng)規(guī)則的改進(jìn)而設(shè)計(jì)的分析規(guī)圳能滿足主動(dòng)數(shù)據(jù)倉(cāng)庫的特性。相應(yīng)地還對(duì)數(shù)據(jù)倉(cāng)庫的元數(shù)據(jù)進(jìn)行了擴(kuò)展。該系統(tǒng)統(tǒng)主要由5部分構(gòu)成,分別是:ADW工具集,OLTP系統(tǒng),常規(guī)數(shù)據(jù)倉(cāng)庫,多維數(shù)據(jù)市方體,上動(dòng)數(shù)據(jù)倉(cāng)庫引擎。該系統(tǒng)通過ADW具定義分析規(guī)則,分析規(guī)則被存儲(chǔ)到分析規(guī)則存儲(chǔ)器,由定義的分析規(guī)則產(chǎn)生的事件(Events)被放人事件隊(duì)列并統(tǒng)一管理。分析規(guī)則管理機(jī)制根據(jù)事件隊(duì)列中的事件以及存儲(chǔ)于分析規(guī)則存儲(chǔ)器中的分析規(guī)則進(jìn)行自動(dòng)決策管理。發(fā)生沖突時(shí)由分析規(guī)則管理機(jī)制負(fù)責(zé)處理,最終得到的結(jié)果由分析結(jié)果管理器進(jìn)行處理。
4 主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫的應(yīng)用
主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫可以解決傳統(tǒng)數(shù)據(jù)倉(cāng)庫無法完成的任務(wù),例如:利用呼叫中心進(jìn)行自動(dòng)的客戶營(yíng)銷,在電信服務(wù)中防止電話詐騙,供應(yīng)商預(yù)測(cè)銷售量并及時(shí)補(bǔ)充商品......有報(bào)道稱Oracle公司提供的數(shù)據(jù)集成解決方案用于在SOA、BI和數(shù)據(jù)倉(cāng)庫環(huán)境中構(gòu)建、部署和管理以實(shí)時(shí)數(shù)據(jù)為中心的架構(gòu),企業(yè)可以將其開發(fā)成本降低30%,數(shù)據(jù)處理速度提高50%,業(yè)務(wù)流程執(zhí)行時(shí)間減少至少70%。隨著市場(chǎng)的發(fā)展,數(shù)據(jù)倉(cāng)庫不僅被要求用來提供戰(zhàn)略性的決策支持,還需要對(duì)企業(yè)各業(yè)務(wù)單元的日常運(yùn)作提供戰(zhàn)術(shù)性的指導(dǎo),主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫技術(shù)的發(fā)展,提高了企業(yè)對(duì)外部信息的反應(yīng)速度和決策自動(dòng)化能力,其提供的可執(zhí)行的分析有效地驅(qū)動(dòng)了企業(yè)的業(yè)務(wù)系統(tǒng)運(yùn)作,實(shí)現(xiàn)了企業(yè)信息的共享,連接了各部門的流程運(yùn)作和各業(yè)務(wù)平臺(tái)之間結(jié)合,極大地延伸了商業(yè)智能的范疇,是數(shù)據(jù)倉(cāng)庫技術(shù)的發(fā)展方向之一。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:主動(dòng)實(shí)時(shí)數(shù)據(jù)倉(cāng)庫技術(shù)簡(jiǎn)析