引言
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)是作為兩種獨立的信息技術(shù)出現(xiàn)的。數(shù)據(jù)倉庫是從數(shù)據(jù)庫技術(shù)發(fā)展而來的,為決策服務(wù)的數(shù)據(jù)組織、存儲技術(shù);數(shù)據(jù)挖掘是通過對數(shù)據(jù)庫、數(shù)據(jù)倉庫中的數(shù)據(jù)進行分析,獲得有用知識和信息的一系列方法和技術(shù)。它們都可以完成對決策過程的支持,如將它們兩者結(jié)合起來集成到一個系統(tǒng)中,可以更加有效地提高系統(tǒng)的決策支持能力。
在國外,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)己迅速發(fā)展起來,逐漸成為決策支持的新手段。
2決策支持系統(tǒng)
決策支持系統(tǒng)是一種幫助中高層管理人員進行決策的計算機系統(tǒng),這種系統(tǒng)綜合運用了信息論、人工智能、信息經(jīng)濟學(xué)、管理科學(xué)、行為科學(xué)等學(xué)科的理論、方法和技術(shù)。企業(yè)可根據(jù)自已的實際情況實施不同的DSS應(yīng)用,其主要應(yīng)用包括以下幾個方面:銷售支持、客戶分析、市場研究、財務(wù)分析、運籌和戰(zhàn)略計劃等。
傳統(tǒng)的決策支持系統(tǒng)以模型庫為主體,通過定量分析進行輔助決策,F(xiàn)在數(shù)據(jù)倉庫可以把網(wǎng)絡(luò)不同站點的商業(yè)數(shù)據(jù)集成到一起為決策提供各種類型的有效的數(shù)據(jù)分析。
3數(shù)據(jù)倉庫
3.1 數(shù)據(jù)倉庫的定義及特點
WH.lnmon對數(shù)據(jù)倉庫定義為:數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制訂過程。數(shù)據(jù)倉庫具有的4個基本特征為:數(shù)據(jù)倉庫是面向主題的,主題意指一個分析領(lǐng)域,是在一個較高層次上對數(shù)據(jù)進行組織、歸類的標準。例如為商場營銷建立的數(shù)據(jù)倉庫,所選主題可能有商品、供應(yīng)商、顧客等;數(shù)據(jù)倉庫中的數(shù)據(jù)是集成的,數(shù)據(jù)倉庫的數(shù)據(jù)的來源可分為外部和內(nèi)部數(shù)據(jù),它需經(jīng)過清洗,變換成統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)進入數(shù)據(jù)倉庫;數(shù)據(jù)倉庫是穩(wěn)定的,數(shù)據(jù)倉庫保存的是大量經(jīng)集成、加工的綜合型數(shù)據(jù),而不是聯(lián)機數(shù)據(jù):數(shù)據(jù)倉庫是隨時間變化的,為了適應(yīng)DSS進行趨勢分析,數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)隨著數(shù)據(jù)倉庫的刷新和數(shù)據(jù)的增加,它的內(nèi)容也是變化的。數(shù)據(jù)倉庫中的數(shù)據(jù)與事務(wù)處理系統(tǒng)的數(shù)據(jù)比較如表1所示。
體系化環(huán)境的層次反映了數(shù)據(jù)與應(yīng)用邏輯的抽象程度,可很好地與企業(yè)實際部門組織結(jié)構(gòu)對應(yīng)起來,提高企業(yè)應(yīng)用數(shù)據(jù)的效率。體系化環(huán)境的層次如圖1所示。
圖1.體系化層次環(huán)境
數(shù)據(jù)倉庫系統(tǒng)由數(shù)據(jù)倉庫、數(shù)據(jù)倉庫管理系統(tǒng)和數(shù)據(jù)倉庫工具3個部分組成。數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)如圖2所示。
圖2.數(shù)據(jù)倉庫體系結(jié)構(gòu)
數(shù)據(jù)倉庫包含了早期細節(jié)級、當前細節(jié)級、輕度綜合級、高度綜合級的數(shù)據(jù),是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫管理系統(tǒng)負責(zé)整個系統(tǒng)的運行,包括從OLTP的數(shù)據(jù)庫中抽取、清洗、變換數(shù)據(jù)、維數(shù)劃分以及數(shù)據(jù)的安全、備份和恢復(fù)等工作。數(shù)據(jù)倉庫工具通過OLAP分析工具和數(shù)據(jù)挖掘工具實現(xiàn)數(shù)據(jù)分析,以提供決策支持信息來輔導(dǎo)領(lǐng)導(dǎo)決策儀。
3.2數(shù)據(jù)倉庫的設(shè)計方法
數(shù)據(jù)倉庫的開發(fā)方法不同于OLTP系統(tǒng)。其開發(fā)過程是一個數(shù)據(jù)驅(qū)動的過程,它的開發(fā)過程要經(jīng)過以下幾個步驟:
(1)分析決策需求,確定數(shù)據(jù)來源;
(2)定義數(shù)據(jù)的綜合、轉(zhuǎn)化過程,使系統(tǒng)能自動將數(shù)據(jù)從不同的數(shù)據(jù)源中提取出來后存放到數(shù)據(jù)倉庫中;
(3)建立數(shù)據(jù)倉庫:
(4)建立能使用戶從數(shù)據(jù)倉庫中獲取所需決策信息的工具,使之能進行有效的數(shù)據(jù)訪間和應(yīng)用開發(fā),并同時為用戶建立適用于決策支持的數(shù)據(jù)倉庫界面和應(yīng)用軟件。
4數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是一個決策支持過程,它通過對數(shù)據(jù)庫中的數(shù)據(jù)進行分析做出歸納性的推理,從中挖掘出潛在的模式,以幫助決策者做出正確的判斷和決策。它涉及到統(tǒng)計學(xué)、機器學(xué)習(xí)、數(shù)據(jù)庫、模式識別、人工智能和神經(jīng)網(wǎng)絡(luò)等學(xué)科內(nèi)容。數(shù)據(jù)挖掘的方法有神經(jīng)網(wǎng)絡(luò)、統(tǒng)計方法、決策樹方法、粗集方法等。
在當前,大多數(shù)數(shù)據(jù)倉庫的應(yīng)用都是進行統(tǒng)計、建立多維以及OLAP的分析工作。隨著數(shù)據(jù)挖掘研究的深入,已經(jīng)有了OLAP”和數(shù)據(jù)挖掘相結(jié)合的方法。例如在MicrosoftSQLServer2000的數(shù)據(jù)倉庫解決方案中就實現(xiàn)了OLAP和數(shù)據(jù)挖掘相結(jié)合。
數(shù)據(jù)挖掘過程一般分為3個主要階段:數(shù)據(jù)準備、挖掘操作、結(jié)果表達和解釋。如將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘協(xié)同工作,則可以簡化數(shù)據(jù)挖掘的步驟,從而大大提高數(shù)據(jù)挖掘的效率。所以,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘相結(jié)合是決策支持的有效解決方案。
5聯(lián)機分析處理(OLAP)
OLAP是決策支持系統(tǒng)的核心技術(shù)之一。OLAP是將數(shù)據(jù)倉庫中的數(shù)據(jù)轉(zhuǎn)移到多維結(jié)構(gòu)中,并且調(diào)用多維數(shù)據(jù)集來執(zhí)行有效且非常復(fù)雜的查詢。在多維結(jié)構(gòu)中,維即觀察的角度,它用超立方體或多立方體結(jié)構(gòu)來描述。在關(guān)系型的數(shù)據(jù)倉庫中,數(shù)據(jù)的多維視圖主要是通過星型模式和雪花模式等來實現(xiàn)的:星型模式:中央的對象是事實表,周圍的對象是維表。事實表的字段通常是一組主鍵,而主鍵的值依賴于周圍的維表。其結(jié)構(gòu)如圖3所示;雪花模式:對星型模式的維表進一步層次化,對維的屬性進行了多層次的劃分。其結(jié)構(gòu)如圖4所示。
圖3.星型模式
圖4.雪花模式
6利用SQLServer2000開發(fā)基于DW和DM的決策支持系統(tǒng)
Microsoft SQLsever2000提供了一套全新的綜合分析服務(wù)工具,它集成了OLAP和數(shù)據(jù)挖掘功能。其中,OLAP的分析服務(wù)提供了最完整、最具集成性的、可支持WEB的分析服務(wù);Analysis Service集成了數(shù)據(jù)挖掘技術(shù),它提供了兩種數(shù)據(jù)挖掘算法:Microsoft決策樹模型、Microsoft聚集挖掘模型。
數(shù)據(jù)挖掘技術(shù)可幫助用戶分析關(guān)系數(shù)據(jù)庫和多維OLAP數(shù)據(jù)集中的數(shù)據(jù),以獲取發(fā)展模式,并對企業(yè)未來的趨勢進行預(yù)測。我們利用Microsoft SQLserver2000的強大功能來開發(fā)企業(yè)的信息系統(tǒng)。
6.1企業(yè)的管理系統(tǒng)平臺
(l)各種事務(wù)處理系統(tǒng)平臺:服務(wù)器操作系統(tǒng)為WindowsServer2000;數(shù)據(jù)庫管理系統(tǒng)采用Mierosoft SQLServer 2000;前臺開發(fā)工具為Delphi7.0:運行環(huán)境為win98或其它Windows環(huán)境。
(2)為實現(xiàn)決策支持系統(tǒng),系統(tǒng)還增加的平臺為:分析服務(wù)器:SQLServer 2000 Analysis Serviee。它可在SQLServer 2000安裝完成后裝入。OLAP開發(fā)工具:visual Basie6.0。
6.2基于Dw+DM的決策支持系統(tǒng)的開發(fā)
基于DW十DM的決策支持系統(tǒng),就是以數(shù)據(jù)倉庫作為底層的數(shù)據(jù)源,再加上各種數(shù)挖掘技術(shù)來構(gòu)成決策支持。我們利用SQLserver 2000可建立如圖5所示的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的應(yīng)用模式。在這種應(yīng)用模式中,我們討論的重點放在決策部分。
圖5.客戶機/服務(wù)器應(yīng)用模式
其開發(fā)過程如下:進行數(shù)據(jù)倉庫的主題設(shè)計、確定邏輯模型和完成事實表和維表的設(shè)計;在SQLserver 2000中創(chuàng)建數(shù)據(jù)倉庫物理數(shù)據(jù)庫,其中包括事實表和維表:利用DTS數(shù)據(jù)轉(zhuǎn)換服務(wù)將數(shù)據(jù)源經(jīng)過數(shù)據(jù)驗證、數(shù)據(jù)遷移、數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換4個過程進入第2步所創(chuàng)建的數(shù)據(jù)倉庫;在分析服務(wù)器AnalysisSerVice中新建分析數(shù)據(jù)庫使其連接SQLserver2000中的數(shù)據(jù)倉庫:在分析服務(wù)器Analysis Service創(chuàng)建OLAP多維數(shù)據(jù)集;利用數(shù)據(jù)挖掘技術(shù)分析多維數(shù)據(jù)集中的數(shù)據(jù);開發(fā)客戶端分析程序。
在Microsoft SQLServer 2000 Analysis Serviee中能支持來自在關(guān)系數(shù)據(jù)源和多維數(shù)據(jù)集這兩者的數(shù)據(jù)挖掘,并且其擴展性能與第3方工具一起使用。Microsoft決策樹算法是基于分類概念的算法構(gòu)造樹,它以樹的結(jié)構(gòu)顯示分類的形式。其聚集算法是一種期望方法,它使用完善技術(shù)將記錄分組到附近區(qū)域,以展示相似和可預(yù)測的特征。在客戶端應(yīng)用分析程序中,可通過ADOMD數(shù)據(jù)對象接口和MDX語法以及OLEDBforOLAPServer來讀取多維數(shù)據(jù)集的數(shù)據(jù)。構(gòu)建MDX語句是生成OLAP對象鏈接和嵌入式數(shù)據(jù)庫(OLEDB)的關(guān)鍵。SQLServer2000中把MDX語句作為T-sQL語句的擴充部分。其語法格式如下:
SELECT<axis_speeifieation>[,<axis_sPeeifieation>]
FROM<eube一sPeeifiation>
WHERE<slieer--sPeeifieation>
其中:
axis-specification:取代傳統(tǒng)的數(shù)據(jù)列列表,它是指定所要顯示的維。
cube--specifiatinn:取代傳統(tǒng)的表,它是指定所要查詢的多維數(shù)據(jù)集。
slicer--specification:指定所要查詢維中的成員列出來的過濾條件。
VisualBasic是功能強大的面向?qū)ο蟮目梢暬某绦蜷_發(fā)工具,我們可以將MDX語句嵌入到Vosual Basic中來開發(fā)客戶端分析程序。
7結(jié)束語
數(shù)據(jù)倉庫+數(shù)據(jù)挖掘技術(shù)為DSS研制與開發(fā)提供了一種有效、可行的體系化解決方案。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在企業(yè)決策支持系統(tǒng)中的應(yīng)用將隨著現(xiàn)代社會商業(yè)模式的變革而進一步普及和深入。
在未來大規(guī)模定制經(jīng)濟環(huán)境下,數(shù)據(jù)倉庫將成為企業(yè)獲得競爭優(yōu)勢的關(guān)鍵武器。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在DSS中的應(yīng)用研究
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10819416342.html