基于DW的DSS的構(gòu)建
基于該企業(yè)現(xiàn)有內(nèi)部網(wǎng)(Intranet),針對一般企業(yè)用戶范圍廣、流動性大和面對市場需求分析工作量大的特點,基于數(shù)據(jù)倉庫的決策支持系統(tǒng)框架結(jié)構(gòu)模型如圖1所示。
圖 1:基于DW的DSS系統(tǒng)框架結(jié)構(gòu)圖
本系統(tǒng)應(yīng)用模型是瀏覽器/服務(wù)器(B/S) 3 層結(jié)構(gòu)形式,即客戶端、應(yīng)用服務(wù)器和數(shù)據(jù)源服務(wù)器。
(1)數(shù)據(jù)倉庫的采集單元(pump)負(fù)責(zé)定期的通過企業(yè)內(nèi)部網(wǎng)通信干線分布在網(wǎng)絡(luò)各站點上的有關(guān)數(shù)據(jù)庫收集最新的數(shù)據(jù),并完成數(shù)據(jù)的凈化與變換?紤]到 DW 中數(shù)據(jù)對象較為復(fù)雜且數(shù)量巨大,決策支持系統(tǒng)其他單元對 DW 的訪問是通過 OLAP 服務(wù)器來完成的。使用 OLAP 服務(wù)器的目的是為了得到完善的多維數(shù)據(jù)管理,并提供簡便快速且性能有保證的多維數(shù)據(jù)查詢和分析,大大地降低了系統(tǒng)的數(shù)據(jù)傳輸量,提高了數(shù)據(jù)挖掘和決策分析效率。
(2)知識庫中的知識除了在系統(tǒng)建立之初輸入之外,還由系統(tǒng)的數(shù)據(jù)挖掘單元不斷地進(jìn)行補(bǔ)充, 與傳統(tǒng)的 DSS 體系結(jié)構(gòu)不同。在數(shù)據(jù)挖掘單元中,盡量使用已有的一些數(shù)據(jù)挖掘軟件工具,如SAS,IBM Intelligent Mines等。
(3)在中間層設(shè)置 Web 服務(wù)器和知識服務(wù)器。用戶通過 HTTP 協(xié)議訪問Web服務(wù)器上的HTML 格式的頁面,而Web服務(wù)器則根據(jù)頁面設(shè)置與用戶要求向知識服務(wù)器提出決策需求。知識服務(wù)器是處理用戶決策需求的綜合服務(wù)單元,它根據(jù)用戶需求向知識庫和數(shù)據(jù)庫要求相應(yīng)的知識和數(shù)據(jù),經(jīng)處理后以Web頁面的形式提供給用戶。
(4)在客戶端,用戶通過 Web 瀏覽器訪問Intranet上的Web服務(wù)器來進(jìn)行決策咨詢。本系統(tǒng)的用戶可分為兩類:一類是一般人員,他們只需要了解一下企業(yè)總體情況以及決策支持系統(tǒng)對具體的一般性建議,服務(wù)器上的靜態(tài) Web 頁面就可以滿足他們要求。另一類是企業(yè)高層管理決策人員,他們除需了解各部門情況與相關(guān)統(tǒng)計以外。
數(shù)據(jù)倉庫的設(shè)計
數(shù)據(jù)倉庫與數(shù)據(jù)庫雖然過程都要經(jīng)歷概念模型、邏輯模型和物理模型3個設(shè)計階段,但在各個設(shè)計階段所采取的方法卻截然不同。根據(jù)上述系統(tǒng)數(shù)據(jù)倉庫采用面向主題,即面向?qū)ο笞陨隙碌脑O(shè)計方法。下面分別介紹3個模型設(shè)計階段采用的建模技術(shù)。
1 概念模型的設(shè)計
超立方體(Hypercube)可用超出三維的表示來描述一個對象(對象可以是客戶、產(chǎn)品、營銷策略等),它完全可以滿足 DW 的多維特性。使用自上而下的方法設(shè)計一個超立方體的步驟如下:
(1)確定模型中需要抓住的關(guān)鍵過程。
(2)確定需要捕獲的值。
(3)確定數(shù)據(jù)的粒度,即需要獲取最低一級的詳細(xì)信息。
當(dāng)維數(shù)超過三維后,超立方體在表現(xiàn)上缺乏直觀性,因此我們采用一種稱為信息包圖(Information packed picture)的方法在平面上展開超立方體。使用信息包圖設(shè)計概念模型的具體步驟如下: 1確定指標(biāo):指標(biāo)是訪問DW的關(guān)鍵所在,是用戶最關(guān)心的信息。它是表示在維度空間衡量商務(wù)信息的一種方法。2確定維度:維度提供了用戶訪問DW的信息途徑,對應(yīng)超立方體的每一面,位于信息包圖的第一行的每個欄目中。3確定類別:類別是在一個維度內(nèi)為了提供詳細(xì)的分類而定義的,而其中的成員又是為了辨別和區(qū)分特別數(shù)據(jù)而設(shè)的,它表示一個維度包含的詳細(xì)信息。一個維度內(nèi)最低層的可用分類可以又稱為詳細(xì)類別。
2 DW邏輯模型的設(shè)計
根據(jù) DW主要提供的是查詢操作,選擇星型圖作為其邏輯模型,從 DW 的概念模型(信息包圖模型)轉(zhuǎn)換成 DW 的邏輯模型(星型圖模型)的過程,可以分為以下幾個步驟:
(1) 指標(biāo)實體:指標(biāo)實體位于星型圖的中心,是用戶最關(guān)心的基本實體和查詢活動的中心,為用戶的商務(wù)活動提供定量數(shù)據(jù)。每一個指標(biāo)實體代表一系列相關(guān)事實,完成一項指定的功能,在一般情況下代表一個現(xiàn)實事物的綜合水平,僅僅與每個相關(guān)維度的一個點對應(yīng)。
(2) 定義維度實體。一個維度實體對應(yīng)指標(biāo)實體中的多個指標(biāo),用戶使用維度實體來訪問指標(biāo)實體,其實質(zhì)是對應(yīng)著邏輯數(shù)據(jù)實體。一個維度實體對應(yīng)信息包圖中的一個列。
(3) 定義詳細(xì)類別實體。一個詳細(xì)類別的實體與現(xiàn)實世界的某一個實體相對應(yīng)。
(4) 定義邏輯模型。定義邏輯模型的最后一步是將星型模型轉(zhuǎn)換成雪花模型。限于篇幅,轉(zhuǎn)換過程與圖示從略。
3 DW物理模型的設(shè)計
根據(jù)星型模型或雪花模型,就可以方便地定義出DW的物理數(shù)據(jù)結(jié)構(gòu)。一般將指標(biāo)實體和詳細(xì)類別實體轉(zhuǎn)變?yōu)橐粋具體的物理數(shù)據(jù)庫表,稱為事實表。維度實體通常也轉(zhuǎn)化為數(shù)據(jù)庫表,稱為維表,它包括其每一層次的主碼和對應(yīng)的值。維表和事實表通過維關(guān)鍵字相關(guān)聯(lián)。在物理模型設(shè)計階段,需要確定以下的內(nèi)容:
(1)規(guī)定數(shù)據(jù)質(zhì)量指標(biāo),規(guī)范數(shù)據(jù)倉庫中的各種數(shù)據(jù)。
(2)定義實體、實體特征以及實體所具有的一切屬性。
(3)定義規(guī)模,確定數(shù)據(jù)容量和更新頻率。為了獲得物理模型設(shè)計階段完整的文檔資料,可利用自動定義軟件工具進(jìn)行數(shù)據(jù)管理。
基于數(shù)據(jù)倉庫的醫(yī)院決策支持系統(tǒng)
1 醫(yī)院決策支持系統(tǒng)的體系結(jié)構(gòu)
基于數(shù)據(jù)倉庫的醫(yī)院決策支持系統(tǒng)體系結(jié)構(gòu)如圖2:
圖2:基于數(shù)據(jù)倉庫的醫(yī)院決策支持系統(tǒng)體系結(jié)構(gòu)圖
(1)底層為數(shù)據(jù)獲取層,數(shù)據(jù)源主要包括患者信息、 藥品信息、門診信息、住院信息以及一些外部數(shù)據(jù)。外部數(shù)據(jù)主要包括競爭數(shù)據(jù)及國家的相關(guān)政策法規(guī)等,其它信息來自醫(yī)院信息系統(tǒng) HIS。為保持?jǐn)?shù)據(jù)一致性,必須對數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行清理、抽取、轉(zhuǎn)換,生成綜合性統(tǒng)一的數(shù)據(jù)類型存入醫(yī)院DW。
(2)數(shù)據(jù)存儲層主要用來存儲和管理加工處理后的面向決策主題的綜合性數(shù)據(jù),并按決策主題的需求進(jìn)行重新組織 ,為決策支持提供大量的數(shù)據(jù)依據(jù)。
(3)數(shù)據(jù)處理層包括模型庫、數(shù)據(jù)挖掘、OLAP 及其相應(yīng)的管理系統(tǒng)部分。通過 OLAP 與 DM 從DW中得出有用的信息和知識。
(4)數(shù)據(jù)訪問層為決策者提供與系統(tǒng)交互的入口。把數(shù)據(jù)處理層得到的信息和知識通過人機(jī)交互界面展現(xiàn)給用戶 ,主要包括用戶交互、格式化查詢及報表和統(tǒng)計圖的生成等。
2 醫(yī)院決策支持系統(tǒng)的數(shù)據(jù)倉庫設(shè)計
(1)數(shù)據(jù)建模
在設(shè)計DW之前 ,必須先確定主題。主題是一個在較高層次將數(shù)據(jù)歸類的標(biāo)準(zhǔn) ,它能反映出分析對象所涉及的各項數(shù)據(jù)以及相互聯(lián)系。經(jīng)過對醫(yī)院業(yè)務(wù)的仔細(xì)分析 ,我們確定了三個基本主題:患者主題、 藥品主題、 費用主題,其中每個主題又可以劃分為若干個子主題。根據(jù)不同的分析主題確定描述各個主題中可用于分析與決策支持的相應(yīng)指標(biāo) ,即多維數(shù)據(jù)模型的事實表 ,并根據(jù)各個指標(biāo)的約束因素 ,確定多維數(shù)據(jù)模型的各個維。以 “門診費用” 主題為例 ,它含有時間維、 科室維、 疾病維、 費用類別維四個維 ,形成了 “門診費用” 分析的不同角度(某段時間、 某個科室、 某種疾病和某類收費) 。事實表由這四個維的主鍵和一個度量值即 “門診應(yīng)付費用總計” 組成。一個事實表與四個維表聯(lián)系起來構(gòu)成了一個四維分析空間。醫(yī)院決策支持系統(tǒng)的數(shù)據(jù)倉庫的邏輯模型采用星型模型 ,每個子主題對應(yīng)一個星型模型結(jié)構(gòu)。星型模型由一個事實表和多個維表構(gòu)成。
(2)數(shù)據(jù)集成
確定了DW的數(shù)據(jù)模型之后 ,下一步就是把源數(shù)據(jù)集成到DW 中 ,具體的分為數(shù)據(jù)抽取、 數(shù)據(jù)清理、 數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載這四個步驟。其中數(shù)據(jù)抽取主要是通過網(wǎng)絡(luò)把從 HIS中提取出的數(shù)據(jù)傳輸?shù)较到y(tǒng) DW 中。要完成以上工作 ,需利用 Microsoft SQL Server 2000 的數(shù)據(jù)轉(zhuǎn)換服務(wù) DTS 包組件 ,在包中指定源數(shù)據(jù)與目標(biāo)數(shù)據(jù)間的映射關(guān)系 ,把數(shù)據(jù)轉(zhuǎn)換和導(dǎo)入導(dǎo)出過程保存在存儲過程中 ,讓服務(wù)器自動、 定期的執(zhí)行。
總結(jié)與展望
現(xiàn)在很多企業(yè)己經(jīng)開始建立數(shù)據(jù)倉庫系統(tǒng)。但是,數(shù)據(jù)倉庫建設(shè)的問題出現(xiàn)在兩頭,即:一方面是數(shù)據(jù),國內(nèi)數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)積累還不夠,作為數(shù)據(jù)倉庫系統(tǒng)沒有數(shù)據(jù)積累是沒有意義的。另一方面是工具,無論是OLAP還是數(shù)據(jù)挖掘,都不太好用,不夠大眾化,另外由于建設(shè)數(shù)據(jù)倉庫的費用巨大,相當(dāng)數(shù)量的企業(yè)無法承受。如何研制一整套適合我國企事業(yè)單位的數(shù)據(jù)倉庫整體解決方案,使企事業(yè)單位投入一定的經(jīng)費,就有一定的收益,即邊投入邊產(chǎn)出,這是一個值得考慮的問題。
對于網(wǎng)絡(luò)蓬勃發(fā)展的今天,如何將數(shù)據(jù)挖掘的思想引入網(wǎng)絡(luò)信息處理領(lǐng)域,在WWW上進(jìn)行信息挖掘,這是極具誘惑和挑戰(zhàn)的領(lǐng)域,是對互聯(lián)網(wǎng)上信息再分析和利用的巨大貢獻(xiàn)。在Internet上建立DM和KDD服務(wù)器,與數(shù)據(jù)庫服務(wù)器配合,實現(xiàn)數(shù)據(jù)挖掘,加強(qiáng)對各種非結(jié)構(gòu)化數(shù)據(jù)的挖掘,如文本數(shù)據(jù)、圖形圖像數(shù)據(jù)、多媒體數(shù)據(jù),這些都能更好的為決策者提供技術(shù)支持。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:基于DW的決策支持系統(tǒng)
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10820611141.html