引 言
目前,各個行業(yè)都面臨著激烈的競爭,及時、準確的決策已成為企業(yè)生存與發(fā)展的生命線。隨著信息技術(shù)在企業(yè)中的普遍應(yīng)用,企業(yè)產(chǎn)生了大量富有價值的電子數(shù)據(jù)。但這些數(shù)據(jù)大都存儲于不同的系統(tǒng)中,數(shù)據(jù)的定義和格式也不統(tǒng)一,商務(wù)智能系統(tǒng)能從不同的數(shù)據(jù)源搜集的數(shù)據(jù)中提取有用的數(shù)據(jù),并對這些數(shù)據(jù)進行清洗、轉(zhuǎn)換、重構(gòu)等操作后存入數(shù)據(jù)倉庫或數(shù)據(jù)集市中;再運用適合的查詢分析工具、數(shù)據(jù)挖掘工具、聯(lián)機分析處理(OLAP)工具等管理分析工具對信息進行處理,使信息變?yōu)檩o助決策的知識, 并以適當(dāng)?shù)姆绞匠尸F(xiàn)在決策者面前,供決策者運籌帷幄。
1 商務(wù)智能(BI)簡介
1.1 商務(wù)智能的概念
商務(wù)智能(Business Intelligence,BI)的定義眾說紛紜。 Gartner Group 認為“商務(wù)智能是將數(shù)據(jù)轉(zhuǎn)換成信息的過程, 然后通過發(fā)現(xiàn)將信息轉(zhuǎn)化為知識”;商務(wù)智能大師利奧托德認為“商務(wù)智能是將存儲于各種商業(yè)信息系統(tǒng)中的數(shù)據(jù)轉(zhuǎn)換成有用信息的技術(shù),它允許用戶查詢和分析數(shù)據(jù)庫,可以得出影響商業(yè)活動的關(guān)鍵因素, 最終幫助用戶做出更好更合理的決策”。
1.2 商務(wù)智能系統(tǒng)的主要技術(shù)
美國數(shù)據(jù)倉庫研究院把商務(wù)智能比作 “數(shù)據(jù)煉油廠”,它將商務(wù)智能的應(yīng)用過程描述為“數(shù)據(jù)-信息-知識-計劃-行動”的過程。 由商務(wù)智能系統(tǒng)的基本架構(gòu)可以看出, 商務(wù)智能的實現(xiàn)涉及到軟件、硬件、咨詢服務(wù)及應(yīng)用等方面,其基本技術(shù)包括數(shù)據(jù)倉庫、聯(lián)機分析和數(shù)據(jù)挖掘 3 個部分。
2 聯(lián)機分析處理(OLAP)概述
聯(lián)機分析處理(OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫之父 E.F.Codd 于 1993 年提出的:OLAP 是使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。OLAP 的目標(biāo)是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求,是多維數(shù)據(jù)分析工具的集合。OLAP提供了在不同的數(shù)據(jù)子集和不同的抽象層數(shù)據(jù)上進行上卷、下鉆、切片、切塊、旋轉(zhuǎn)等多維分析操作,提高了數(shù)據(jù)分析的能力和數(shù)據(jù)顯示的靈活性。
3 OLAP 在商務(wù)智能系統(tǒng)中的應(yīng)用
作為商務(wù)智能系統(tǒng)的關(guān)鍵技術(shù),OLAP 可以在使用多維數(shù)據(jù)模型的數(shù)據(jù)倉庫或數(shù)據(jù)集市上進行,充分發(fā)揮 OLAP 的聯(lián)機分析的功能和特性。 將OLAP 與數(shù)據(jù)挖掘進行結(jié)合,能夠為數(shù)據(jù)挖掘提供基礎(chǔ)數(shù)據(jù)支持,提高數(shù)據(jù)挖掘的效率,而且還可以實現(xiàn)聯(lián)機分析數(shù)據(jù)挖掘的功能。用戶常常希望穿越數(shù)據(jù)庫,選擇相關(guān)數(shù)據(jù),在不同的粒度上進行分析,并以不同的形式顯示結(jié)果。聯(lián)機分析數(shù)據(jù)挖掘提供了在不同的數(shù)據(jù)子集和不同的抽象層上進行數(shù)據(jù)挖掘的工具,在數(shù)據(jù)立方體和挖掘的中間結(jié)果數(shù)據(jù)上進行下鉆、上卷、旋轉(zhuǎn)、切片、切塊等操作,提高數(shù)據(jù)挖掘探測性的數(shù)據(jù)分析能力和靈活性。
3.1 OLAP 數(shù)據(jù)庫設(shè)計
進行 OLAP 分析首先要根據(jù)分析主題選取分析的維度,設(shè)計 OLAP 數(shù)據(jù)庫模型。OLAP 數(shù)據(jù)庫的實現(xiàn)主要有 3 種方式:一是 MOLAP(基于多維數(shù)據(jù)庫的 OLAP),它是建立專有的多維數(shù)據(jù)庫來存儲 OLAP 所分析的數(shù)據(jù),性能好、響應(yīng)速度快,支持計算復(fù)雜的跨維計算和多用戶的讀寫操作計算;二是 ROLAP(基于關(guān)系型數(shù)據(jù)庫 OLAP),它是利用現(xiàn)有的關(guān)系數(shù)據(jù)庫技術(shù)通過建立中間表來模擬多維數(shù)據(jù), 通過 SQL 實現(xiàn)詳細數(shù)據(jù)與概要數(shù)據(jù)的存儲;三是 HOLAP,它將 ROLAP 和 MOLAP 的功能結(jié)合在一起,增強了數(shù)據(jù)庫的適應(yīng)性。
在中國, 大多數(shù)企業(yè)的數(shù)據(jù)都是采用關(guān)系型數(shù)據(jù)庫的方式進行存儲的, 并且存在著格式不統(tǒng)一,存儲不集中等多種弊病。 在企業(yè)商務(wù)智能系統(tǒng)建設(shè)的過程中,無法拋棄以往的數(shù)據(jù)重新構(gòu)建,只能對其進行優(yōu)化處理。 首先將原始數(shù)據(jù) ADB 通過應(yīng)用抽取、清洗、轉(zhuǎn)換、加載等數(shù)據(jù)倉庫技術(shù)建立企業(yè)級的數(shù)據(jù)倉庫 LDB(基于關(guān)系數(shù)據(jù)庫);然后根據(jù)部門或分析主題的要求, 創(chuàng)建部門級和主題級數(shù)據(jù)集市 RDB(ROLAP);最后在數(shù)據(jù)集市的基礎(chǔ)上創(chuàng)建多維立方體數(shù)據(jù)模型進行多維分析和預(yù)測(MOLAP)。 常規(guī)的分析、匯總等工作只需在數(shù)據(jù)集市中進行, 而決策分析和支持工作在多維立方體中進行實現(xiàn)。 基于以上分析,在本系統(tǒng)的設(shè)計上采用了 HOLAP 的設(shè)計方式對數(shù)據(jù)進行管理,數(shù)據(jù)庫總體架構(gòu)如圖 1 所示。
圖1.OLAP總體架構(gòu)
ROLAP(RDB)的設(shè)計一般采用星型模型或雪花模型來表達設(shè)計結(jié)果。 本文以數(shù)據(jù)集市中產(chǎn)品庫存變動為例, 分析表明宜采用雪花模型進行設(shè)計。 通過包含主題的事實表(存貨異動事實表)和 3個包含事實的維度表(產(chǎn)品維表 comProduct,倉庫維表 comWarehouse,產(chǎn)品記錄維表 comProdrec)來支持各種復(fù)雜的查詢和決策分析。 產(chǎn)品維度事實表向外連接了產(chǎn)品類型類別表 comProductClass,產(chǎn)品記錄維度事實表向外連接了產(chǎn)品批號類別表comProdBatch, 類別表是對事實表進行詳細的描述,通過這種方式可以縮小事實表,提高查詢的效率。建立的庫存變動主題雪花模型如圖 2 所示。
圖2.庫存變動主題雪花模型
圖 2 中, 事實表存貨異動與維表 comProduct,comWarehouse,comProdrec 通 過 各 維 表 的 主 鍵(ProdId 產(chǎn)品代碼 、WarehouseId 倉庫代碼 、BillNo表單記錄號、RecNo 產(chǎn)品記錄號、Flag) 建立關(guān)聯(lián),維表再通過各自的外鍵與詳細類別表建立關(guān)聯(lián),構(gòu)成雪花模型。 這個模型的基本分析維有 3 個:時間維、產(chǎn)品維和倉庫維;維層次分別為時間維(年,季度,月),產(chǎn)品維(產(chǎn)品類別,產(chǎn)品編號),倉庫維(倉庫編號);分析度量值則定為各種變動數(shù)量(入庫數(shù)量、在庫數(shù)量、出庫數(shù)量等)。
以確定的維度為基礎(chǔ),創(chuàng)建多維立方體。 將事實表中的 BillDate 字段進行提取分析得到時間維數(shù)據(jù) (以年季月進行三級分割, 提供三級數(shù)據(jù)鉆。 ClassID 字段為基礎(chǔ)進行下鉆操作,提供產(chǎn)品維數(shù)據(jù), 用 WareID 字段來提供倉庫維數(shù)據(jù),度量值分別由 BuyInAmount,AdjustAmount 和SaleOutAmount 三個字段值來提供,并根據(jù)各維度和度量值創(chuàng)建多維立方體。
3.2 OLAP 多維數(shù)據(jù)分析
建立好了多維立方體, 就可以對立方體進行多維數(shù)據(jù)分析。 OLAP 基本的分析操作包括切片、切塊、旋轉(zhuǎn)、鉆取等。 以度量值為 AdjustAmount 為例組織起來的三維立方體數(shù)組表示為(時間、產(chǎn)品類型、倉庫、在庫數(shù)量)。切片: 切片操作在給定的數(shù)據(jù)立方體的一個維上進行選擇,形成一個子方。 例如在倉庫維上選擇一個維成員, 就得到了在倉庫維上的一個關(guān)于時間和產(chǎn)品類型的切片; 在產(chǎn)品類型維上選定一個維成員,就得到一個關(guān)于時間和倉庫的切片。
切塊: 切塊操作在給定的數(shù)據(jù)立方體的某一個維上選定某一區(qū)間的維成員或在二個維或多個維上分別選取一個區(qū)間的維成員形成的一個子方。 例如在倉庫維上選擇維成員“02”,同時在時間維上選擇 2005 年的 4 個季度,就可得到一個數(shù)據(jù)切塊,如圖 3 所示。
圖3.三維數(shù)據(jù)切塊
鉆。恒@取有向上鉆取(上卷 roll-up)和向下鉆。ㄏ裸@ drill-down)操作。 上卷操作就是通過一個維的概念分層向上攀升,在數(shù)據(jù)立方體上進行聚集;下鉆是上卷的逆操作,通過沿維的概念分層向下從而得到更詳細的數(shù)據(jù),鉆取的深度與維所劃分的層次相對應(yīng)。 以在產(chǎn)品類型維上執(zhí)行下鉆操作為例,獲得更詳細的信息如圖 4 所示。
圖4.三維數(shù)據(jù)下鉆
旋轉(zhuǎn):旋轉(zhuǎn)是一種目視操作,通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù),提供數(shù)據(jù)的替代表示。 旋轉(zhuǎn)包含了交換行和列, 或者把某一行維移動到列維中去,或是把頁面顯示中的一個維和頁面外的維進行交換,令其成為新的行或列中的一個。
通過以上各種操作, 增強了數(shù)據(jù)的透明度和可讀性, 幫助用戶從不同的角度和深度去理解和分析數(shù)據(jù), 方便用戶從大量數(shù)據(jù)中獲取有用的信息,穿越數(shù)據(jù)迷霧。
4 結(jié)束語
本文對 OLAP 在商務(wù)智能系統(tǒng)中進行多維分析所涉及的多維數(shù)據(jù)結(jié)構(gòu)進行了設(shè)計, 并將多維數(shù)據(jù)分析技術(shù)與實例相結(jié)合進行了研究和探討。事實表明, 利用商務(wù)智能技術(shù)能幫助企業(yè)深入全面地分析業(yè)務(wù)數(shù)據(jù), 從不同的角度審視業(yè)務(wù)的經(jīng)營情況,給企業(yè)管理和決策者提供更全面、客觀的信息,有利于提高企業(yè)的經(jīng)營管理水平,使企業(yè)信息系統(tǒng)的建設(shè)更上一層樓。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:OLAP 技術(shù)在 BI 系統(tǒng)中的應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10819915934.html