隨著市場競爭的日趨激烈,商業(yè)活動也變得越來越復(fù)雜,企業(yè)對信息的依賴性也變得越來越高,對信息的處理和利用能力的強弱決定了企業(yè)的興衰成敗,因此企業(yè)對決策的準確性和及時性的要求也越來越高,充分利用、挖掘企業(yè)現(xiàn)有的海量數(shù)據(jù),能夠幫助企業(yè)做出更好的商業(yè)決策,使得在提供多維數(shù)據(jù)集中數(shù)據(jù)的關(guān)系系統(tǒng)方面的投資產(chǎn)生更高的回報,從而提高企業(yè)的競爭力。
數(shù)據(jù)倉庫是一個面向主題的、集成的、與時間相關(guān)、穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉庫將來自于一個或多個數(shù)據(jù)源的數(shù)據(jù)根據(jù)不同的主題進行存儲,并對原始數(shù)據(jù)進行抽取、轉(zhuǎn)換和加載等一系列篩選和清理工作。數(shù)據(jù)倉庫是BI的核心,它的性能高低直接決定了BI的表現(xiàn)。
數(shù)據(jù)倉庫具有以下特征:1)面向主題性:要求數(shù)據(jù)倉庫中存儲的不是以應(yīng)用劃分的數(shù)據(jù)而是以業(yè)務(wù)內(nèi)容劃分的數(shù)據(jù),建立可獨立維護的良構(gòu)的主題數(shù)據(jù)庫;2)數(shù)據(jù)集成性:要求數(shù)據(jù)倉庫中的數(shù)據(jù)采用統(tǒng)一的編碼方式,對原有的分散的數(shù)據(jù)庫中的數(shù)據(jù)進行抽取、加工、匯總、消除數(shù)據(jù)的不一致性后進入數(shù)據(jù)倉庫;3)非易失性:在數(shù)據(jù)進入數(shù)據(jù)倉庫之后并不進行一般意義上的數(shù)據(jù)更新操作,被長期保留,以便為決策者提供決策分析數(shù)據(jù),所涉及到的操作主要是查詢;4)反映歷史變化:數(shù)據(jù)倉庫中的數(shù)據(jù)通常反映的是歷史信息,只增不刪,使數(shù)據(jù)倉庫中的數(shù)據(jù)總是擁有時間維度,使決策者通過這些信息,對企業(yè)的發(fā)展歷程和未來的發(fā)展趨勢做出定量分析和預(yù)測。
數(shù)據(jù)倉庫的關(guān)鍵技術(shù)可分為數(shù)據(jù)抽取(將OLTP系統(tǒng)中數(shù)據(jù)按照數(shù)據(jù)倉庫的格式組織數(shù)據(jù))、數(shù)據(jù)清洗(去除數(shù)據(jù)的不一致性,并去除與分析無關(guān)或不利于分析的數(shù)據(jù))、數(shù)據(jù)轉(zhuǎn)換(將來源不同的分散數(shù)據(jù)集成并轉(zhuǎn)換以供分析使用)、數(shù)據(jù)裝載和維護(周期性的加載新數(shù)據(jù),刷新當前數(shù)據(jù),并重新計算以供決策使用)等。
圖1 數(shù)據(jù)倉庫的實現(xiàn)過程
2 多維數(shù)據(jù)集
多維數(shù)據(jù)集是OLAP中的主要對象,是一項可對數(shù)據(jù)倉庫中的數(shù)據(jù)進行快速訪問的技術(shù),多維數(shù)據(jù)集是一個數(shù)據(jù)集合,通常從數(shù)據(jù)倉庫的子集構(gòu)造,并組織和匯總成一個由一組維度和度量值定義的多維結(jié)構(gòu)。度量值是用戶將要分析的數(shù)值數(shù)據(jù),而維度則是度量值將要被深化的類別,維度是可以分層的。多維數(shù)據(jù)集是由關(guān)系數(shù)據(jù)庫中的一組特殊表創(chuàng)建的,這些表是事實數(shù)據(jù)表和維度表。
1)事實表,每個數(shù)據(jù)倉庫都包含一個或多個事實表,事實表通常包含大量的行,主要特點是包含數(shù)字數(shù)據(jù)(不包含描述性的信息)。這些數(shù)字信息可以匯總,以提供企業(yè)作為歷史的數(shù)據(jù),每個事實數(shù)據(jù)表包含一個由多個部分組成的索引,該索引包含作為外鍵的相關(guān)性維度表的主鍵;
2)維度表包含事實數(shù)據(jù)表中事實記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。
3 構(gòu)建多維數(shù)據(jù)集
3.1 構(gòu)建數(shù)據(jù)倉庫
以商品銷售管理數(shù)據(jù)庫為例構(gòu)建數(shù)據(jù)倉庫,在商品銷售管理數(shù)據(jù)庫中包含很多表,通過ETL完成數(shù)據(jù)抽取、清洗和轉(zhuǎn)換以構(gòu)建商品銷售管理數(shù)據(jù)倉庫,如表1。
表1 商品銷售管理數(shù)據(jù)倉庫
在此系統(tǒng)中,如果對數(shù)據(jù)倉庫中所存放的歷史數(shù)據(jù)進行分析和集成,就可以分析出各個國家每個季度的銷售情況,甚至可以進一步深化到每個城市每個月的銷售情況,根據(jù)所獲得的結(jié)果,做出合理的決策。通過對商品銷售管理系統(tǒng)的需求分析,確定以產(chǎn)品銷售分析為主題,以產(chǎn)品銷售的地理位置和時間等為數(shù)據(jù)倉庫的索引基準點,以上索引基準點都可以作為商品銷售管理的數(shù)據(jù)倉庫維度,而產(chǎn)品的銷售情況為事實表。
3.2 確定維和度量值
在實際決策過程中,決策者往往希望能從多個角度觀察多個指標的值。并且找出這些指標之間的關(guān)系,這些觀察數(shù)據(jù)的角度叫做維。根據(jù)此系統(tǒng)的需求,關(guān)于銷售管理數(shù)據(jù)將從員工、時間、地理位置,供貨商,銷售額等角度展開,通過對商品名稱銷售的國家、時間段和銷售額跟蹤采集的數(shù)據(jù)可以導(dǎo)出各種商品在不同時間段、不同銷售地點的銷售額等度量值,根據(jù)這些度量值得到事實表。本系統(tǒng)的事實表是商品銷售情況表,其中OrderDate屬于時間維,ProductID屬于產(chǎn)品維,EmployeeID屬于員工維,ShipperID屬于供貨商維等。
3.3 為維度表選擇屬性
在完成事實表之后,就可以為維度表選擇屬性了,利用維度設(shè)計器可以很容易的從維度屬性創(chuàng)建層次結(jié)構(gòu)。在此為地理位置維添加屬性,第一級別是國家,然后依次是省/州、城市、郵政編號,然后將其銷售額匯總,從而得到?jīng)Q策者需要的信息,對于特定銷售情況好的商品的城市,可以增加該商品供貨,以滿足銷售需求,而對于銷售情況相對較差的城市,決策者可以考慮減少供貨,并采取積極有效的措施,如進行促銷活動來刺激消費,從而增加銷售量,提升利潤。
4 結(jié)束語
多維數(shù)據(jù)集可以針對不同的維度進行多角度的分析,還可以對數(shù)據(jù)進行鉆取、切片等,功能非常強大。對于EXCEL用戶來說,可以使用透視表通過拖拽各個維度,從全方面多角度進行分析,多維數(shù)據(jù)模型為OLAM決策支持和分析系統(tǒng)的設(shè)計提供依據(jù),對于決策分析非常實用。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:基于多維數(shù)據(jù)集的BI技術(shù)研究
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1081947002.html