隨著國(guó)內(nèi)水泥企業(yè)信息化建設(shè)和應(yīng)用的逐步深入,各類(lèi)業(yè)務(wù)系統(tǒng)已在企業(yè)中廣泛使用,企業(yè)內(nèi)部建立了ERP系統(tǒng)(企業(yè)資源規(guī)劃)、CRM系統(tǒng)(客戶(hù)關(guān)系管理)、人力資源管理系統(tǒng)等基礎(chǔ)信息化系統(tǒng)。這些系統(tǒng)的特點(diǎn)是通過(guò)業(yè)務(wù)人員在客戶(hù)端對(duì)數(shù)據(jù)庫(kù)進(jìn)行操作。因而在系統(tǒng)的實(shí)際使用中,各個(gè)部門(mén)用戶(hù)往往局限于對(duì)已有的海量數(shù)據(jù)做一些簡(jiǎn)單的、局部的和淺層次的查詢(xún),缺乏對(duì)相關(guān)數(shù)據(jù)信息進(jìn)行深層次的分析和利用,“數(shù)據(jù)泛濫,知識(shí)貧乏”的現(xiàn)象很普遍,企業(yè)領(lǐng)導(dǎo)決策時(shí),往往更多的是依靠決策者的的直覺(jué)、假設(shè)。以及各類(lèi)報(bào)表的簡(jiǎn)單。這表明企業(yè)的正確決策對(duì)數(shù)據(jù)信息有著全面和深人的客觀(guān)需求,將企業(yè)在日常事務(wù)中積累、沉淀的大量歷史數(shù)據(jù)集成為可靠的決策支持信息,已成為水泥企業(yè)關(guān)注的重要問(wèn)題。
基于Pentaho的商業(yè)智能能夠充分利用水泥企業(yè)內(nèi)部的各類(lèi)信息系統(tǒng),從業(yè)務(wù)系統(tǒng)的基礎(chǔ)數(shù)據(jù)庫(kù)中抽取需要的數(shù)據(jù)。通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、加載和集成,實(shí)現(xiàn)商業(yè)信息的搜集、管理和分析。為企業(yè)決策者提供全面、準(zhǔn)確、系統(tǒng)和直觀(guān)的決策支持。
1 商業(yè)智能和Pentaho平臺(tái)
1989年,Gartner的分析師Howard Dresdner首次提出了“商業(yè)智能”(Business Intelligence,BI)的概念:它是將數(shù)據(jù)轉(zhuǎn)換成信息的過(guò)程,然后通過(guò)發(fā)現(xiàn)將信息轉(zhuǎn)化為知識(shí),并將知識(shí)應(yīng)用到商業(yè)行為上的一個(gè)過(guò)程。
圖1中,商業(yè)智能實(shí)質(zhì)上是將數(shù)據(jù)轉(zhuǎn)化為信息的過(guò)程。這一過(guò)程也可稱(chēng)為信息供應(yīng)鏈,其目的是把初始的操作型數(shù)據(jù)變成決策所使用的商務(wù)信息。在這一過(guò)程中,數(shù)據(jù)集成過(guò)程執(zhí)行源數(shù)據(jù)的清洗、格式轉(zhuǎn)化和合并計(jì)算等功能:數(shù)據(jù)存儲(chǔ)過(guò)程建立數(shù)據(jù)存儲(chǔ)模型,存儲(chǔ)企業(yè)統(tǒng)一的數(shù)據(jù)視圖,為商業(yè)智能系統(tǒng)的應(yīng)用提供基礎(chǔ)數(shù)據(jù):數(shù)據(jù)分析工具一般包括OLAP(聯(lián)機(jī)分析處理)、數(shù)據(jù)挖掘工具、統(tǒng)計(jì)分析工具及其它人工智能工具等,這些工具結(jié)合商業(yè)處理規(guī)則為決策者提供決策輔助信息。
商業(yè)智能軟件區(qū)別于一般的管理應(yīng)用軟件,在決策支持中發(fā)揮重要作用,有著廣闊的市場(chǎng)前景,近年來(lái)在國(guó)內(nèi)外受到高度重視。目前,微軟、Oracle、IBM、SAS等實(shí)力雄厚的公司都已把本身產(chǎn)品擴(kuò)展到BI領(lǐng)域,其憑借雄厚的技術(shù)力量。能為大型企業(yè)提供完整的BI平臺(tái)和解決方案。然而,這些廠(chǎng)商提供的都是需要商業(yè)軟件授權(quán)的解決方案,國(guó)內(nèi)企業(yè)在實(shí)施商業(yè)智能過(guò)程中往往需要花費(fèi)高昂成本。而采用開(kāi)源軟件產(chǎn)品,比如開(kāi)源數(shù)據(jù)庫(kù)、服務(wù)器軟件等,則既有利于功能定制開(kāi)發(fā),也在授權(quán)和成本方面比商業(yè)軟件有著絕對(duì)優(yōu)勢(shì)。在如今的開(kāi)源BI社區(qū),很多優(yōu)秀的開(kāi)源產(chǎn)品完全可以和商業(yè)產(chǎn)品一較高低。Pentaho便是目前應(yīng)用比較廣泛的開(kāi)源項(xiàng)目。
圖1 數(shù)據(jù)轉(zhuǎn)化為信息流程圖
圖2 水泥企業(yè)商業(yè)智能信息系統(tǒng)的體系結(jié)構(gòu)
Pentaho BI平臺(tái)是一個(gè)以過(guò)程為核心,面向解決方案的、可擴(kuò)展的商務(wù)智能平臺(tái)。其目的在于將一系列企業(yè)級(jí)BI產(chǎn)品、開(kāi)源軟件、API等等組件集成起來(lái),方便商務(wù)智能應(yīng)用的開(kāi)發(fā)。Pentaho的功能十分強(qiáng)大,它對(duì)BI的功能提供了全面支持。包括數(shù)據(jù)倉(cāng)庫(kù)、ETL、OLAP、數(shù)據(jù)挖掘等技術(shù),同時(shí)提供流程設(shè)計(jì)、報(bào)表生成、測(cè)試和部署的集成開(kāi)發(fā)環(huán)境。
2 水泥企業(yè)商業(yè)智能信息系統(tǒng)
目前,國(guó)內(nèi)大多數(shù)水泥企業(yè)都已上線(xiàn)ERP系統(tǒng)。ERP系統(tǒng)是指建立在信息技術(shù)基礎(chǔ)上,以系統(tǒng)化的管理思想,為企業(yè)決策層及員工提供決策運(yùn)行手段的管理平臺(tái)。它將企業(yè)的物流、資金流、信息流這三大資源進(jìn)行一體化集成,其管理內(nèi)容涉及到企業(yè)的生產(chǎn)控制、物流管理和財(cái)務(wù)管理等各個(gè)方面。
通過(guò)在水泥企業(yè)原有的ERP系統(tǒng)基礎(chǔ)上構(gòu)建Pentaho商業(yè)智能平臺(tái)來(lái)實(shí)現(xiàn)系統(tǒng)集成,使水泥企業(yè)不僅在一個(gè)集成的環(huán)境下,有一個(gè)合理、嚴(yán)格的流程控制,有效地完成日常的業(yè)務(wù)作業(yè),產(chǎn)生大量準(zhǔn)確的數(shù)據(jù),同時(shí)將這些操作型數(shù)據(jù)變?yōu)榉治鲂蛿?shù)據(jù),從分析型數(shù)據(jù)中提煉決策信息。協(xié)助水泥企業(yè)決策者做出正確的決策,促進(jìn)水泥企業(yè)對(duì)信息的深度利用。ERP可以為BI提供大量的準(zhǔn)確的源數(shù)據(jù),BI中的OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù)(DM)能從數(shù)據(jù)倉(cāng)庫(kù)中獲取數(shù)據(jù)并進(jìn)行多目標(biāo)多維度的分析,對(duì)用戶(hù)隨機(jī)性的查詢(xún)并形成報(bào)告不用消耗大量的計(jì)算機(jī)資源,消除了不必要的資源開(kāi)銷(xiāo)。
在水泥企業(yè)ERP系統(tǒng)上構(gòu)建Pentaho商業(yè)智能信息平臺(tái)的體系結(jié)構(gòu)主要由ERP業(yè)務(wù)子系統(tǒng)、業(yè)務(wù)數(shù)據(jù)庫(kù)、數(shù)據(jù)轉(zhuǎn)換工具、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、Mondrian OLAP分析工具、Weka數(shù)據(jù)挖掘工具和決策支持子系統(tǒng)組成見(jiàn)圖2。
該集成系統(tǒng)將各子系統(tǒng)中的海量數(shù)據(jù)經(jīng)過(guò)抽取、清洗、轉(zhuǎn)換、加載等過(guò)程,轉(zhuǎn)換為分析型數(shù)據(jù),加載入數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)根據(jù)不同部門(mén)的實(shí)際要求,再經(jīng)抽取、綜合、加載而進(jìn)入不同的數(shù)據(jù)集市。成為部門(mén)經(jīng)營(yíng)、管理和決策的數(shù)據(jù)庫(kù)。利用OLAP和數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中的數(shù)據(jù)進(jìn)行分析和處理。分析和處理的結(jié)果,可以直接提供給用戶(hù),也可以作為知識(shí)進(jìn)入決策支持系統(tǒng)的知識(shí)庫(kù),知識(shí)庫(kù)中的知識(shí)通過(guò)推理機(jī)中的推理規(guī)則,產(chǎn)生推理結(jié)果,提供給管理決策者。所有的數(shù)據(jù)傳輸、前端數(shù)據(jù)展示等均采用基于Pentaho的商業(yè)智能解決方案。
3 基于Pentaho的商業(yè)智能對(duì)水泥銷(xiāo)售的多維分析
水泥銷(xiāo)售多維分析通常從時(shí)間、地區(qū)和產(chǎn)品的不同角度來(lái)深入觀(guān)察產(chǎn)品的銷(xiāo)售情況。這里的時(shí)間、地區(qū)和產(chǎn)品就是維。而這些維的不同組合和所考察的度量指標(biāo)構(gòu)成的多維數(shù)組則是OLAP分析的基礎(chǔ),可形式化表示為(維1,維2,...,維n,度量指標(biāo)),如(地區(qū)、時(shí)間、產(chǎn)品、銷(xiāo)售額)。多維分析是指對(duì)以多維形式組織起來(lái)的數(shù)據(jù)采取切片(Slice)、切塊(Dice)、鉆取(Drill-down和Roll-up)、旋轉(zhuǎn)(Pivot)等各種分析動(dòng)作,以求剖析數(shù)據(jù),使用戶(hù)能從多個(gè)角度、多側(cè)面地觀(guān)察數(shù)據(jù)庫(kù)中的數(shù)據(jù),從而深入理解包含在數(shù)據(jù)中的信息。
水泥銷(xiāo)售多維分析的核心是位于服務(wù)器端的Pentaho平臺(tái),Pentaho平臺(tái)主要由以下幾個(gè)部分組成:(1)OLAP服務(wù)器。Mondrian是純Java開(kāi)發(fā)的OLAP服務(wù)器,通過(guò)該服務(wù)器。用戶(hù)可以對(duì)存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中的大型數(shù)據(jù)集進(jìn)行交互分析。(2)OLAP展示工具。JPivot可視化組件,包括多維數(shù)據(jù)表和多維數(shù)據(jù)圖,可以完成數(shù)據(jù)立方體的展示。由于該組件基于JSP網(wǎng)頁(yè)方案,適應(yīng)B/S模式開(kāi)發(fā)。通過(guò)報(bào)表生成工具Report Designer,可以進(jìn)一步生成專(zhuān)業(yè)的分析報(bào)表。(3)ETL工具。Kettle是和Pentaho整合的開(kāi)源ETL工具,包括Spoon和Pan兩個(gè)包,用于定義和執(zhí)行轉(zhuǎn)換操作,可以使用Chef或Kitchen讓定義的ETL任務(wù)定時(shí)自動(dòng)執(zhí)行。Kettle的Spoon和Chef工具有友好的圖形化界面,很容易使用。(4)數(shù)據(jù)挖掘工具。Weka是功能強(qiáng)大的數(shù)據(jù)挖掘軟件,提供了豐富的挖掘算法和可視化支持,適合配置緊耦合的挖掘環(huán)境。(5)集成管理和開(kāi)發(fā)環(huán)境。Pentaho Design Studio,基于Eclipse的開(kāi)發(fā)環(huán)境,內(nèi)置的Action Sequence編輯器提供了定義工作流的圖形化界面。此外。開(kāi)發(fā)人員可以很方便地利用該環(huán)境進(jìn)行項(xiàng)目測(cè)試和部署。
表1 水泥產(chǎn)品銷(xiāo)售多維分析
圖3 水泥產(chǎn)品銷(xiāo)售多維分析柱狀圖
現(xiàn)已湖南某水泥企業(yè)2008年的銷(xiāo)售數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)。構(gòu)建基于Pentaho的商業(yè)智能解決方案。把銷(xiāo)售數(shù)據(jù)導(dǎo)入Oracle10g數(shù)據(jù)庫(kù),作為支持Pentaho解決方案的基礎(chǔ)數(shù)據(jù)庫(kù),創(chuàng)建處理銷(xiāo)售數(shù)據(jù)的Action Sequence應(yīng)用,把應(yīng)用部署到在Mondrian OLAP服務(wù)器上。Mondrian OLAP核心引擎根據(jù)部署的配置文件,從關(guān)系數(shù)據(jù)庫(kù)中計(jì)算和緩存數(shù)據(jù),并響應(yīng)來(lái)自表示層的各種查詢(xún)。查詢(xún)可以是MDX語(yǔ)句,而MDX預(yù)先存儲(chǔ)后,非專(zhuān)業(yè)用戶(hù)可以在圖形化交互界面中進(jìn)行數(shù)據(jù)分析。啟動(dòng)Pentaho服務(wù)器,通過(guò)Web運(yùn)行得到水泥產(chǎn)品2008年的銷(xiāo)售數(shù)據(jù)多維分析和柱狀圖見(jiàn)表1、圖3。通過(guò)對(duì)水泥的時(shí)間、地區(qū)和產(chǎn)品的多維分析,可以得出水泥銷(xiāo)售中的地域性差別比較大的一般性結(jié)論:隨著企業(yè)歷史數(shù)據(jù)的累積。這種多維分析還將發(fā)現(xiàn)更多隱含的信息,可以幫助企業(yè)決策獲得更好的支持。
4 結(jié)論
通過(guò)ERP系統(tǒng)與商業(yè)智能的集成,構(gòu)建水泥企業(yè)商業(yè)智能信息平臺(tái),可有效利用ERP系統(tǒng)的海量歷史數(shù)據(jù),通過(guò)將操作型數(shù)據(jù)轉(zhuǎn)換為分析型數(shù)據(jù),從中提煉出決策信息,可實(shí)現(xiàn)水泥企業(yè)對(duì)信息的深度利用,提升決策水平;赑entaho的商業(yè)智能解決方案,可以有針對(duì)性地實(shí)現(xiàn)水泥銷(xiāo)售的多維分析,其結(jié)果直觀(guān)、高效。Pentaho平臺(tái)部署簡(jiǎn)單、操作簡(jiǎn)易、運(yùn)行成本低,因此易于應(yīng)用并取得成效。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:基于Pentaho的水泥企業(yè)商業(yè)智能信息系統(tǒng)開(kāi)發(fā)
本文網(wǎng)址:http://www.ezxoed.cn/html/solutions/1401934882.html