ERP是EntERPrise Resources Planning的簡(jiǎn)稱,即為企業(yè)資源計(jì)劃,是20世紀(jì)90年代發(fā)展起來(lái)的企業(yè)信息管理系統(tǒng)。ERP的內(nèi)在含義是指利用計(jì)算機(jī)技術(shù),將企業(yè)內(nèi)部和外部資源信息按照成本管理原則分類整理所形成的信息管理系統(tǒng)。它的主要宗旨就是籽企業(yè)各方面的資源(包括人,財(cái),物、產(chǎn)、供、銷等方面)充分調(diào)配和平衡,使企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中能夠合理地配置企業(yè)內(nèi)部與外部的資源,全方位地發(fā)揮各方面的能量,從而使企業(yè)取得更好的經(jīng)濟(jì)效益。ERP在我國(guó)的應(yīng)用起步比較晚,取得成功的企業(yè)更是少之又少。為了加強(qiáng)ERP在我國(guó)企業(yè)應(yīng)用的成功率,必須結(jié)合我國(guó)的實(shí)際情況,并輔之以其它先進(jìn)技術(shù)。把數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)應(yīng)用到ERP中,增強(qiáng)傳統(tǒng)ERP的決策功能,就是一種新的嘗試。 一、數(shù)據(jù)倉(cāng)庫(kù) 什么是數(shù)據(jù)倉(cāng)庫(kù)呢?一般認(rèn)為,數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Support)。 一個(gè)典型的企業(yè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)通常包含數(shù)據(jù)源、數(shù)據(jù)存儲(chǔ)與管理、OLAP服務(wù)器(建立面向聯(lián)機(jī)分析處理Online Analysis Processing,簡(jiǎn)稱OLAP)以及前端工具與應(yīng)用四個(gè)部分。 在傳統(tǒng)的ERP系統(tǒng)中,一般的核心應(yīng)用都是進(jìn)銷存管理和賬務(wù)管理,數(shù)據(jù)庫(kù)中的數(shù)據(jù)也是緊緊圍繞產(chǎn)品信息、票據(jù)和賬目明細(xì)進(jìn)行的。這樣的數(shù)據(jù)層可以很好地實(shí)現(xiàn)OLTP(面向聯(lián)機(jī)事務(wù)處理Online Transaction Processing,簡(jiǎn)稱OLTP),但如果要為企業(yè)高層提供決策數(shù)據(jù)的話,就有必要對(duì)這樣原始的、松散的、孤立的數(shù)據(jù)進(jìn)行抽取、清洗、加上時(shí)間標(biāo)記并進(jìn)行合理的分類,以使之能夠進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)并支持OLAP. 二、數(shù)據(jù)倉(cāng)庫(kù)與ERP的關(guān)系 。ㄒ唬⿺(shù)據(jù)倉(cāng)庫(kù)之外的EPP應(yīng)用系統(tǒng) ERP環(huán)境將數(shù)據(jù)提供給數(shù)據(jù)倉(cāng)庫(kù)的接口與非ERP環(huán)境的接口是很相象的,但也有以下不同之處:①ERP接口只需要處理ERP所支持的DBMS技術(shù),而非ERP接口必須處理所有的接口技術(shù);②由于ERP供應(yīng)商擁有和控制著該接口,用戶能更好地把握構(gòu)成應(yīng)用程序環(huán)境的數(shù)據(jù)和結(jié)構(gòu);③該接口經(jīng)常需要進(jìn)入到ERP環(huán)境,找到正確的數(shù)據(jù)并把它們“粘”到-起以使得這些數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中是有用的。 。ǘ┙ㄔ煸贓RP內(nèi)部的數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)倉(cāng)庫(kù)可以建造在ERP環(huán)境之中,SAP的Bw和PeopleSoft的EPM就是如此。在這種情況下,ERP產(chǎn)品供應(yīng)商同時(shí)提供了應(yīng)用程序和數(shù)據(jù)倉(cāng)庫(kù)。其主要的優(yōu)點(diǎn)是ERP供應(yīng)商提供了邀個(gè)體系結(jié)構(gòu),這就節(jié)省了大量的設(shè)計(jì)工作,并且降低了設(shè)計(jì)和開(kāi)發(fā)的復(fù)雜程度。簡(jiǎn)而言之,將數(shù)據(jù)倉(cāng)庫(kù)包含在ERP應(yīng)用中極大地簡(jiǎn)化了數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)工作。此外,這種方式還降低了長(zhǎng)期維護(hù)的難度。 (三)通過(guò)ERP和非ERP系統(tǒng)為數(shù)據(jù)倉(cāng)庫(kù)提供數(shù)據(jù) 因?yàn)閷?shù)據(jù)倉(cāng)庫(kù)納入ERP應(yīng)用之后,客戶就有了完整的解決方案,因此這是一種常見(jiàn)的選擇。然而,也存在別的選擇,一個(gè)數(shù)據(jù)倉(cāng)庫(kù)可以建在ERP環(huán)境之外。同時(shí)非ERP系統(tǒng)也向該數(shù)據(jù)倉(cāng)庫(kù)提供數(shù)據(jù)。 由于存在非ERP數(shù)據(jù)和ERP數(shù)據(jù)的集成問(wèn)題,大多數(shù)企業(yè)并沒(méi)有一個(gè)完整的ERP環(huán)境。非ERP應(yīng)用系統(tǒng)總是存在的,在這種情況下,兩種類型的數(shù)據(jù)必須要集成在一起。企業(yè)經(jīng)常在構(gòu)建ERP環(huán)境的同時(shí)為他們的非ERP數(shù)據(jù)建立數(shù)據(jù)倉(cāng)庫(kù)。當(dāng)ERP環(huán)境完成時(shí)(或至少在功能上完成時(shí))。非ERP數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)也己經(jīng)建立。在需要將ERP數(shù)據(jù)放入數(shù)據(jù)倉(cāng)庫(kù)的時(shí)候,將ERP數(shù)據(jù)從ERP環(huán)境中取出移入數(shù)據(jù)倉(cāng)庫(kù)是一件簡(jiǎn)單的事情。 三、ERP數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)中的關(guān)鍵技術(shù) 。ㄒ唬⿺(shù)據(jù)的裝載 在數(shù)據(jù)裝載到數(shù)據(jù)倉(cāng)庫(kù)中時(shí)首先要定義良好的數(shù)據(jù)清洗規(guī)則,保證數(shù)據(jù)的質(zhì)量;其次對(duì)不同的功能要盡量做到模塊化,以提高模塊的重用性;再次,因?yàn)檠b載需要經(jīng)常進(jìn)行,數(shù)據(jù)可能會(huì)定期進(jìn)行抽取,所有要優(yōu)化裝載程序,提高裝載效率;最后不同的裝載程序要在不同的時(shí)間運(yùn)行, 因此要確定一個(gè)合理的數(shù)據(jù)抽取計(jì)劃。 。ǘ┚酆 數(shù)據(jù)從ERP系統(tǒng)抽取到目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)后,為了進(jìn)一步提高查詢系統(tǒng)性能,最大限度地減少查詢響應(yīng)時(shí)間,以便更好地服務(wù)與決策支持,在設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)時(shí),針對(duì)不同的用戶,不同的查詢要求。采用聚合設(shè)計(jì)導(dǎo)出了大量與聚合相對(duì)應(yīng)的實(shí)體化視圖,存儲(chǔ)匯總數(shù)據(jù),大大提高了易用性。但用戶的需求往往是不斷變化的,不可能預(yù)先定義所有的聚合,可以采用聚合導(dǎo)航器建立新的聚合。一旦新的聚合建立起來(lái),將會(huì)通知聚合管理器,并在數(shù)據(jù)庫(kù)管理系統(tǒng)范圍內(nèi)的匯總或全局表中注冊(cè),使可提供給用戶查詢使用。 (三)數(shù)據(jù)模型 數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)是從邏輯模型到物理模型的轉(zhuǎn)換過(guò)程,數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型主要有:星形模型和雪花模型兩種。一個(gè)簡(jiǎn)單的星形模式由一個(gè)事實(shí)表和多個(gè)維表組成。設(shè)計(jì)的方法簡(jiǎn)單,容易實(shí)現(xiàn),但不能表示數(shù)據(jù)的多維層次結(jié)構(gòu);而雪花形模式卻彌補(bǔ)了星形模式的不足,對(duì)維表進(jìn)行了擴(kuò)展,用添加子維表的方式來(lái)表示數(shù)據(jù)的維層次,使結(jié)構(gòu)清晰。在ERP系統(tǒng)中,很多數(shù)據(jù)集合的維具有復(fù)雜的層次結(jié)構(gòu),如時(shí)間維由屬性集合(年、季、月、星期、日)構(gòu)成。ERP數(shù)據(jù)倉(cāng)庫(kù)的第一層可以考慮采用星型模型,第二層可以考慮選擇雪花模型。這樣能更好地滿足不同層次的用戶的需要,表達(dá)數(shù)據(jù)的維層次結(jié)構(gòu)。 。ㄋ模┞(lián)機(jī)分析處理的數(shù)據(jù)清理和數(shù)據(jù)挖掘 由于訪問(wèn)ERP數(shù)據(jù)倉(cāng)庫(kù)的用戶分布于不同的部門和組織,主要通過(guò)Internet/Intranet訪問(wèn)信息,因此OLAP采用三層結(jié)構(gòu)模式。OLAP服務(wù)器用來(lái)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行多維化或預(yù)綜合處理,形成多維視圖,使用戶能從多角度、多側(cè)面、多層次地分析數(shù)據(jù),為具有明確查詢分析需求的用戶提供高性能的決策支持。 (五)數(shù)據(jù)挖掘 數(shù)據(jù)挖掘一般都是在數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上進(jìn)行的,從數(shù)據(jù)倉(cāng)庫(kù)中直接得到進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)有許多好處。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清理和數(shù)據(jù)挖掘的數(shù)據(jù)清理差不多,如果數(shù)據(jù)在導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)時(shí)已經(jīng)清理過(guò),在做數(shù)據(jù)挖掘的時(shí)候就沒(méi)有必要再清理了,而且所有的數(shù)據(jù)不一致的問(wèn)題都已經(jīng)被解決。這樣可以提高效率,節(jié)省挖掘數(shù)據(jù)所需要的時(shí)間。由于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)量大,直接在數(shù)據(jù)倉(cāng)庫(kù)上進(jìn)行挖掘,會(huì)影響挖掘的效率,因此數(shù)據(jù)的挖掘一般不在數(shù)據(jù)倉(cāng)庫(kù)上直接進(jìn)行,而是要單獨(dú)的建立數(shù)據(jù)挖掘庫(kù)。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘在ERP的應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1082056537.html