0 前言
隨著以計算機為主的信息技術的發(fā)展,煤炭企業(yè)的數(shù)據(jù)量越積越多,但其中能為企業(yè)管理者有用的信息并不多,這里的有用的信息主要是能為企業(yè)決策者提供依據(jù)或提供參考的信息。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、甚至是隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。它可以按照企業(yè)的管理目標,對企業(yè)的大量數(shù)據(jù)進行分析和處理,挖掘其中隱藏的、未知的規(guī)則和信息,并進一步將其模型化,然后將分析結果用于管理決策,提高企業(yè)管理者的決策能力和決策水平,進而提高企業(yè)管理者的管理效率和企業(yè)的經濟效益。
目前,許多企業(yè)都廣泛采用了ERP軟件系統(tǒng),但由于ERP軟件本身功能的不足,有的只能提供基本的數(shù)據(jù)查詢和分析。有的缺乏對高層次的數(shù)據(jù)分析和決策行為的支持,這就需要通過數(shù)據(jù)挖掘技術在ERP中的應用來改善現(xiàn)有ERP系統(tǒng)。
1 數(shù)據(jù)挖掘技術
1.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘,在人工智能領域,習慣上又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個基本步驟。知識發(fā)現(xiàn)過程由以下3個階段組成:(1)數(shù)據(jù)準備;(2)數(shù)據(jù)挖掘;(3)結果表達和解釋。數(shù)據(jù)挖掘可以與用戶或知識庫交互。典型數(shù)據(jù)挖掘系統(tǒng)的結構如圖1所示。
圖1 典型的數(shù)據(jù)挖掘系統(tǒng)的結構
并非所有的信息發(fā)現(xiàn)任務都被視為數(shù)據(jù)挖掘。例如,使用數(shù)據(jù)庫管理系統(tǒng)查找個別的記錄,或通過因特網的搜索引擎查找特定的Web頁面.則是信息檢索(information retrieval)領域的任務。雖然這些任務是鶯要的。可能涉及使用復雜的算法和數(shù)據(jù)結構,但是它們主要依賴傳統(tǒng)的計算機科學技術和數(shù)據(jù)的明顯特征來創(chuàng)建索引結構,從而有效地組織和檢索信息。盡管如此.數(shù)據(jù)挖掘技術也已用來增強信息檢索系統(tǒng)的能力。
1.2 數(shù)據(jù)挖掘的過程
一般而言,數(shù)據(jù)挖掘的過程中各步驟的大體內容如圖2:
圖2數(shù)據(jù)挖掘過程圖
第1步確定挖掘對象
清晰地定義出主題業(yè)務,明確數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的首要步驟,挖掘的最后結構是不可預測的,但要探索的問題應是具有預見性的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會成功的。
第2步挖掘前的準備
(1)數(shù)據(jù)選擇
搜索所有與業(yè)務對象有關的內部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應用的數(shù)據(jù)。
(2)數(shù)據(jù)預處理
研究等挖掘數(shù)據(jù)的質量,為進一步的分析做準備,并確定將要進行的挖掘操作的類型。
(3)數(shù)據(jù)轉換
將待挖掘數(shù)據(jù)轉換成一個分析模型。這個分析模型是針對某種或某幾種挖掘算法建立的,建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關鍵。
第3步數(shù)據(jù)挖掘
對所得到的經過轉換的數(shù)據(jù)進行挖掘。除了完善從中選擇合適的挖掘算法外,其余一切工作都應該可以自動地完成。
第4步數(shù)據(jù)結果分析
解釋并評估分析結果,其使用的分析方法一般應依數(shù)據(jù)挖掘操作而定,通常情況下可能會用到可視化技術。
第5步知識的同化
將數(shù)據(jù)分析所得到的知識集成到業(yè)務信息系統(tǒng)的組織結構中去。
2 煤炭企業(yè)ERP的功能分析
企業(yè)資源計劃(EntERPrise Resource Planning,ERP)是建立在以計算機為主的信息技術基礎上,利用現(xiàn)代企業(yè)的先進管理思想,全面集成企業(yè)各種資源信息,為企業(yè)提供計劃、組織、控制和決策等方面的全方位和系統(tǒng)化的管理平臺。煤炭企業(yè)ERP涉及煤炭企業(yè)的采購管理、生產管理、銷售管理、物流管理、財務管理以及人力資源管理等各個方面的管理問題。
中國煤炭企業(yè)經過多年的努力,企業(yè)信息基礎設施建設已經具備一定規(guī)模,在信息建設和資源管理等方面,計算機設備和計算機應用水平處于國內領先地位。煤炭企業(yè)高層已經意識到了以計算機為主的信息技術的是企業(yè)行業(yè)領域的發(fā)展趨勢,煤炭企業(yè)會計信息系統(tǒng)逐步從核算型過渡到財務管理型,適應ERP企業(yè)的管理模式,具有財務分析和領導決策功能,覆蓋整個財務、采購、銷售等工作范圍,成為ERP和電子商務系統(tǒng)的核心系統(tǒng)。
但是在煤炭企業(yè)ERP實施當中,隨著ERP軟件系統(tǒng)積累的數(shù)據(jù)不斷增加,數(shù)據(jù)管理相對落后的問題已隨之出現(xiàn)。傳統(tǒng)的數(shù)據(jù)分析和處理方法(如查詢、報表)根本無法快速、有效地從大量數(shù)據(jù)中獲取所需的數(shù)據(jù),煤炭企業(yè)ERP系統(tǒng)自身也缺乏高層次的數(shù)據(jù)分析和決策支持手段,只能提供較為簡單的數(shù)據(jù)顯示和數(shù)據(jù)查詢,企業(yè)管理決策者們無法從龐大的業(yè)務數(shù)據(jù)中獲取隱藏的知識,這就使得數(shù)據(jù)挖掘技術在煤炭企業(yè)ERP的數(shù)據(jù)分析和處理中有廣泛的應用空間。
3 數(shù)據(jù)挖掘在煤炭企業(yè)ERP中的應用實例
為了證實基于數(shù)據(jù)挖掘技術的煤炭企業(yè)ERP的應用的可行性和有效性,通過下面相關實驗進行說明。通過對近年來中國部分煤炭企業(yè)ERP系統(tǒng)數(shù)據(jù)庫的查詢,得到了2006~2010年煤炭企業(yè)營業(yè)額的相關數(shù)據(jù)(見表1),利用數(shù)據(jù)挖掘進行未來3a的營業(yè)額數(shù)據(jù)預測。
表1 2006-2010年中國部分煤炭企業(yè)營業(yè)額單位:億元
預測方法采用灰色預測模型GM(1,1);疑碚摰奈⒎址匠棠P头Q為GM模型(Grey Model)。模型是將原始數(shù)據(jù)列作生成處理后建立模型方程。GM(1,1)表示1階1個變量的微分方程模型模型。
建模的步驟如下:
(1)由原始數(shù)列x(0) ,計算累加生成數(shù)列x(1) 。
(2)對x(1) ,采用最上二乘法按下式確定模型參數(shù):
(3)建立預測模型,求出累加序列:
計算之后,可得預測結果,如表2所示。
表2中國部分煤炭企業(yè)營業(yè)額預測值單位:億元
實驗結果表明,GM模型預測精度較高,這說明單變量灰色預測在煤炭企業(yè)銷售最預測中是可行的,其分析結果對于煤炭銷售策略的制定、市場細分、目標客戶群的確定具有一定的參考價值。
4 結語
煤炭企業(yè)與標準的制造業(yè)相比,具有很多不同的特點,研究煤炭企業(yè)實施ERP的可行性和解決方案具有很強的理論和實際意義。文中通過對煤炭企業(yè)各種數(shù)據(jù)深入分析,探索數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術在ERP企業(yè)中的應用模式,建立基于數(shù)據(jù)挖掘技術的煤炭企業(yè)ERP系統(tǒng),從而提高煤炭企業(yè)ERP系統(tǒng)的決策功能,真正做到運用數(shù)據(jù)挖掘等信息技術改造傳統(tǒng)的煤炭企業(yè),優(yōu)化企業(yè)資源,提高決策分析水平,增強綜合競爭力。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/