| 當(dāng)前位置：拓步ERP資訊網(wǎng) >>管理咨詢 >>ERP原理知識 >>ERP基礎(chǔ)知識

談商業(yè)智能(BI)系統(tǒng)中數(shù)據(jù)的理解與處理

發(fā)布日期：2012-10-29 10:09:38 來源：www.ezxoed.cn 編輯：拓步ERP資訊網(wǎng) 瀏覽：評論

摘要：商業(yè)智能(BI)主要實現(xiàn)將來自不同企業(yè)運作系統(tǒng)的數(shù)據(jù)轉(zhuǎn)換為企業(yè)決策信息的過程。數(shù)據(jù)預(yù)處理是整合企業(yè)原始數(shù)據(jù)的第一步，它包括數(shù)據(jù)的抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(Load)三個過程(即ETL過程)；建立數(shù)據(jù)倉庫則是處理海量數(shù)據(jù)的基礎(chǔ)；數(shù)據(jù)分析是體現(xiàn)系統(tǒng)智能的關(guān)鍵。數(shù)據(jù)挖掘的目標(biāo)則是挖掘數(shù)據(jù)背后隱藏的知識，通過關(guān)聯(lián)分析、聚類和分類等方法建立分析模型，預(yù)測企業(yè)未來發(fā)展趨勢和將要面臨的問題。 原標(biāo)題：談商業(yè)智能(BI)系統(tǒng)中數(shù)據(jù)的理解與處理 原作者：發(fā)表時間：2012/10/29 余明毅來源：萬方數(shù)據(jù)

1．引言

商業(yè)智能(Business Intelligence，BI)的概念最早于1996年由加特納集團(Gartner Group)提出，并對商業(yè)智能做如下的定義：商業(yè)智能描述了一系列的概念和方法，輔助商業(yè)決策的制定是通過基于事實的支持系統(tǒng)所提供的，商業(yè)智能技術(shù)為企業(yè)迅速分析數(shù)據(jù)提供技術(shù)和方法，包括收集、管理和分析數(shù)據(jù)，并將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息，然后分發(fā)到企業(yè)各處。

2．商業(yè)智能(B1)系統(tǒng)中數(shù)據(jù)的理解與處理

2.1 數(shù)據(jù)抽取(ETL)技術(shù)

商業(yè)智能可以看成是一種解決方案。關(guān)鍵在于從許多來自不同的企業(yè)運作系統(tǒng)的數(shù)據(jù)中提取出有用的數(shù)據(jù)并進行清理，以保證數(shù)據(jù)的正確性，然后經(jīng)過抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(LOAd)，即ETL過程，合并到一個企業(yè)級的數(shù)據(jù)倉庫里，從而得到企業(yè)數(shù)據(jù)的一個全局視圖，在此基礎(chǔ)上利用合適的查詢和分析工具、數(shù)據(jù)挖掘工具、OLAP工具等對其進行分析和處理，最后將知識呈現(xiàn)給管理者，為管理者的決策過程提供支持。從BI的技術(shù)框架圖中，可以看出整個BI系統(tǒng)中，涉及數(shù)據(jù)處理的關(guān)鍵是數(shù)據(jù)源到數(shù)據(jù)倉庫中的ETL部分，ETL過程的成功與否決定了數(shù)據(jù)倉庫數(shù)據(jù)的正確性和可用性。

數(shù)據(jù)抽取(ETL，data extraction，transformation and loading)，是對數(shù)據(jù)進行抽取、清洗、轉(zhuǎn)換和整合的過程，是數(shù)據(jù)進入數(shù)據(jù)倉庫的入口。通過ETL的過程，數(shù)據(jù)從聯(lián)機事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機的數(shù)據(jù)存儲介質(zhì)中導(dǎo)入到數(shù)據(jù)倉庫。

在數(shù)據(jù)抽取階段以下幾點值得注意：

2.1.1 數(shù)據(jù)的有效性檢查

為避免數(shù)據(jù)冗余，要認識到數(shù)據(jù)裝入數(shù)據(jù)倉庫之前，應(yīng)該對數(shù)據(jù)進行有效性檢查，這是很重要的。如果沒有進行數(shù)據(jù)的有效性檢查，就有可能破壞依賴于數(shù)據(jù)倉庫的商務(wù)分析的完整性，幫助檢查數(shù)據(jù)的有效性的最好方法是源系統(tǒng)專家。源系統(tǒng)專家包括具有技術(shù)專業(yè)知識和非技術(shù)知識的人士。

2.1.2 數(shù)據(jù)的清洗和轉(zhuǎn)換

由于數(shù)據(jù)抽取中的數(shù)據(jù)是來源于業(yè)務(wù)系統(tǒng)中的業(yè)務(wù)數(shù)據(jù)，難免會存在各種原因所導(dǎo)致的臟數(shù)據(jù)，例如數(shù)據(jù)不在給定的界限之內(nèi)或?qū)τ趯嶋H業(yè)務(wù)來說毫無意義的數(shù)據(jù)。這些數(shù)據(jù)就是數(shù)據(jù)清洗的對象。清除數(shù)據(jù)包括對那些在給定范圍之外的數(shù)據(jù)采取糾正和舍去等措施。

同樣，由于數(shù)據(jù)倉庫中的數(shù)據(jù)來自于多種業(yè)務(wù)數(shù)據(jù)源，這些數(shù)據(jù)源可能是在不同的硬件平臺上，使用不同的操作系統(tǒng)的，又或者是屬于不同的業(yè)務(wù)系統(tǒng)。因而這些數(shù)據(jù)的存儲格式各不相同，或者相同的數(shù)據(jù)具有不同業(yè)務(wù)含義。而數(shù)據(jù)的轉(zhuǎn)換正是為了解決這一問題而必須進行的數(shù)據(jù)抽取步驟。

2.1.3 數(shù)據(jù)的聚合與分割

由于數(shù)據(jù)倉庫中數(shù)據(jù)的來源是不同的業(yè)務(wù)系統(tǒng)數(shù)據(jù)，而各個系統(tǒng)對數(shù)據(jù)存儲的粒度(粒度是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細化或綜合程度的級別)各不相同。而數(shù)據(jù)倉庫中同一分析主題中數(shù)據(jù)的粒度必須是統(tǒng)一的，所以，為了保證數(shù)據(jù)粒度的一致性，必須對原有數(shù)據(jù)進行聚合(匯總)或分割(細化)。

2.1.4 數(shù)據(jù)安全性

數(shù)據(jù)的抽取必非一個完全的技術(shù)問題，往往牽涉整個企業(yè)中各個不同部門中數(shù)據(jù)的共享。那么數(shù)據(jù)共享中的權(quán)限等安全問題也就是數(shù)據(jù)抽取中必須要認真對待的問題。如何保證數(shù)據(jù)抽取中和數(shù)據(jù)集中后的限制與共享往往需要業(yè)務(wù)人員的配合和介入，不能將該問題當(dāng)作單純的技術(shù)問題來對待，而必須進行周密的考慮和計劃。

2.2 ETL轉(zhuǎn)換過程中的數(shù)據(jù)處理

ETL過程最復(fù)雜的部分就是T，這個轉(zhuǎn)換過程從對數(shù)據(jù)源的整個宏觀處理可分：

2.2.1 大表和小表關(guān)聯(lián)

這種處理在數(shù)據(jù)清洗過程是很常見的，例如從數(shù)據(jù)源到ODS階段，如果數(shù)據(jù)倉庫采用維度建模，而且維度基本采用代理鍵的話，必然存在代碼到此鍵值的轉(zhuǎn)換。如果用SQL實現(xiàn)，必然需要將一個大表和一堆小表都Join起來，當(dāng)然如果使用ETL工具的話，一般都是先將小表讀入內(nèi)存中再處理。這種情況，輸出數(shù)據(jù)的粒度和大表一樣。

2.2.2 大表和大表關(guān)聯(lián)

大表之間的關(guān)聯(lián)存在最大的問題就是性能和穩(wěn)定性，對于海量數(shù)據(jù)來說，必須有優(yōu)化的方法來處理他們的關(guān)聯(lián)，另外，對于大數(shù)據(jù)的處理無疑會占用太多的系統(tǒng)資源，出錯的幾率非常大，如何做到有效錯誤恢復(fù)也是個問題。對于這種情況，盡量將大表拆分成適度的稍小一點的表，形成大小交的類型。這類情況的輸出數(shù)據(jù)粒度和主表一樣。

2.2.3 聚集

數(shù)據(jù)倉庫中重要的任務(wù)就是沉淀數(shù)據(jù)，聚集是必不可少的操作，它是粗化數(shù)據(jù)粒度的過程。聚集本身其實很簡單，就是類似SQL中Group by的操作，選取特定字段(維度)，對度量字段再使用某種聚集函數(shù)。但是對于大數(shù)據(jù)量情況下，聚集算法的優(yōu)化仍是探究的一個課題。

3．結(jié)語

數(shù)據(jù)抽取(ETL)技術(shù)是商業(yè)智能的四大關(guān)鍵技術(shù)之一，ETL技術(shù)是商業(yè)智能得以實施的一個基礎(chǔ)性的技術(shù)，它與元數(shù)據(jù)管理相結(jié)合，提供對不同數(shù)據(jù)源的數(shù)據(jù)進行抽取，轉(zhuǎn)換，清洗，加載的功能，集成和凈化來自于多個不同系統(tǒng)的數(shù)據(jù)，然后將之載入物理數(shù)據(jù)庫中。限于多方面的原因，本文在數(shù)據(jù)的理解與處理方面未能詳盡的說明，希望能和同行一起共同探討。

核心關(guān)注：拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用，蘊涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務(wù)管理理念，功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理，全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域，是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。

轉(zhuǎn)載請注明出處：拓步ERP資訊網(wǎng)http://www.ezxoed.cn/

本文標(biāo)題：談商業(yè)智能(BI)系統(tǒng)中數(shù)據(jù)的理解與處理

本文網(wǎng)址：http://www.ezxoed.cn/html/consultation/1082064826.html

關(guān)鍵詞標(biāo)簽： 談商業(yè)智能(BI)系統(tǒng)中數(shù)據(jù)的理解與處理,商業(yè)智能數(shù)據(jù)抽取技術(shù) ETL過程,ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進銷存軟件,財務(wù)軟件,倉庫管理軟件,生產(chǎn)管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費ERP,免費ERP軟件,免費ERP系統(tǒng),ERP軟件免費下載,ERP系統(tǒng)免費下載,免費ERP軟件下載,免費進銷存軟件,免費進銷存,免費財務(wù)軟件,免費倉庫管理軟件,免費下載,

本文轉(zhuǎn)自：e-works制造業(yè)信息化門戶網(wǎng)

本文來源于互聯(lián)網(wǎng)，拓步ERP資訊網(wǎng)本著傳播知識、有益學(xué)習(xí)和研究的目的進行的轉(zhuǎn)載，為網(wǎng)友免費提供，并盡力標(biāo)明作者與出處，如有著作權(quán)人或出版方提出異議，本站將立即刪除。如果您對文章轉(zhuǎn)載有任何疑問請告之我們，以便我們及時糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇：項目經(jīng)理在ERP整體管理中的作用

下一篇：企業(yè)實施ERP難點在哪里

相關(guān)文章

管理咨詢

拓步ERP系統(tǒng)軟件平臺11.5專業(yè)版v10.1.2...

拓步ERP系統(tǒng)軟件平臺11.5標(biāo)..

金蝶KIS財務(wù)軟件標(biāo)準(zhǔn)版V8.1..

金蝶KIS財務(wù)軟件迷你版V8.1..

金蝶KIS工業(yè)貿(mào)易專業(yè)版V12...

SQL2000 4in1 ISO..

MSDE2000 SP4 簡體中..

金蝶KIS商貿(mào)高級版V4.0|破..

金蝶KIS財務(wù)軟件行政事業(yè)版V9..

金蝶KIS零售版V4.1|破解版..

熱門培訓(xùn)視頻

拓步ERP系統(tǒng)平臺庫存管理系統(tǒng)培訓(xùn)視頻教材

拓步ERP系統(tǒng)平臺客戶端安裝培訓(xùn)..

拓步ERP財務(wù)管理系統(tǒng)培訓(xùn)視頻

拓步ERP系統(tǒng)平臺數(shù)據(jù)庫安裝培訓(xùn)..

拓步ERP系統(tǒng)平臺通用操作培訓(xùn)視..

拓步ERP系統(tǒng)平臺采購管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺考勤管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務(wù)報表系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務(wù)總帳系統(tǒng)培..

拓步ERP系統(tǒng)平臺應(yīng)收帳款系統(tǒng)培..

熱門電子圖書

拓步ERP財務(wù)管理系統(tǒng)電子圖書

熱門管理軟件

拓步ERP系統(tǒng)管理軟件介紹

拓步ERP平臺系列旗艦版

拓步ERP生產(chǎn)系列標(biāo)準(zhǔn)版（進銷存..

拓步ERP業(yè)務(wù)系列倉存版（倉庫管..

拓步ERP平臺系列標(biāo)準(zhǔn)版

拓步ERP財務(wù)系列迷你版（財務(wù)管..

拓步ERP條碼系列業(yè)務(wù)標(biāo)準(zhǔn)版（條..

拓步ERP平臺系列企業(yè)版

拓步ERP平臺系列專業(yè)版

拓步ERP行業(yè)系列電子行業(yè)版


	ERP新聞動態(tài) 拓步新聞行業(yè)新聞關(guān)注產(chǎn)品觀點縱橫企業(yè)管理企業(yè)應(yīng)用

	ERP解決方案按ERP應(yīng)用行業(yè)分類按ERP企業(yè)規(guī)模分類按ERP管理領(lǐng)域分類按ERP軟件功能分類按ERP系統(tǒng)特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風(fēng)險分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標(biāo) ERP實施監(jiān)理 ERP評審驗收 ERP績效評價 ERP基礎(chǔ)知識 ERP課程培訓(xùn) ERP培訓(xùn)教育 ERP視頻教材

	CIO技術(shù)專欄 CIO企業(yè)應(yīng)用 CIO網(wǎng)絡(luò)通信 CIO信息安全 CIO基礎(chǔ)設(shè)施 CIO云計算

	ERP技術(shù)支持技術(shù)支持知識庫常見問題資料庫在線學(xué)習(xí)資料庫日常辦公資料庫企業(yè)管理知識庫

	ERP系統(tǒng)價格拓步ERP系統(tǒng)價格體系拓步EIS軟件價格體系合作品牌ERP價格體系技術(shù)支持服務(wù)價格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數(shù)碼Digital 速達SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術(shù)支持快速搜索ERP軟件資訊

	關(guān)于拓步公司介紹公司愿景企業(yè)文化誠聘英才聯(lián)系我們在線留言在線訂購意向下載體驗登記

2021色婷婷综合久久久_国产亚洲午夜高清国产亚洲_亚洲开心婷婷中文字幕_亚洲国产中文精品字幕第一页_国产综合免费视频

ERP顧問咨詢

ERP原理知識

ERP基礎(chǔ)知識

ERP課程培訓(xùn)

ERP實施培訓(xùn)

CIO技術(shù)專欄

即時聯(lián)系

服務(wù)熱線

快捷互動

猜您喜歡