隨著數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)技術(shù)的不斷發(fā)展及數(shù)據(jù)庫(kù)管理系統(tǒng)的廣泛應(yīng)用,數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)量急劇增大。然而,如何有效地使用這些數(shù)據(jù)卻成為一個(gè)問題,因?yàn)橥菙?shù)據(jù)豐富而知識(shí)缺乏,人們目前所使用的數(shù)據(jù)庫(kù)技術(shù)無法將隱藏在數(shù)據(jù)背后的重要信息挖掘出來利用,所以如何迅速、準(zhǔn)確、有效且適量地提供用戶所需的信息,發(fā)現(xiàn)信息之間潛在的聯(lián)系,支持管理決策就是數(shù)據(jù)挖掘和數(shù)據(jù)倉(cāng)庫(kù)要解決的課題,同時(shí)也是客戶關(guān)系管理系統(tǒng)產(chǎn)生的必要條件和最終目的。
一、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)分析
1.1 數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)在企業(yè)管理和決策中面向主題的(Subject-Oriented)、集成的(Integrated)、反映歷史變化的(TimeVariant)、相對(duì)穩(wěn)定(Non-Volatile)的數(shù)據(jù)集合。我們可以從兩個(gè)層次加以理解:首先,數(shù)據(jù)倉(cāng)庫(kù)用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫(kù);其次,數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)一般不再修改。數(shù)據(jù)倉(cāng)庫(kù)不是靜態(tài)的概念,只有把信息及時(shí)交給需要這些信息的使用者,供他們做出改善其業(yè)務(wù)經(jīng)營(yíng)的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時(shí)提供給相應(yīng)的管理決策人員,是數(shù)據(jù)倉(cāng)庫(kù)的根本任務(wù)。因此,從產(chǎn)業(yè)界的角度看,數(shù)據(jù)倉(cāng)庫(kù)建設(shè)是一個(gè)工程,是一個(gè)過程。
整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是一個(gè)包含源個(gè)層次的體系結(jié)構(gòu),具體如下:
1、數(shù)據(jù)源:是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括存放于RDBMS中的各種業(yè)務(wù)處理數(shù)據(jù)和各類文檔數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場(chǎng)信息和競(jìng)爭(zhēng)對(duì)手的信息等。
2、數(shù)據(jù)的存儲(chǔ)與管理:是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心,數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù),同時(shí)也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉(cāng)庫(kù)的核心,則需要從數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)特點(diǎn)著手分析,針對(duì)現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行組織。
3、OLAP服務(wù)器:對(duì)分析需要的數(shù)據(jù)進(jìn)行有效集成,按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢(shì)。其具體實(shí)現(xiàn)可以分為:ROLAP、MOLAP和HOLAP。ROLAP 基本數(shù)據(jù)和聚合數(shù)據(jù)均存放在RDBMS 之中曰MOLAP 基本數(shù)據(jù)和聚合數(shù)據(jù)均存放于多維數(shù)據(jù)庫(kù)中曰HOLAP 基本數(shù)據(jù)存放于RDBMS 之中,聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫(kù)中。
4、前端工具:主要包括各種報(bào)表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對(duì)OLAP服務(wù)器,報(bào)表工具、數(shù)據(jù)挖掘工具主要針對(duì)數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)倉(cāng)庫(kù)要求數(shù)據(jù)量大,數(shù)據(jù)正確全面,所以數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)前必須經(jīng)過提取、轉(zhuǎn)換與集成,把數(shù)據(jù)按主題分類,形成多維數(shù)據(jù)模型。它以多維數(shù)據(jù)模型為基礎(chǔ),實(shí)現(xiàn)數(shù)據(jù)的分析處理,主要用于支持管理決策。數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)后,一般會(huì)被長(zhǎng)期保存,基本不會(huì)進(jìn)行修改和刪除操作,主要實(shí)現(xiàn)數(shù)據(jù)的查詢。
數(shù)據(jù)倉(cāng)庫(kù)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)不同,主要區(qū)別在于數(shù)據(jù)倉(cāng)庫(kù)打破了關(guān)系數(shù)據(jù)庫(kù)中數(shù)據(jù)的規(guī)范性,實(shí)現(xiàn)了數(shù)據(jù)的重組,增加了數(shù)據(jù)冗余度;其次傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)為了實(shí)現(xiàn)數(shù)據(jù)處理的及時(shí)性,要求數(shù)據(jù)盡量少,而數(shù)據(jù)倉(cāng)庫(kù)為了更有效的實(shí)現(xiàn)數(shù)據(jù)查詢,要求存儲(chǔ)的數(shù)據(jù)盡量多,實(shí)現(xiàn)海量存儲(chǔ)。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù),是近幾年國(guó)內(nèi)外迅速發(fā)展起來的一門交叉學(xué)科,涉及到數(shù)據(jù)庫(kù)、統(tǒng)計(jì)學(xué)、人工智能與機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域,并在金融、商業(yè)零售、電信以及生物醫(yī)學(xué)和基因分析等領(lǐng)域得到廣泛應(yīng)用。
1.2.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Ming),是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程,提取的知識(shí)一般可表示為概念(ConcePts)、規(guī)則(Rules)、規(guī)律(Regularities)、模式(Patterns)等形式。
數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的過程,是將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的整個(gè)過程。該過程包含一系列的步驟:確定業(yè)務(wù)對(duì)象、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、模式評(píng)估和知識(shí)表示。
1.2.2 數(shù)據(jù)挖掘的技術(shù)與方法
數(shù)據(jù)挖掘方法是以數(shù)據(jù)庫(kù)為對(duì)象,基于機(jī)器學(xué)習(xí)、科學(xué)計(jì)算、統(tǒng)計(jì)分析等技術(shù),形成了數(shù)據(jù)挖掘方法和技術(shù)。一般,數(shù)據(jù)挖掘常用的技術(shù)與方法可以分為以下幾個(gè)方面:
1)決策樹方法
決策樹方法是利用信息論的原理建立決策樹,主要用于分類和預(yù)測(cè)。決策樹是一種簡(jiǎn)單的知識(shí)表示方法,它將事例逐步分類成代表不同的類別。由于分類規(guī)則比較直觀,易于理解,實(shí)用效果好,影響較大,因而得到廣泛應(yīng)用。決策樹最早的算法是Quinlan 提出的ID3 算法,最流行的是其改進(jìn)版的C4.5 算法。
2)聚類方法
聚類分析是直接分析樣本,按照各樣本數(shù)據(jù)間的距離遠(yuǎn)近將樣本數(shù)據(jù)分成若干個(gè)不同的類。一般,同一類中的對(duì)象相似度很高,不同類中的對(duì)象相似度很差。聚類分析屬于無監(jiān)督的分類方法。
3)統(tǒng)計(jì)分析方法
統(tǒng)計(jì)分析方法是通過統(tǒng)計(jì)學(xué)中的技術(shù)方法實(shí)現(xiàn)數(shù)據(jù)庫(kù)的數(shù)據(jù)分析,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)系和規(guī)律。常用的方法有:回歸分析、相關(guān)分析、主成分分析等。
4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則通過對(duì)給定數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,描述一個(gè)事物中某些屬性頻繁同時(shí)出現(xiàn)的條件,發(fā)現(xiàn)隱藏在其中的有趣的聯(lián)系或規(guī)律。一旦建立起數(shù)據(jù)項(xiàng)間的關(guān)聯(lián)規(guī)則,則其中某一項(xiàng)的屬性值就可以依據(jù)其他屬性值進(jìn)行預(yù)測(cè)。
5)可視化技術(shù)
可視化數(shù)據(jù)分析技術(shù)在傳統(tǒng)圖表功能基礎(chǔ)上進(jìn)行了拓展,為用戶提供交互式的數(shù)據(jù)瀏覽,幫助用戶更清楚地剖析數(shù)據(jù)。當(dāng)所要識(shí)別的不規(guī)則事物是一系列圖形而不是數(shù)字表格時(shí),人的識(shí)別速度是最快的。
二、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用
2.1 客戶關(guān)系管理
客戶關(guān)系管理淵CRM冤關(guān)注的是企業(yè)與客戶之間實(shí)時(shí)、方便的信息交互,通過與客戶多渠道的接觸、交流和溝通,實(shí)現(xiàn)從野接觸管理冶到野客戶關(guān)懷冶的角色轉(zhuǎn)變,企業(yè)的經(jīng)營(yíng)中心也從產(chǎn)品或市場(chǎng)轉(zhuǎn)變?yōu)榭蛻簟?蛻絷P(guān)系管理最核心的任務(wù)是對(duì)企業(yè)運(yùn)營(yíng)過程中所得到的各種數(shù)據(jù)進(jìn)行分析,進(jìn)而為企業(yè)經(jīng)營(yíng)決策提供支持和依據(jù)。
從功能上來看,CRM系統(tǒng)可分為三種類型:
1)操作型CRM
操作型CRM 也稱為流程型CRM,主要用于客戶信息的自動(dòng)集成過程,實(shí)現(xiàn)企業(yè)各部門對(duì)客戶信息的協(xié)同合作。
2)分析型CRM
分析型CRM 用于分析操作型CRM 中產(chǎn)生的各種數(shù)據(jù),使用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)產(chǎn)生商務(wù)智能,為企業(yè)決策提供支持。
3)合作型CRM
合作型CRM用于企業(yè)與客戶的合作服務(wù)系統(tǒng),包括電話、呼叫系統(tǒng)、電子郵件等,它能實(shí)現(xiàn)客戶信息的全面收集。
2.2 數(shù)據(jù)倉(cāng)庫(kù)的形成
數(shù)據(jù)倉(cāng)庫(kù)是CRM 的中央存儲(chǔ)系統(tǒng)。在這個(gè)信息爆炸的時(shí)代,各個(gè)企業(yè)經(jīng)過長(zhǎng)期經(jīng)營(yíng),收集了大量的客戶數(shù)據(jù)。而這些海量、異構(gòu)的數(shù)據(jù)被分散在不同部門,沒有得到充分合理的利用。因此,首先要做的是對(duì)這些海量分散的數(shù)據(jù)進(jìn)行清洗、集成和轉(zhuǎn)換,建立一個(gè)整合的、標(biāo)準(zhǔn)化、結(jié)構(gòu)化的數(shù)據(jù)模型,形成全面、一致和面向決策的數(shù)據(jù),即數(shù)據(jù)倉(cāng)庫(kù)。對(duì)已形成的數(shù)據(jù)倉(cāng)庫(kù),按照不同的主題,產(chǎn)生多個(gè)對(duì)應(yīng)的數(shù)據(jù)處理模塊,如普通客戶數(shù)據(jù)模塊,Vip 客戶數(shù)據(jù)模塊,團(tuán)體客戶數(shù)據(jù)模塊等,這種多數(shù)據(jù)模塊的建設(shè)有利于分析不同客戶的行為特點(diǎn)。
2.3 數(shù)據(jù)挖掘技術(shù)的應(yīng)用
使用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)客戶信息進(jìn)行分析,從而挖掘出對(duì)企業(yè)發(fā)展有價(jià)值的信息,如:新客戶開發(fā)、交叉銷售及預(yù)測(cè)、客戶信用分析、客戶細(xì)分、客戶類別分析等客戶關(guān)系管理功能,為企業(yè)決策者提供更有效的的決策支持,最大程度地發(fā)揮企業(yè)CRM 的作用。近年來,隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,企業(yè)要想獲得一個(gè)新客戶,所花費(fèi)的開銷往往是爭(zhēng)取留住老客戶的幾倍。有統(tǒng)計(jì)數(shù)據(jù)表明:
1)公司一般每年平均流失10%的老客戶;
2)企業(yè)留住5%的老客戶,利潤(rùn)提升100%;
3)開發(fā)新客戶的成本是留住老客戶成本的5-8 倍;
4)一個(gè)公司如果將其客戶流失率降低5%,其利潤(rùn)就可能增加25-85%。
因此保持老客戶就顯得更有價(jià)值。那么,如何才能預(yù)防、減少客戶的流失呢?一個(gè)非常重要的工作就是要找出顧客流失的原因。我們可以通過數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)這一目標(biāo)。
現(xiàn)以電信公司判斷用戶離網(wǎng)的可能性來做分析,首先進(jìn)行數(shù)據(jù)準(zhǔn)備,抽取一定量的用戶信息,提取的信息主要包括:用戶號(hào)碼、用戶類型、用戶狀態(tài)、話費(fèi)性質(zhì)(長(zhǎng)話/市話)、欠費(fèi)情況、投訴次數(shù)等,利用這些數(shù)據(jù),我們來建立判斷用戶離網(wǎng)可能性的模型。
在數(shù)據(jù)準(zhǔn)備和適當(dāng)?shù)念A(yù)處理之后,我們采用決策樹中的C4.5算法建立決策樹模型。這里,我們引入了信息論中的信息增益率的概念并以此作為屬性選擇的標(biāo)準(zhǔn),其核心是在決策樹的各級(jí)節(jié)點(diǎn)上選擇屬性時(shí)用信息增益率作為屬性選擇標(biāo)準(zhǔn)。通過計(jì)算這些屬性的信息增益率,找出野投訴次數(shù)冶屬性作為決策樹的根節(jié)點(diǎn)。擴(kuò)展決策樹節(jié)點(diǎn),進(jìn)行分枝,其他中間節(jié)點(diǎn)也是選擇各節(jié)點(diǎn)檢測(cè)屬性增益最大的屬性,同級(jí)的預(yù)選屬性的增益相同時(shí),規(guī)定選擇屬性值個(gè)數(shù)較少的屬性作為當(dāng)前節(jié)點(diǎn)的分枝,最后,我們可以生成一棵決策樹。生成的決策樹還需要進(jìn)行進(jìn)一步驗(yàn)證,才能最終得到可用的分類模型。選擇一些具有共同特征的已離網(wǎng)用戶作為測(cè)試數(shù)據(jù),輸入屬性值進(jìn)行離網(wǎng)判斷,檢驗(yàn)?zāi)P偷恼_性,生成最終的決策樹模型。使用生成的決策樹模型,對(duì)比用戶的信息是否貼近離網(wǎng)用戶的特征屬性值,能大致預(yù)測(cè)出該用戶的離網(wǎng)可能性,對(duì)離網(wǎng)可能性高的用戶,根據(jù)其特征屬性進(jìn)行挽留工作,從而預(yù)防、減少客戶的流失。
三、結(jié)束語
在企業(yè)客戶關(guān)系管理系統(tǒng)中有效利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù),可以為企業(yè)高層決策者提供準(zhǔn)確的客戶分類、忠誠(chéng)度、贏利能力及潛在用戶等有用信息,指導(dǎo)他們制訂最優(yōu)的企業(yè)營(yíng)銷策略、降低銀行運(yùn)營(yíng)成本、增加利潤(rùn),加速企業(yè)的發(fā)展。相信未來會(huì)有更多的行業(yè)加入使用客戶關(guān)系管理的行列中,通過數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)挖掘出對(duì)自身發(fā)展有用的信息,也必使客戶關(guān)系管理的目標(biāo)得到更好的實(shí)現(xiàn)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:論企業(yè)客戶關(guān)系管理系統(tǒng)CRM/ERP中數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的作用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1082069184.html