隨著時(shí)代的進(jìn)步,社會(huì)主義的蓬勃發(fā)展,我國(guó)的市場(chǎng)經(jīng)濟(jì)體制已經(jīng)逐步形成了,國(guó)內(nèi)的電信行業(yè)的市場(chǎng)環(huán)境已經(jīng)發(fā)展得越來(lái)越合理了,但是,還應(yīng)該看到的是,發(fā)展是一把雙刃劍,國(guó)內(nèi)的電信市場(chǎng)競(jìng)爭(zhēng)也因此變得越來(lái)越劇烈了,而更重要的是,隨著世界經(jīng)濟(jì)的全球化進(jìn)程以及市場(chǎng)的國(guó)際化,我國(guó)還加入了世界貿(mào)易組織。這就在一定程度上要求我國(guó)的電信企業(yè)在經(jīng)營(yíng)管理等各個(gè)方面能夠和國(guó)際接軌,趕超國(guó)際水平,在國(guó)際化競(jìng)爭(zhēng)中脫穎而出,才能實(shí)現(xiàn)我國(guó)的更有力的進(jìn)步,向著強(qiáng)國(guó)富國(guó)的中國(guó)夢(mèng)前進(jìn)。眾所周知的是,我國(guó)傳統(tǒng)的電信企業(yè)在以前都僅僅是以產(chǎn)品為核心,與此同時(shí)盡量控制成本的運(yùn)營(yíng)模式的,而在經(jīng)營(yíng)模式方面,也只是以銷售地點(diǎn)、柜臺(tái)式服務(wù)以及產(chǎn)品和價(jià)格為主要著力點(diǎn),在當(dāng)今的時(shí)代要求下,我國(guó)的電信企業(yè)必須要向著以客戶和市場(chǎng)為中心的轉(zhuǎn)變,更要在客戶的消費(fèi)心理和價(jià)值取向方面做一番功夫的研究,才能在世界市場(chǎng)的競(jìng)爭(zhēng)中立于不敗之地。而本文要說(shuō)的決策樹的數(shù)據(jù)挖掘(也就是DM)在電信企業(yè)中的有效應(yīng)用。
一、在電信CRM 中使用數(shù)據(jù)挖掘的重要意義
眾所周知的是,隨著社會(huì)主義的發(fā)展,人民生活水平的提高,電信業(yè)務(wù)也迅猛地增長(zhǎng),而在激增的數(shù)據(jù)背后,卻隱藏著越來(lái)越重要的數(shù)據(jù)信息,最后隨著數(shù)據(jù)的累積,乃至出現(xiàn)了“數(shù)據(jù)豐富知識(shí)貧乏”的現(xiàn)象,也就是說(shuō),數(shù)據(jù)分析技術(shù)的發(fā)展,跟不上數(shù)據(jù)分析復(fù)雜度的需要。經(jīng)過(guò)幾代人的努力,決策樹的數(shù)據(jù)挖掘技術(shù)就在此時(shí)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘技術(shù)和傳統(tǒng)的數(shù)據(jù)分析有著很大的區(qū)別。
首先,數(shù)據(jù)挖掘技術(shù)在挖掘信息之前沒(méi)有任何假設(shè)的環(huán)節(jié),在這樣的情況下所發(fā)現(xiàn)的知識(shí)和信息,具有有效性、實(shí)用性以及事先未知性的特點(diǎn)。因此理所當(dāng)然地,在CRM 中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以為客戶數(shù)據(jù)分析提供更有效的決策支持。
另一方面,還應(yīng)指出的是,現(xiàn)存的數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)其實(shí)更適合于做數(shù)據(jù)的挖掘,甚至可以做比數(shù)據(jù)挖掘提供的數(shù)據(jù)更加細(xì)的數(shù)據(jù),還可以對(duì)事務(wù)的、文本的、空間的甚至是多媒體的數(shù)據(jù)進(jìn)行分析。
二、決策樹挖掘模型的建立
數(shù)據(jù)的準(zhǔn)備、模型的建立、模型驗(yàn)證以及模型評(píng)價(jià)是數(shù)據(jù)挖掘一般情況下的步驟。
首先,數(shù)據(jù)準(zhǔn)備就包括對(duì)數(shù)據(jù)進(jìn)行取樣、特征探索、分析以及預(yù)處理。
其次,可以看出的是,建立模型是一個(gè)反復(fù)不斷的過(guò)程,所挖掘的類型和模型的類型應(yīng)該是一樣的。
另外,決策樹、神經(jīng)網(wǎng)絡(luò)、時(shí)間序列分析以及數(shù)理統(tǒng)計(jì)分析等方面都可以成為模型類型。
最后,模型的驗(yàn)證以及評(píng)價(jià)則是主要通過(guò)對(duì)結(jié)果和模式或者模型的分析和驗(yàn)證來(lái)達(dá)到評(píng)價(jià)模型是否對(duì)決策支持信息有價(jià)值的目的。不然的話就要建立新的模型。
一旦建立了模型并且也通過(guò)了驗(yàn)證,那么在實(shí)施模型上可以使用兩種方法:
第一,把該模型提供給分析或者業(yè)務(wù)人員做參考,并盡量進(jìn)行全程的察看和分析,然后對(duì)該模型提出行動(dòng)方案或者建議;
第二,把該模型運(yùn)用到不同的數(shù)據(jù)集上。
本文主要是對(duì)電信的CRM 數(shù)據(jù)里不同種類的客戶進(jìn)行一個(gè)簡(jiǎn)單的分類,并且對(duì)客戶的類型進(jìn)行一個(gè)簡(jiǎn)單的預(yù)測(cè)。而以下則是主要對(duì)“客戶流失”的類型進(jìn)行一個(gè)簡(jiǎn)單的分析,從而達(dá)到對(duì)建立決策樹挖掘模型的過(guò)程進(jìn)行一個(gè)簡(jiǎn)單的論述。
(一)分析決策樹應(yīng)用
在電信的CRM 數(shù)據(jù)中,主要是以客戶的年齡、所在的城市以及性別為依據(jù)對(duì)客戶進(jìn)行簡(jiǎn)單的分類,而在該分類的基礎(chǔ)上對(duì)客戶的類型進(jìn)行預(yù)測(cè),進(jìn)而可以爭(zhēng)取更多的新用戶,與此同時(shí)還要過(guò)濾掉一大批已經(jīng)沒(méi)有什么發(fā)展?jié)摿Φ挠脩,要達(dá)到這樣的一個(gè)目的,可以說(shuō),決策樹是比較直觀易懂的,在設(shè)計(jì)分類模型的時(shí)候,可以運(yùn)用決策樹的算法來(lái)進(jìn)行,與此同時(shí)還需要做的工作就是要提取該分類中隱藏的規(guī)則,在這種情況下,就能對(duì)客戶類型進(jìn)行預(yù)測(cè)。因此,顯而易見的是,客戶類型就是決策樹要挖掘的目標(biāo)。
(二)選擇決策樹的構(gòu)造算法
決策樹構(gòu)造的最原始的算法應(yīng)該是ID3 算法,這種算法僅僅能處理內(nèi)存里面的數(shù)據(jù),有著很弱的可伸縮性,而值得慶幸的是,當(dāng)下的決策樹的構(gòu)造算法有好多種,并且也不再是僅僅能在內(nèi)存中處理,還能處理內(nèi)存以外的數(shù)據(jù),包括處理離散和連續(xù)的屬性值,不僅如此,這些算法的處理速度也實(shí)現(xiàn)了大大的提高,因此,這些構(gòu)造算法具有很強(qiáng)的實(shí)用性。而SLIQ 算法和SPRINT 算法就是其中的兩種。
(三)決策樹的工作過(guò)程
一般情況下,決策樹的工作過(guò)程是:在構(gòu)造決策樹的時(shí)候,使用一個(gè)帶有類標(biāo)記的訓(xùn)練數(shù)據(jù)集,接著還使用另外的一個(gè)測(cè)試數(shù)據(jù)集來(lái)檢驗(yàn)所生成的決策樹是否正確,如果該決策樹具有足夠高的正確性的話,就可以使用該決策樹去預(yù)測(cè)未知類型的數(shù)據(jù)類型。需要指出的是,一般情況下某個(gè)屬性的一次檢測(cè)是用一個(gè)內(nèi)部節(jié)點(diǎn)來(lái)作為代表的。在這樣的基礎(chǔ)下,在輸入新的被決策的記錄的時(shí)候,就可以對(duì)該記錄隸屬于哪個(gè)類進(jìn)行預(yù)測(cè)。以下是一個(gè)由訓(xùn)練樣本歸納判斷樹的基本算法的描述。
算法:用給定的訓(xùn)練數(shù)據(jù)產(chǎn)生一棵判定樹。
輸入:訓(xùn)練樣本samples,用離散數(shù)值屬性表示;候選的屬性集合為attribute_list。
輸出:一棵判定樹。
方法:
三、在電信客戶信息決策實(shí)現(xiàn)決策應(yīng)用
通常情況下,客戶行為分析可以保存客戶輸入的年齡、性別以及所屬的城市,因此就可以是使用這些信息作為基于決策樹的數(shù)據(jù)挖掘的輸入屬性,并且根據(jù)用戶所使用業(yè)務(wù)的多少,把客戶分成三種客戶類型:成熟客戶、一般客戶以及非客戶。所以,就能寄期望于從中掌握客戶的年齡、性別以及所屬的城市和客戶類型之間形成的一個(gè)隱藏的內(nèi)在函數(shù)關(guān)系,最后,就能把輸入屬性設(shè)置為年齡、性別和所在的城市,最終實(shí)現(xiàn)預(yù)測(cè)客戶的類型(成熟客戶、一般客戶和非客戶)。值得注意的是,在輸入的屬性設(shè)置為年齡、性別和所屬的城市的時(shí)候,要實(shí)施有效的策略進(jìn)行防止決策樹的過(guò)度增長(zhǎng)。比如當(dāng)葉子節(jié)點(diǎn)的樣本數(shù)量大于一定的閥值之后,就要對(duì)該葉子結(jié)點(diǎn)實(shí)行停止分裂,并且用多數(shù)表決的方法對(duì)該葉子進(jìn)行類標(biāo)記。
四、結(jié)語(yǔ)
在電信CRM 中運(yùn)用基于決策樹的數(shù)據(jù)挖掘的數(shù)據(jù)分析技術(shù)對(duì)客戶類型進(jìn)行挖掘,與此同時(shí)達(dá)到對(duì)客戶類型進(jìn)行預(yù)測(cè)的目的,是具有十分重要的實(shí)用價(jià)值的,不僅可以為運(yùn)營(yíng)公司在制定個(gè)性化的服務(wù)以及新業(yè)務(wù)的時(shí)候提供一個(gè)十分有價(jià)值的決策性參考,還可以通過(guò)預(yù)測(cè)用戶類型來(lái)實(shí)現(xiàn)吸引新客戶,保持老客戶的目的。因此,這對(duì)提高整個(gè)電信運(yùn)營(yíng)企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力具有十分重要的意義和深遠(yuǎn)影響。另外,還需要指出的是,當(dāng)今的決策樹的數(shù)據(jù)挖掘、數(shù)據(jù)分析技術(shù)其實(shí)還有許多需要完善的地方,通過(guò)當(dāng)今高科技技術(shù)人員的不懈努力,一定能完善得更好,從而發(fā)揮更大的潛力和價(jià)值。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:淺析決策樹的數(shù)據(jù)挖掘在電信CRM/ERP中的應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10819912714.html