20 世紀(jì)末,席卷全球的以互聯(lián)網(wǎng)為核心的計算機(jī)網(wǎng)絡(luò)信息技術(shù)迅猛發(fā)展,電子商務(wù)成為新經(jīng)濟(jì)形式的代表,給企業(yè)的經(jīng)營管理帶來了巨大的沖擊和變化。這意味著又一次產(chǎn)業(yè)革命的來臨,人類社會的發(fā)展從工業(yè)經(jīng)濟(jì)時代進(jìn)入到電子商務(wù)時代。隨著網(wǎng)絡(luò)技術(shù)的成熟,電子商務(wù)大潮正在全球范圍內(nèi)急速變革著傳統(tǒng)的商業(yè)模式,各類電子商務(wù)網(wǎng)站風(fēng)起云涌,不僅提供了一種商家與客戶進(jìn)行交流的全新的方式,同時為商家提供了豐富的數(shù)據(jù)資源。21 世紀(jì)作為“商務(wù)時代”,其特殊性在于“客戶經(jīng)濟(jì)”。企業(yè)要在新時代里生存,就要具備吸引和保持客戶的能力。
商務(wù)智能是指基于互聯(lián)網(wǎng)環(huán)境下的商品交易及以商品交易相關(guān)的商務(wù)活動,同時與人工智能技術(shù),數(shù)據(jù)挖掘等方面的技術(shù)相結(jié)合的活動,涉及的領(lǐng)域非常廣泛,其中包括電子支付、安全、信任、法律、廣告、在線購物等。當(dāng)前,商務(wù)智能的真正價值在于企業(yè)應(yīng)用。企業(yè)的成本控制是有限的,在生產(chǎn)過剩、市場不足的情況下,企業(yè)只有加大市場營銷、銷售和服務(wù)等與客戶相關(guān)的部門的管理,才能開源。客戶參與及互動合作的新的營銷理念及其運作,要求不論是虛擬型的純電子商務(wù),還是由具備強(qiáng)大基礎(chǔ)結(jié)構(gòu)的傳統(tǒng)商務(wù)企業(yè)延伸出來的電子商務(wù),都必須能將焦點移回到客戶身上。只有提供客戶個性化且立即解決問題的支持,才能在電子商務(wù)時代中創(chuàng)造壓倒性的競爭優(yōu)勢。企業(yè)要想生存,必須盡快抓住這一中心。
那么,如何了解顧客的興趣,掌握客戶需求,以達(dá)到增加收入降低成本使企業(yè)處于更有利的競爭位置呢? 客戶行為預(yù)測和潛在客戶挖掘已成為商務(wù)營銷者必須面對和解決的問題。有效地利用數(shù)據(jù)挖掘技術(shù),從商務(wù)網(wǎng)站潛在的海量商業(yè)數(shù)據(jù)中發(fā)現(xiàn)商機(jī),提高商家對市場的響應(yīng)速度和競爭力勢在必行。
1 數(shù)據(jù)挖掘在商務(wù)智能應(yīng)用中的研究現(xiàn)狀
數(shù)據(jù)挖掘能帶來顯著的經(jīng)濟(jì)效益,因此在電子商務(wù)中應(yīng)用也越來越廣泛?蛻舻男袨、消費習(xí)慣對于電子商務(wù)來說非常重要。在生活中采用數(shù)據(jù)挖掘的成功的例子很多,例如著名的“尿布與啤酒”的故事。早在 2007 年,Google、Amazon、Yahoo、MSN 等一些公司都要求員工運用挖掘技術(shù)來了解客戶行為,并根據(jù)挖掘出的信息數(shù)據(jù)及模式設(shè)計更加符合客戶需求的服務(wù)和產(chǎn)品。也就是說利用挖掘可以了解客戶行為,其分析的數(shù)據(jù)結(jié)果可提供給企業(yè)參考,做出合適的調(diào)整策略。目前,國外對于數(shù)據(jù)挖掘的研究重點逐漸從發(fā)現(xiàn)方法轉(zhuǎn)向系統(tǒng)應(yīng)用,注重多種發(fā)現(xiàn)策略和技術(shù)的集成,以及多種學(xué)科之間的相互滲透。當(dāng)前,世界上比較有影響的典型數(shù)據(jù)挖掘系統(tǒng)有 Cover Story,EXPLORA,Knowledge Discovery,Workbench,DB Miner,Quest 等。在應(yīng)用方面包括:KDD 商業(yè)軟件工具不斷產(chǎn)生和完善,注重建立解決問題的整體系統(tǒng),而不是孤立的過程。用戶主要集中在大型銀行、保險公司、電信公司和銷售業(yè)。國外很多計算機(jī)公司非常注重數(shù)據(jù)挖掘的開發(fā)應(yīng)用,比如 IBM 和微軟成立了相應(yīng)的研究中心進(jìn)行這方面的工作。
國內(nèi)從事數(shù)據(jù)挖掘研究的人員主要在大學(xué),也有研究所和公司在從事這方面的研究,這些工作一般集中于學(xué)習(xí)算法和有關(guān)數(shù)據(jù)挖掘理論方面的研究。在具體應(yīng)用方面,中科院計算所智能處理開放實驗室的史忠植等人設(shè)計了一個數(shù)據(jù)挖掘工具 MSMiner,使用決策樹算法為廣東地稅提供納稅人異常情況檢測; 復(fù)旦德門公司開發(fā)的“天眼”數(shù)據(jù)挖掘工具集 D miner 集成了多種數(shù)據(jù)挖掘算法,取得了較好的挖掘效果。
2 數(shù)據(jù)挖掘技術(shù)在商務(wù)智能中的應(yīng)用
2.1 數(shù)據(jù)挖掘在商務(wù)智能 CRM 中的應(yīng)用
CRM( Customer Relationship Management) ,即客戶關(guān)系管理。這個概念最初由 Gartner Group 提出來,而在最近開始在企業(yè)電子商務(wù)中流行。CRM 的主要含義就是通過對客戶詳細(xì)資料的深入分析,來提高客戶滿意程度,從而提高企業(yè)的競爭力的一種手段,它主要包含以下 7 個主要方面( 簡稱 7P) : 客戶概分析( Profiling) 、客戶忠誠度分析( Persistency) 、客戶利潤分析 ( Profitability ) 、客戶性能分析( Performance) 、客戶未來分析( Prospecting) 、客戶產(chǎn)品分析( Product) 、客戶促銷分析( Promotion) 。
目前在 CRM 中進(jìn)行有效數(shù)據(jù)挖掘的應(yīng)用及研究主要集中在以下幾個方面:
1) 通用且合理的 CRM 系統(tǒng)體系結(jié)構(gòu)的研究。主要考慮應(yīng)用對象、應(yīng)用目標(biāo)、企業(yè)規(guī)模等等實際問題;
2) 數(shù)據(jù)挖掘與數(shù)據(jù)庫、數(shù)據(jù)倉庫的有機(jī)結(jié)合;
3) CPJI 中的復(fù)雜數(shù)據(jù)挖掘模型的研究。這方面主要集中在挖掘的知識類型、多個抽象層的交互知識挖掘算法的研究;
4) 數(shù)據(jù)的研究。這方面主要包括數(shù)據(jù)庫類型的多樣性問題、復(fù)雜數(shù)據(jù)類型的處理、噪聲數(shù)據(jù)和缺失數(shù)據(jù)的處理,以及異種數(shù)據(jù)庫和 Web 上的數(shù)據(jù)挖掘等;
5) 與用戶交互的研究。這方面主要研究數(shù)據(jù)挖掘結(jié)果的可視化和可理解性,領(lǐng)域知識的運用等。數(shù)據(jù)挖掘是從海量數(shù)據(jù)中挖掘出有用的信息和知識的過程,它在 CRM 中的應(yīng)用主要表現(xiàn)在對客戶信息的分析和處理上,它能從表層數(shù)據(jù)中挖掘出蘊含的深層的知識。正是基于這一點,許多 CRM 的解決方案中越來越重視數(shù)據(jù)挖掘在其中的應(yīng)用。
2.2 需要數(shù)據(jù)挖掘處理的客戶行為數(shù)據(jù)源
電子商務(wù)網(wǎng)站客戶進(jìn)行數(shù)據(jù)挖掘時,所需要的數(shù)據(jù)主要來自于兩個方面: 一方面是客戶的資料,包括客戶的背景信息和客戶以往的交易數(shù)據(jù),這部分信息主要來源于客戶的登記信息; 另外一部分?jǐn)?shù)據(jù)主要來自于客戶瀏覽時的點擊流,這部分?jǐn)?shù)據(jù)主要用于考查客戶的行為表現(xiàn),主要來源于服務(wù)器數(shù)據(jù)。
2.2.1 服務(wù)器數(shù)據(jù)
服務(wù)器數(shù)據(jù)可以分為 Web 日志文件和查詢數(shù)據(jù)。
1) Web 日志文件。登陸電子商務(wù)網(wǎng)站的客戶只要他們鏈接到網(wǎng)站的服務(wù)器上,提供 Web 服務(wù)的服務(wù)器會自動生成訪問日志信息?蛻粼L問任意一個頁面,Web 服務(wù)器的日志記錄中就會增加一條相關(guān)信息。隨著網(wǎng)絡(luò)技術(shù)的高速發(fā)展和時間積累,Web 服務(wù)器中所記錄的日志文件必將越來越大,所包含的網(wǎng)站客戶訪問信息也會越來越多。
2) 查詢數(shù)據(jù)。電子商務(wù)網(wǎng)站的查詢數(shù)據(jù)是指客戶在商務(wù)網(wǎng)站上查詢自己想要查詢的信息時在Web 服務(wù)器端產(chǎn)生的數(shù)據(jù)。例如,客戶會搜索一些自己喜歡的商品或某些關(guān)注的廣告,這些查詢信息就會通過商品或者廣告的登記信息連接到服務(wù)器的訪問日志上。
2.2.2 客戶登記信息
在數(shù)據(jù)挖掘中,客戶登記信息必須和訪問日志集成,才能提高數(shù)據(jù)挖掘的準(zhǔn)確度,更進(jìn)一步地了解客戶特征。通常我們要求在電子商務(wù)網(wǎng)站的訪問者成為客戶之前就開始跟蹤他們。通過網(wǎng)絡(luò)站點就能實現(xiàn)這一點,每當(dāng)?shù)谝淮慰吹揭粋訪客就發(fā)送一個cookie 和啟動一個匿名簡檔以記住訪客作了什么,當(dāng)該訪客回來( 使用同一瀏覽器) 的時候,該 cookie被識別,簡檔被更新。當(dāng)該訪客最終變成客戶或者是成為注冊用戶時,將導(dǎo)致轉(zhuǎn)變得那些活動加入該客戶的歷史行為記錄。
2.3 數(shù)據(jù)挖掘客戶行為的過程
電子商務(wù)客戶行為數(shù)據(jù)挖掘過程可以細(xì)分為確定業(yè)務(wù)對象、數(shù)據(jù)的搜集和抽取、數(shù)據(jù)預(yù)處理、挖掘模型的構(gòu)建、數(shù)據(jù)挖掘、結(jié)果分析、使用結(jié)果。
2.3.1 定義問題
數(shù)據(jù)挖掘的結(jié)果往往是不可預(yù)測的,但是要探索的問題應(yīng)該是有預(yù)見性的、有明確目標(biāo)的。為了數(shù)據(jù)挖掘而挖掘數(shù)據(jù)帶有盲目性,往往是不會成功的。在確定業(yè)務(wù)對象時,要確定這樣一些問題: 從何處入手,需要挖掘什么數(shù)據(jù),要用多少數(shù)據(jù),數(shù)據(jù)挖掘要進(jìn)行到什么程度。
2.3.2 數(shù)據(jù)的搜集和抽取
一旦問題定義完畢,就要進(jìn)行相關(guān)數(shù)據(jù)的搜集。對于電子商務(wù)客戶數(shù)據(jù)挖掘,數(shù)據(jù)的主要來源是服務(wù)器數(shù)據(jù)和客戶的登記信息。電子商務(wù)網(wǎng)站每天都可能有上百萬次的在線交易,生成海量的日志文件和登記表。這些海量的數(shù)據(jù)就構(gòu)成了電子商務(wù)數(shù)據(jù)挖掘的數(shù)據(jù)源。數(shù)據(jù)抽取的目的是辨別出需要分析的數(shù)據(jù)集和,縮小處理范圍,提高數(shù)據(jù)挖掘的質(zhì)量。
2.3.3 數(shù)據(jù)的預(yù)處理
數(shù)據(jù)預(yù)處理是對數(shù)據(jù)進(jìn)行清洗,解決數(shù)據(jù)中的缺值、冗余、數(shù)據(jù)值的不一致性等問題,以供數(shù)據(jù)挖掘階段使用。這是電子商務(wù)數(shù)據(jù)挖掘最關(guān)鍵的階段。數(shù)據(jù)預(yù)處理的一個主要任務(wù)就是要將客戶訪問網(wǎng)站留下的原始日志整理成事物數(shù)據(jù)庫,以供數(shù)據(jù)挖掘階段使用。
2.3.4 挖掘模型的構(gòu)建
將數(shù)據(jù)轉(zhuǎn)化成一個分析模型,這個分析模型時針對挖掘算法建立的。建立一個真正的適合挖掘算法的分析模型,是數(shù)據(jù)挖掘成功的關(guān)鍵了。所建模型的目標(biāo)就是要反應(yīng)客戶群中各個年齡段對某種商品的反應(yīng)的各種相關(guān)因素。模型建立后,需要從模型的準(zhǔn)確性、可理解性和性能方面進(jìn)行考察。
2.3.5 數(shù)據(jù)挖掘
選擇合適的算法進(jìn)行數(shù)據(jù)挖掘,從而從海量的數(shù)據(jù)中得出有效的、新穎的、潛在的、有用的及最終可以理解的信息和知識。電子商務(wù)數(shù)據(jù)挖掘常用關(guān)聯(lián)規(guī)則、序列模式、分類和聚類等技術(shù)。
2.3.6 結(jié)果分析
當(dāng)數(shù)據(jù)挖掘出結(jié)果后,要對挖掘結(jié)果進(jìn)行解釋并且評估。數(shù)據(jù)的可視化問題是數(shù)據(jù)挖掘中一個重要的組成部分,他把挖掘到的信息組成和提供成為易于作決策的表達(dá)方式?梢哉f,沒有提供良好的數(shù)據(jù)可視化的數(shù)據(jù)挖掘系統(tǒng),不是一個完善的系統(tǒng)。用戶對數(shù)據(jù)挖掘結(jié)果進(jìn)行評估,如果滿意則挖掘過程結(jié)束,否則,則可以重新提出挖掘要求,再重新進(jìn)行挖掘。
2.3.7 使用結(jié)果
一旦當(dāng)達(dá)到了數(shù)據(jù)挖掘的最后一步,就可以應(yīng)用基于所發(fā)現(xiàn)的模式?jīng)Q策了。可以利用挖掘得到的知識在管理決策分析中得到應(yīng)用,提高企業(yè)的競爭力。
3 商務(wù)智能中的數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘的技術(shù)基礎(chǔ)是人工智能。但它僅僅利用了人工智能中一些已經(jīng)成熟的算法和技術(shù),如: 人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策數(shù)、鄰近搜索方法; 規(guī)則
準(zhǔn)理、模糊邏輯等,其問題的復(fù)雜性和難度比人工智能要低很多。進(jìn)行電子商務(wù)的數(shù)據(jù)挖掘,主要是針對客戶訪問信息、客戶交易信息等客戶行為信息進(jìn)行挖掘,得到客戶的訪問模式和行為模式,從而找到有用的市場信息,提供有針對性、個性化的服務(wù)。數(shù)據(jù)挖掘系統(tǒng)利用的技術(shù)越多,精確度就高。但無論采用哪幾種技術(shù)來完成任務(wù),從功能上包括以下 4種。
3.1 關(guān)聯(lián)分析
關(guān)聯(lián)分析的目的就是為了挖掘出隱藏在數(shù)據(jù)間的關(guān)聯(lián)規(guī)則。在電子商務(wù)中關(guān)聯(lián)分析也就是找到客戶對網(wǎng)站上各種文件之間訪問的相互聯(lián)系,找出客戶購買行為的各種關(guān)聯(lián)。進(jìn)行Web上的數(shù)據(jù)挖掘,構(gòu)建關(guān)聯(lián)模型,可以更好的組織站點,減少用戶過濾信息的負(fù)擔(dān),可以根據(jù)客戶當(dāng)前的購買行為給客戶提供推薦。
3.2 序列模式分析
序列模式分析的側(cè)重點在于分析數(shù)據(jù)間的前后或者因果關(guān)系。就是在實踐有序的事物集中,找到哪些“一些項跟隨另一些項”的內(nèi)部事務(wù)模式。對電子商務(wù)數(shù)據(jù)挖掘而言,序列模式分析是很重要的分析方法,因為 Web 日志數(shù)據(jù)是根據(jù)用戶的訪問時間來記錄的,經(jīng)過數(shù)據(jù)凈化和處理后,使一個間斷的時間序列; 而且,商品交易數(shù)據(jù)也是時間序列數(shù)據(jù)。關(guān)聯(lián)分析中采用的 Apriori 特性也可以用于序列模式的挖掘,因為若長度為 K 的序列模式是非頻繁的,其超集( 長度為 k +1) 不可能是頻繁。因此,即使參數(shù)設(shè)和約束條件有所不同,序列模式分析的大部分算法仍然是類 Apriori 算法的變形算法。
3.3 分類分析
分類分析可以挖掘默寫共同的特性。這個特點可以用來對新添加到數(shù)據(jù)庫里的數(shù)據(jù)項進(jìn)行分類。在數(shù)據(jù)挖掘中,分類計數(shù)可以根據(jù)訪問這些用戶而得到的個人信息或共同的訪問模式得出訪問某一服務(wù)器文件的用戶特征。另外,通過用戶的注冊表、在線調(diào)查表也可以得到用戶的一些特性。按照各種算法的技術(shù)特點,可以將分類分析分成決策樹類分類、貝葉斯類分類、基于關(guān)聯(lián)規(guī)則分類以及利用數(shù)據(jù)庫技術(shù)分類等幾類算法。
在電子商務(wù)中通過分類分析,得到客戶分類模式后,知道各類客戶的特點、愛好,那么就可以針對不同類客戶的特點展開不同的商務(wù)活動,提供有針對性地人性化的信息服務(wù); 得到客戶的分類模式后,可以對新的客戶進(jìn)行分析,發(fā)現(xiàn)新的客戶屬于那一個類別,從而有針對性地開展商務(wù)活動。
3.4 聚類分析
聚類分析用于把有相似特性的用戶、數(shù)據(jù)項集合到一起,并用顯式或者隱式的方法描述不同的類別。電子商務(wù)數(shù)據(jù)挖掘用聚類技術(shù)可以把具有相似瀏覽模式的用戶集中起來。
1) 利用數(shù)據(jù)挖掘技術(shù),通過挖掘 Web 服務(wù)器中用戶的訪問日志,對網(wǎng)絡(luò)用戶進(jìn)行聚類,發(fā)掘出具有相似的訪問興趣的網(wǎng)絡(luò)用戶,網(wǎng)站的設(shè)計者根據(jù)聚類的結(jié)果,可以更好的理解用戶的需求,重新調(diào)整網(wǎng)站的頁面結(jié)構(gòu),從而為用戶提供方便、優(yōu)質(zhì)的服務(wù)。還可以利用聚類分析進(jìn)行網(wǎng)頁聚類,調(diào)整網(wǎng)頁結(jié)構(gòu)。
2) 利用數(shù)據(jù)挖掘技術(shù)挖掘客戶資料,將具有相似愛好的客戶分配到相同的族中,聚類產(chǎn)生以后,根據(jù)族中其他客戶對某商品的評價就可以得到該客戶對該商品的評價,就可以同客戶推薦他可能感興趣的商品。
3) 分類分析和聚類分析的綜合應(yīng)用。分類分析法和聚類分析法是互逆的過程。例如在最初的分析中,分析人員根據(jù)以往的經(jīng)驗要分析的數(shù)據(jù)進(jìn)行鑒定、劃分類別,然后,該分析人員用分類分析法分析該數(shù)據(jù)集合,得到每個類別的描述,接著把這些描述作為新的分類規(guī)則重新對這個集合( 拋棄原來的劃分結(jié)果) 進(jìn)行劃分,一次獲得更好的分類結(jié)果。這樣分析人員可以循環(huán)使用這兩種分析法直到得到滿意的結(jié)果。在電子商務(wù)中,由于客戶登記的資料往往不完整,不可能正確劃分客戶的類型,綜合運用兩種方法更有實際的意義。
4 結(jié)束語
目前,對商務(wù)智能系統(tǒng)的研究主要集中于對Web 日志的挖掘,比較成功的技術(shù)是協(xié)同過濾技術(shù),而將關(guān)聯(lián)規(guī)則、聚類、分類等數(shù)據(jù)挖掘技術(shù)用于商務(wù)推薦系統(tǒng)才剛剛開始。分析客戶訪問電子商務(wù)網(wǎng)站的瀏覽和購買等行為,從行為數(shù)據(jù)的采集與儲存,數(shù)據(jù)挖掘算法的改進(jìn)及復(fù)合補(bǔ)充挖掘三個方面來找到一個適合小型電子商務(wù)網(wǎng)站的適時挖掘系統(tǒng),從而實現(xiàn)掌握客戶行為規(guī)律,為推薦等工作提供依據(jù)。
在以后的研究工作中,對目前比較先進(jìn)的大型數(shù)據(jù)庫進(jìn)行研究,數(shù)據(jù)的集成、清洗還有待進(jìn)一步研究,數(shù)據(jù)的建立模型還有待進(jìn)一步完善,目前各種數(shù)據(jù)理還較為繁瑣,適應(yīng)性較低。研究解決大型商務(wù)網(wǎng)站的海量客戶行為數(shù)據(jù)的采集和存儲問題的方案。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:商務(wù)智能系統(tǒng)中客戶行為數(shù)據(jù)挖掘研究綜述
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839315720.html