信息時(shí)代的到來,使得人們在實(shí)踐中積累的數(shù)據(jù)越來越多。大量信息給人們帶來方便的同時(shí)也帶來一大堆問題,如信息過載,難以消化;信息形式不一致,難以統(tǒng)一處理;信息真?zhèn)坞y辨等等,導(dǎo)致了“信息爆炸而知識(shí)缺乏”、“信息孤島”等現(xiàn)象。激增的數(shù)據(jù)背后隱藏著許多重要的信息,人們希望能夠?qū)ζ溥M(jìn)行更高層次的分析,發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,根據(jù)現(xiàn)有數(shù)據(jù)預(yù)測未來的發(fā)展趨勢,獲得更準(zhǔn)確全面的信息幫助管理層決策。面臨著這些新問題和挑戰(zhàn),人們開始考慮和解決如何舍棄那些不必要的信息,從大量的數(shù)據(jù)中提取有用的信息,提高信息的利用率,數(shù)據(jù)挖掘技術(shù)此時(shí)應(yīng)運(yùn)而生。
數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的知識(shí)。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用領(lǐng)域,它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且,要對數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)、分析、綜合和推理,以指定實(shí)際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動(dòng)進(jìn)行預(yù)測。
圖1 數(shù)據(jù)挖掘的流程
數(shù)據(jù)挖掘的任務(wù)是從大量數(shù)據(jù)中發(fā)現(xiàn)知識(shí),可分為描述性挖掘,隱藏性挖掘和預(yù)測性挖掘三類,如圖2所示。描述性挖掘是刻畫出數(shù)據(jù)倉庫中數(shù)據(jù)的某一特性,解釋發(fā)現(xiàn)了什么;隱藏性挖掘找出以前無法探知,隱藏于業(yè)務(wù)數(shù)據(jù)中的信息,解釋為什么;預(yù)測性挖掘則是在但前數(shù)據(jù)上進(jìn)行推理,做出預(yù)測,解釋將會(huì)發(fā)生什么。
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報(bào)表、聯(lián)機(jī)應(yīng)用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識(shí)數(shù)據(jù)挖掘所得到的信息應(yīng)具有事先未知,有效和可實(shí)用三個(gè)特征。先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的,即數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí),甚至是違背直覺的信息或知識(shí)。
圖2 數(shù)據(jù)挖掘類型
數(shù)據(jù)挖掘方法有很多種,其中比較典型的有分類、關(guān)聯(lián)、序列模式、聚類等,本文在后面將詳細(xì)介紹其分析模式及算法。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:商務(wù)智能體系介紹——數(shù)據(jù)挖掘相關(guān)理論
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083932967.html