總體上來(lái)講,數(shù)據(jù)分析挖掘體系可分為數(shù)據(jù)預(yù)處理、分析挖掘、數(shù)據(jù)探索、數(shù)據(jù)展現(xiàn)和分析工具。
▌數(shù)據(jù)預(yù)處理
•數(shù)據(jù)預(yù)處理包含數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約幾種方法。
•而數(shù)據(jù)清洗包括缺失值處理和異常值處理;
•數(shù)據(jù)集成包括同名同義、異名同義、單位不統(tǒng)一的實(shí)體識(shí)別和冗余性識(shí)別。
•數(shù)據(jù)變化包括函數(shù)變換、規(guī)范化、連續(xù)屬性離散化、屬性溝通和小波變換。
•數(shù)據(jù)規(guī)約包括屬性規(guī)約和數(shù)值規(guī)約。
▌分析挖掘
•分析挖掘的內(nèi)容就多了。包括假設(shè)檢驗(yàn)、方差分析、回歸分析、主成分分析、因子分析、典型相關(guān)分析、對(duì)應(yīng)分析、多維尺度分析、信度分析、生存分析、分類預(yù)測(cè)、聚類分析、關(guān)聯(lián)規(guī)則、時(shí)間序列分析和著名的灰色理論。后幾個(gè)應(yīng)用較多。
•分類預(yù)測(cè)的方法包括決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、Logistic回歸、判別分析和貝葉斯網(wǎng)絡(luò)。
•聚類分析包括K-Means聚類、kohonen網(wǎng)絡(luò)聚類、兩步聚類和層次聚類。
•關(guān)聯(lián)規(guī)則的算法有Apriori算法、GRI算法和Carma算法。
•時(shí)間序列分析包括:簡(jiǎn)單回歸分析法。
•趨勢(shì)外推法、指數(shù)平滑法、自回歸法、ARIMA模型、季節(jié)調(diào)整法。
•灰色理論可分為灰色關(guān)聯(lián)和灰色預(yù)測(cè)。
▌數(shù)據(jù)探索
•數(shù)據(jù)探索主要分為兩大類,數(shù)據(jù)質(zhì)量分析和數(shù)據(jù)特征分析。
•數(shù)據(jù)質(zhì)量分析包括缺失值分析、異常值分析和一致性分析。
•數(shù)據(jù)特征分析包括分布分析、對(duì)比分析、統(tǒng)計(jì)量分析、周期性分析、貢獻(xiàn)度分析和相關(guān)性分析。
▌分析工具
•常用的分析工具有Excel、clementine、Eviews、R語(yǔ)言、Matlab、Stata、SAS、Tableau、報(bào)表工具FineReport、商業(yè)智能FineBI
▌數(shù)據(jù)展現(xiàn)
•在數(shù)據(jù)展現(xiàn)方面要做的內(nèi)容可分為圖表制作和數(shù)據(jù)分析報(bào)告的撰寫(xiě),這兩方面之前都寫(xiě)過(guò)詳細(xì)的文章
•圖表制作可以用柱形圖、條形圖、折線圖、餅圖、面積圖、雷達(dá)圖、散點(diǎn)圖等等。展現(xiàn)的方式可以是單圖,組合圖,多圖搭配的dashb
OArd或者深入分析的聯(lián)動(dòng)鉆取等。
▌整理的思維導(dǎo)圖如下(建議收藏):
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:1分鐘了解數(shù)據(jù)分析挖掘體系(附細(xì)致思維導(dǎo)圖)
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121519966.html