二十年前,關(guān)心所謂的“大數(shù)據(jù)”的人只是一些科學(xué)團(tuán)體的成員—只有他們有大量的數(shù)據(jù)集和有動(dòng)機(jī)試圖處理這些數(shù)據(jù),計(jì)算機(jī)械協(xié)會(huì)(ACM)在知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘方面的特殊利益集團(tuán)執(zhí)行主席和雅虎前任的首席數(shù)據(jù)官Usama Fayyad說(shuō)。即使在那時(shí),數(shù)據(jù)挖掘的結(jié)果也是引人注目的。“我們能夠解決重大科學(xué)問(wèn)題,立于這個(gè)領(lǐng)域30多年,”Fayyad說(shuō)。
然而,互聯(lián)網(wǎng)的爆炸性增長(zhǎng)改變了一切。不管喜歡與否,企業(yè)發(fā)現(xiàn)他們自己在線運(yùn)營(yíng)并且積累了大量有關(guān)顧客和他們的行為的數(shù)據(jù)。Fayyad說(shuō),數(shù)據(jù)挖掘的力量變得清晰,投資在這個(gè)領(lǐng)域的經(jīng)濟(jì)動(dòng)機(jī)也同樣變得清晰。
例如,Netflix,對(duì)可能挖掘出有關(guān)它的用戶(hù)信息的任何團(tuán)隊(duì)提供了一筆100萬(wàn)美元的獎(jiǎng)金,并建立了一個(gè)比它已有的一個(gè)建議系統(tǒng)更為精確的系統(tǒng)。像這樣備受矚目的例子只觸及了數(shù)據(jù)挖掘應(yīng)用系統(tǒng)的表面。
“企業(yè)和產(chǎn)業(yè)越來(lái)越有興趣利用他們通過(guò)業(yè)務(wù)流程獲得的數(shù)據(jù),”IBM的分析研究主任和大會(huì)主席Chid Apte說(shuō)。他特別指出了醫(yī)療保健、社交媒體和任何發(fā)生在網(wǎng)站上的事情。
目前,互聯(lián)網(wǎng)巨頭從他們收集的用戶(hù)信息和他們通過(guò)對(duì)其挖掘獲得的洞察力上賺錢(qián)。零售商可以訪問(wèn)復(fù)雜的購(gòu)物者行為模式來(lái)幫助他們更有利地對(duì)商店進(jìn)貨。產(chǎn)業(yè)研究人員能基于交流擁堵、天氣、一年之間的時(shí)間段來(lái)預(yù)測(cè)汽車(chē)的交通模式,并提供優(yōu)質(zhì)的路線。
然而,當(dāng)今的數(shù)據(jù),不需以常見(jiàn)的數(shù)據(jù)庫(kù)的形式而存在。“信息不是以一種清晰的表格形式出現(xiàn)在你面前,”Apte說(shuō)。“它以一種網(wǎng)絡(luò)的形式出現(xiàn)在你面前。”他解釋道,數(shù)據(jù)經(jīng)常以一種圖形形式出現(xiàn),就像在社交媒體上使用的信息。這些圖形常常記錄的不僅是節(jié)點(diǎn)之間復(fù)雜的連接關(guān)系,還有其他類(lèi)型的多元化格式的信息,例如視頻、圖片和人們貼在社交網(wǎng)絡(luò)上的評(píng)論。
Apte說(shuō),社交媒體可能已開(kāi)始趨于對(duì)這樣圖形的分析,但是網(wǎng)絡(luò)數(shù)據(jù)也可以來(lái)自其他數(shù)據(jù)源—例如,來(lái)自諸如電網(wǎng)、配水系統(tǒng)、交通管理系統(tǒng)這樣一些復(fù)雜的工程系統(tǒng)。這些系統(tǒng)中的分布式傳感器網(wǎng)絡(luò)產(chǎn)生的數(shù)據(jù)集,在其中位置之間的連接與社交網(wǎng)絡(luò)中人與人之間的友好關(guān)系一樣的重要。理解這些連接是優(yōu)化系統(tǒng)和使他們得以持續(xù)的關(guān)鍵,Apte說(shuō)。
人們和圖形數(shù)據(jù)打交道已有數(shù)百年,但目前來(lái)自于社交網(wǎng)絡(luò)或傳感器網(wǎng)絡(luò)規(guī)模的圖形規(guī)?涨埃珹pte說(shuō)。“這些是龐大的圖形,”他說(shuō)。“你正在談?wù)摂?shù)以萬(wàn)計(jì)的節(jié)點(diǎn)和數(shù)以千萬(wàn)計(jì)的鏈接。”
要處理這種規(guī)模和范圍的圖形,并且對(duì)它們運(yùn)用現(xiàn)代分析工具,就要求更好的算法與其他創(chuàng)新。Apte說(shuō),大會(huì)的目標(biāo)之一就是為有意向的企業(yè)帶來(lái)學(xué)術(shù)界和產(chǎn)業(yè)界研究實(shí)驗(yàn)室的頂尖技術(shù),這樣他們可以更快地應(yīng)用它們。同時(shí),會(huì)議的組織者們希望,學(xué)者們將感知到大多數(shù)極其需要被考慮到的業(yè)務(wù)挑戰(zhàn)。
Fayyad說(shuō)數(shù)據(jù)中的強(qiáng)大商業(yè)利益已經(jīng)改變了數(shù)據(jù)挖掘的領(lǐng)域。他說(shuō),科學(xué)家主要處理整齊的,結(jié)構(gòu)形式存儲(chǔ)的數(shù)據(jù)。但大多數(shù)企業(yè)產(chǎn)生的數(shù)據(jù)是一種混亂的非結(jié)構(gòu)化的形式。
“當(dāng)科學(xué)家們正很好地避免了那些混亂無(wú)結(jié)構(gòu)的數(shù)據(jù)時(shí),企業(yè)卻被迫與它們正面交鋒,”Fayyad說(shuō)。“這驅(qū)使企業(yè)開(kāi)始開(kāi)發(fā)沒(méi)有人嘗試過(guò)的技術(shù)。”
當(dāng)然,挑戰(zhàn)依然存在,但是Fayyad說(shuō):“人們可以想出更多的預(yù)測(cè)模型,而且更重要的是評(píng)價(jià)他們以確定他們工作的如何……它將分析帶入到一種真正超越人類(lèi)大腦理解能力的水平上。”
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/