為什么更大并不總是意味著更好
討論的中心大部分是關(guān)于Hadoop。這個(gè)讓人費(fèi)解的分布式計(jì)算技術(shù)的集合可能是開源的, 但是它既不便宜, 也并非友好,盡管有著可愛的大象標(biāo)志。事實(shí)上,對(duì)于大存儲(chǔ)和大硬件供應(yīng)商來說Hadoop和大數(shù)據(jù)看起來像是夢(mèng)想入場(chǎng)券,他們中的許多人已經(jīng)讓昂貴的收購進(jìn)入這個(gè)有利可圖的市場(chǎng)。
但是在我們擔(dān)心會(huì)錯(cuò)過洞察力金磚而開始在企業(yè)中保存每一個(gè)廢棄的數(shù)據(jù)之前,我們不應(yīng)該關(guān)注我們已擁有的東西嗎?當(dāng)然, 真正的目標(biāo)是使企業(yè)中更多的人在增加新的待定相關(guān)和質(zhì)量的數(shù)據(jù)之前,用現(xiàn)有的數(shù)據(jù)做更多的事情。也許更有意義的事情是離開大數(shù)據(jù)浪潮,并專注于讓業(yè)務(wù)用戶更有效地使用已有的數(shù)據(jù),而不是喂養(yǎng)大象及其高懸的生態(tài)系統(tǒng)。
通常,大數(shù)據(jù)的討論被限定在一個(gè)隱含的前提之下,越大越好,且增加更多的數(shù)據(jù)自然會(huì)獲得的洞察力。你相信這樣的宣傳嗎?大數(shù)據(jù)項(xiàng)目帶來的是在復(fù)雜的計(jì)算系統(tǒng)上的大投資并有專業(yè)技能來處理他們。更糟的是,他們負(fù)擔(dān)了眾所周知的長(zhǎng)部署時(shí)間和糟糕的性能。
你不需要更多的死數(shù)據(jù)
也許一些大企業(yè)和政府部門需要大數(shù)據(jù),但是對(duì)于我們其他人呢?收集更多的數(shù)據(jù)真有幫助嗎? 也許吧。但你必須首先回答: 從已有的數(shù)據(jù)中我獲得有用的、及時(shí)的答案了嗎?我有合適的原則去執(zhí)行洞察力,并測(cè)量他們對(duì)業(yè)務(wù)的影響力了嗎? 如果答案是否定的,你并不是唯一的。據(jù)Freeform Dynamics最近的一項(xiàng)研究表明, 只有15%的企業(yè)認(rèn)為他們?cè)跊Q策上充分利用了傳統(tǒng)的數(shù)據(jù)庫信息。
似乎大多數(shù)已經(jīng)存儲(chǔ)的數(shù)據(jù)并未充分用于分析。關(guān)于這一點(diǎn),
數(shù)據(jù)倉庫之父Bill Inmon稱95%的數(shù)據(jù)倉庫處于“休眠”之中。在你未能充分利用的數(shù)據(jù)倉庫中再添加TB或PB級(jí)的非結(jié)構(gòu)化數(shù)據(jù)能改變這一情況嗎?可能不會(huì)。事實(shí)上,它更增加了數(shù)據(jù)休眠、死亡數(shù)據(jù)的機(jī)會(huì)。
企業(yè)所需要的不是休眠或死亡數(shù)據(jù)。他們需要數(shù)據(jù)幫助他們獲得運(yùn)營的洞察力, 使他們現(xiàn)有的業(yè)務(wù)運(yùn)營得更好。他們需要數(shù)據(jù)讓他們的業(yè)務(wù)用戶能夠更高效、更具創(chuàng)造性。他們需要仰仗“快速”數(shù)據(jù)而不是休眠或死亡數(shù)據(jù)。如果這對(duì)你有意義, 你該如何?
有大的目標(biāo),但從小處著手
首先, 盤點(diǎn)一下你已經(jīng)擁有的:不只是數(shù)據(jù),還有知識(shí)和技能。選擇一個(gè)項(xiàng)目, 你可以在現(xiàn)有的資源上證明改進(jìn)的提高。如果你需要雇傭, 考慮一下業(yè)務(wù)分析師, 而不是技術(shù)專家, 因?yàn)橛糜诨卮鹨粋(gè)業(yè)務(wù)問題的錢是一種投資, 而一個(gè)用于支持這個(gè)過程的專業(yè)IT技能是沉沒成本。
第二,考慮更敏捷的現(xiàn)成工具,它能夠讓你放眼大數(shù)據(jù),但是從小處著手,并迅速擴(kuò)展?紤]易用的工具, 你現(xiàn)有的工作人員都可訪問到。這種方法在目前會(huì)帶來更多的業(yè)務(wù)洞察力而且許多這樣的工具擴(kuò)展性好,除非是面對(duì)最極端大數(shù)據(jù)問題的考驗(yàn)。解決方案應(yīng)該允許業(yè)務(wù)經(jīng)理可擴(kuò)展性的直觀使用以支持有經(jīng)驗(yàn)的分析師更復(fù)雜的挖掘。對(duì)基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)或處理平臺(tái)的知識(shí)不應(yīng)是必要的。
分析引擎應(yīng)該運(yùn)行在沒有專有的硬件或特定配置、數(shù)據(jù)庫模式的標(biāo)準(zhǔn)服務(wù)器上,或調(diào)整需要以實(shí)現(xiàn)所需的性能。因?yàn)閷?shù)據(jù)加載到分析數(shù)據(jù)庫會(huì)成為最耗時(shí)的工作, 連接到數(shù)據(jù)源應(yīng)該基于行業(yè)標(biāo)準(zhǔn)和設(shè)計(jì)來大大簡(jiǎn)化多種格式的數(shù)據(jù)加載。
最后,采用敏捷的,迭代的方法,不要在大數(shù)據(jù)上大爆炸。成功的分析計(jì)劃是基于與數(shù)據(jù)意義的持續(xù)對(duì)話中,有一套問題的答案是在下一輪的發(fā)現(xiàn)中。對(duì)每個(gè)周期更多了解數(shù)據(jù)所呈現(xiàn)的什么,與什么相關(guān),需要添加什么以及有多少歷史數(shù)據(jù)是值得添加的。從你的數(shù)據(jù)中(無論大或。┦斋@價(jià)值的最關(guān)鍵因素是快速的回答時(shí)間。
也許大數(shù)據(jù)分析總有一天會(huì)變成每個(gè)企業(yè)所必備的,但不要確信僅僅因?yàn)楣芾眍檰柡椭饕⿷?yīng)商正投入百萬美元在“不使用大數(shù)據(jù)分析會(huì)錯(cuò)失什么?”的訊息上就認(rèn)為它是目前的案例。更可能,你不會(huì)遺漏任何事情而你的時(shí)間和金錢更好用于讓更多業(yè)務(wù)用戶手中擁有已有的數(shù)據(jù),并給他們工具做更深、更快的分析。
進(jìn)化向我們展示的一件事情是,小型敏捷物種往往比大的特別的物種做的更好。也許我們應(yīng)該對(duì)我們的數(shù)據(jù)運(yùn)用同樣的思維?
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:大數(shù)據(jù):生者與死者
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839712510.html