大數據在2012“一飛沖天”,它將會以一種戲劇性的方式改變數據管理的各個方面。大數據系統(tǒng)已經給機器生成數據管理、連續(xù)的ETL、操作型BI、動態(tài)數據以及基于云的數據倉庫都帶來了變化。
不過,隨著大數據發(fā)展進入2013年,已經沒有什么技術能比NoSQL數據庫和Hadoop更活躍了,它們都有著更大的提升空間。根據MarketAnalysis.com 2012年的一份報告看,單單是Hadoop MapReduce市場,預計復合年增長率將達到58%,在2018年將達到22億美元的規(guī)模。
NoSQL和Hadoop的出現(xiàn)主要是為應對非結構化數據,比如文本數據或者web日志。就像Apache Hadoop一樣,這些技術通常是從開源發(fā)起,然后逐漸成為新的商業(yè)產品。
Judith Hurwitz是Hurwitz and Associates公司的總裁兼CEO,她認為大數據架構和大規(guī)模并行處理大大改變了數據應用現(xiàn)狀。她說:“在此之前,即便數據真的對公司很重要,人們也并不是真正有能力獲取海量數據并實時分析。而現(xiàn)在,原來無法實現(xiàn)的目標已經觸手可及。”
SQL陣營的逆襲
我們可以在TechTarget商務智能網站上看到,從2012年開始,關于主流關系型數據庫將走向沒落的評論就此起彼伏。觀察者認為,同上文提到的技術相比,SQL 關系數據庫未來幾年在應對大數據時將失去以往的競爭力。
這一趨勢背后的推動力是企業(yè)希望以更快的速度獲取更多非結構化數據,這樣才能更加依靠數據驅動做決策。習以為常的數據處理方式正在經歷變革,以便更好地融入新的技術。
對于那些傳統(tǒng)的關系型數據庫廠商,過去一年中擁抱大數據以及Hadoop的例子也有很多:
·IBM不斷收購一些高級數據分析公司,以擴充大數據產品線。藍色巨人的努力方向從小的改進(比如,針對DB2 10的NoSQL圖形存儲和InfoSphere Warehouse 10)到顛覆性的PureData一體機,都是為了幫助客戶搞定大數據。
·甲骨文在2012年初推出了大數據機(Big Data Appliance),又在近期發(fā)布了Oracle NoSQL數據庫2.0版本,該產品已經自動實現(xiàn)重新平衡,新的應用編程接口可以處理大對象并與Oracle數據庫有更緊密的集成,還可以支持直接用SQL查詢Oracle NoSQL數據庫記錄。
·微軟展示了Hadoop對Windows Azure和Windows Server支持的預覽;Teradata公司發(fā)布了其Aster大數據分析產品;而Informatica公司發(fā)布了PowerCenter套件的大數據版,據說消除了Hadoop手工編碼的需求,它把編程任務帶入了Informatica開發(fā)環(huán)境。
大數據永遠不會存在誰取代誰的問題,SQL雖然在過去一年中遭受了沖擊,但是它并不會走向衰落。正相反,一些NoSQL和Hadoop方面比較專業(yè)的公司也在SQL方面做了許多努力。一個典型的例子是Hadoop初創(chuàng)公司Cloudera,通過Impala來提升Hadoop與SQL的協(xié)作程度。Impala是一款Hadoop軟件產品,支持標準SQL做交互式查詢。
大數據變革
大數據變革也帶動了數據庫技術的前進,現(xiàn)在我們看到SQL與NoSQL從對立更多地走向了融合。事實上,在大數據早期的討論中,傳統(tǒng)關系型數據庫技術是被忽視的。
流媒體數據庫廠商SQLstream的副總裁Ronnie Beggs表示:“在過去的幾年里,由于大數據的崛起,SQL作為主流技術遭受了一定的沖擊。大數據更多地和NoSQL聯(lián)系在了一起。”
他人為在2013年,我們應該會看到明顯的變化。在最近幾年已經有很多努力在使NoSQL數據庫更好地適應SQL數據庫的風格。
Beggs說:“大數據是不斷變化的,我們接下來這一年會看到的是SQL歸來,它將作為所有大數據平臺的接口。”
Hadoop、NoSQL和SQL共存的方式,標志著大數據在成熟度方面邁進了新的一步。隨著2013年開啟,大數據有可能從一個熱門話題逐漸轉向落地實踐。
Ashland BI研究機構的總裁和創(chuàng)始人Colin White表示:“我認為人們正努力通過大數據的炒作,來真正理解其商業(yè)價值。在2013年,我認為我們將看到人們從大數據獲得商業(yè)價值的更好的例子。這不是關于大數據的問題,而是你用大數據做什么的問題。”
雖然對新技術有廣泛的興趣,但不同公司對于接受全面大數據系統(tǒng)的速度也會有所不同。
一位系統(tǒng)集成商在金融行業(yè)的活動上向TechTarget記者表示,銀行作為一個領域,只有部分涉足了基本的大數據,而不是全部。銀行和其它領域只看到了大數據的數量,而沒有留意到它的非結構性。至少目前還是這樣。
他說:“大數據的含義有兩部分。第一部分是它們的量很大,第二部分是數據是非結構化的。銀行明顯屬于第一部分。但是我們不會去收集tweets這樣的社交數據,至少目前還沒有。我們還在觀望,看金融數據服務市場的其他用戶如何處理它。”
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/