難得看到一個企業(yè),單純依賴完全集中式計算。但是仍然有很多組織,嚴密控制他們的內(nèi)部數(shù)據(jù)中心并且避開所有其它的分布,是絕對必要的。有些時候,這是由于現(xiàn)有的基礎(chǔ)設(shè)施投資原因。而在其他時候,它是由于安全問題,起因于企業(yè)的風險規(guī)避文化。然而,由于一些不可避免的因素,集中化變得越來越不可行:
-客戶端設(shè)備的數(shù)量和種類逐年增加,形成越來越復雜的大量終端服務(wù)
-隨著社交、移動和嵌入式技術(shù)的使用,數(shù)據(jù)收集器的數(shù)量和種類不斷地以指數(shù)形式擴大
-在市場競爭中,這個數(shù)據(jù)挖掘的需要,對于業(yè)務(wù)洞察力來說變得很迫切
-不斷的開發(fā)和部署的需求給系統(tǒng)創(chuàng)建了要求,該系統(tǒng)為也更好的敏捷性的靈活性高度組件化 (SOA)
-內(nèi)部擴展的成本來提供計算資源以跟上需求,從而不管從管理還是基礎(chǔ)設(shè)施的角度來看,維持一個可以接受的性能水平變得太難
-在實時決策的時代,有一個潛在的單點故障是不可接受的,不能訪問業(yè)務(wù)數(shù)據(jù)簡直就是一個災難,并且最終用戶不會容忍“停機”
那么可不可以引進一個更多的分布式架構(gòu)來解決上述問題呢?使用不同方面的分布式計算模式來解決不同類型的性能問題。這里正好有幾個例子:
同伴壓力是一件好事
點對點的分布式計算模型可以確保不間斷正常運行時間,甚至在即使出現(xiàn)部分系統(tǒng)故障的時候,也能夠訪問應(yīng)用程序和數(shù)據(jù)。一些供應(yīng)商服務(wù)水平協(xié)議(SLA)提供的高可用性,保證99%或者更高的正常運行時間,這一壯舉沒有幾個企業(yè)可以通過使用集中式計算來達到。自動故障轉(zhuǎn)移機制意味著終端用戶通常不知道發(fā)生了問題,因為與服務(wù)器的通訊是不受影響的。關(guān)于延遲問題,SLA也可以結(jié)合商業(yè)目標,為響應(yīng)時間和其他因素定制特定的性能指標。
沒有限制
云計算“幾乎”無限的可擴展性,提供了能夠增加或減少基礎(chǔ)設(shè)施資源的使用需求的能力。即時,自動配置和解除配置服務(wù)器和其他資源,使企業(yè)更好地執(zhí)行,確保終端用戶訪問應(yīng)用程序保持同步、資源密集的需求——甚至當出現(xiàn)出乎意料的流量峰值。
數(shù)據(jù)是一個大問題
分布式系統(tǒng)的使用也對“大數(shù)據(jù)”有影響。NoSQL選項的出現(xiàn)為企業(yè)提供了一個機會,讓他們數(shù)據(jù)流分別接受和充分利用通過SQL的關(guān)系數(shù)據(jù)數(shù)據(jù)庫和具有數(shù)據(jù)庫選項的非關(guān)系型數(shù)據(jù),例如MarkLogic和MongoDB。Nice Systems公司的架構(gòu)總監(jiān)Arnon Rotem-Gal-Oz指出,就功能性,安全性和可管理性而論,SQL仍然有它的優(yōu)勢。另一方面,他承認,“如果你有擴展問題,使用傳統(tǒng)的技術(shù)解決起來很難或者很昂貴時,那么NoSQL將是你前所未有的,填充這些需求的方式。”
實現(xiàn)在密集客戶端上的應(yīng)用程序本地化運行,可以減輕一些服務(wù)器的工作量,并且能夠提供更快和更友好的用戶體驗(假設(shè)沒有經(jīng)常在客戶端和服務(wù)器之間頻繁的更新數(shù)據(jù)的需要)。使用分層結(jié)構(gòu),在web、應(yīng)用程序和數(shù)據(jù)服務(wù)器之間劃分責任,能夠允許組織將這些流程或?qū)油獍o最有效的第三方供應(yīng)商。這種多層類型的分布式計算也可以用來減少內(nèi)部服務(wù)器的負擔,甚至當為瘦客戶端如移動設(shè)備,部署應(yīng)用程序時。
廉價商品定價
大規(guī)模分布式虛擬化技術(shù)已經(jīng)到了臨界點,第三方數(shù)據(jù)中心和云提供商可以擠壓每一滴的CPU處理能力,比以往任何時候都進一步壓低成本。如果是恰如其分好實現(xiàn)它,甚至企業(yè)級的私有云都有可能降低整體成本。供應(yīng)商的數(shù)量在云領(lǐng)域仍在增長,從而導致更多的有競爭力的定價安排。
技術(shù)選擇的多功能性
一個分布式架構(gòu)能夠為許多不同的系統(tǒng)充當一把傘。Hadoop是一個框架的例子,可以把廣泛的工具集合起來使用,比如(根據(jù)Apache.org):
-Hadoop分布式文件系統(tǒng)(HDFS),它提供了訪問應(yīng)用程序數(shù)據(jù)的高吞吐量
-Hadoop YARN作為作業(yè)調(diào)度和集群資源管理
-Hadoop MapReduce對于并行處理大數(shù)據(jù)
-Pig 作為并行計算的高級數(shù)據(jù)流語言
-ZooKeeper為大型分布式應(yīng)用程序提供高性能協(xié)調(diào)服務(wù)
企業(yè)對該框架可能特別感興趣,因為一些非常好的想法正在耶魯大學與Hadapt公司協(xié)調(diào)的商業(yè)化項目中。Daniel Abadi博士認為,“Hadoop將使它達到下一個級別。我們看到在2012年有很多采用它,F(xiàn)在它將試圖找出‘完美’的Hadoop用例。所以,建設(shè)一些縱向的特定應(yīng)用程序?qū)⑹?013相當大的一個趨勢。”那些增加分布式計算和業(yè)務(wù)性能的用例將成為此條道路的開拓者。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:大數(shù)據(jù)和分布式系統(tǒng)如何解決擴展性問題
本文網(wǎng)址:http://www.ezxoed.cn/html/support/1112158110.html