| 當前位置：拓步ERP資訊網(wǎng) >>服務(wù)支持 >>ERP技術(shù)支持 >>技術(shù)支持知識庫

Hadoop 的分布式架構(gòu)改進與應(yīng)用

發(fā)布日期：2013-12-11 10:28:50 來源：www.ezxoed.cn 編輯：拓步ERP資訊網(wǎng) 瀏覽：評論

摘要：Hadoop本身起源于ApacheNutch項目，曾也是Lucene項目的一部分。從結(jié)構(gòu)化數(shù)據(jù)，到半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)，從關(guān)系型數(shù)據(jù)庫到非結(jié)構(gòu)化數(shù)據(jù)庫（NoSQL），更高性能的并行計算/批處理能力和海量數(shù)據(jù)存儲成為現(xiàn)代主流IT公司的一致需求。本文將在簡單介紹Hadoop主要成員的基礎(chǔ)上，探討Hadoop在應(yīng)用中的改進。 原標題：Hadoop 的分布式架構(gòu)改進與應(yīng)用 原作者：發(fā)表時間：2013/12/11 張包峰來源：CSDN

1.背景介紹

談到分布式系統(tǒng)，就不得不提到Google的三駕馬車:GFS,MapReduce和BigTable。雖然Google沒有開源這三個技術(shù)的實現(xiàn)源碼，但是基于這三篇開源文檔, Nutch項目子項目之一的Yahoo資助的Hadoop分別實現(xiàn)了三個強有力的開源產(chǎn)品：HDFS，MapReduce和HBase。在大數(shù)據(jù)時代的背景下，許多公司都開始采用Hadoop作為底層分布式系統(tǒng)，而Hadoop的開源社區(qū)日益活躍，Hadoop家族不斷發(fā)展壯大，已成為IT屆最炙手可熱的產(chǎn)品。

本文將在簡單介紹Hadoop主要成員的基礎(chǔ)上，探討Hadoop在應(yīng)用中的改進。

第一部分是對Hadoop誕生和現(xiàn)狀的簡單描述。

第二部分將簡單介紹hadoop的主要成員，主要包括他們的基本特性和優(yōu)勢。分別是分布式文件系統(tǒng)HDFS，NoSQL家族之一的HBase，分布式并行編程方式MapReduce以及分布式協(xié)調(diào)器Zookeeper。

第三、四、五部分分別介紹了Hadoop的不同改進和使用。按次序分別是facebook的實時化改進，HadoopDB，以及CoHadoop。

最后是我的總結(jié)和體會。

如果對Hadoop的基本架構(gòu)和基礎(chǔ)知識熟悉，可以從第三部分看起。

2.關(guān)于Hadoop

Hadoop本身起源于Apache Nutch項目，曾也是Lucene項目的一部分。從結(jié)構(gòu)化數(shù)據(jù)，到半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)，從關(guān)系型數(shù)據(jù)庫到非結(jié)構(gòu)化數(shù)據(jù)庫（NoSQL），更高性能的并行計算/批處理能力和海量數(shù)據(jù)存儲成為現(xiàn)代主流IT公司的一致需求。

2.1 HDFS

HDFS，全稱Hadoop Distributed Filesystem，是Hadoop生態(tài)圈的分布式文件系統(tǒng)。分布式文件系統(tǒng)跨多臺計算機存儲文件，該系統(tǒng)架構(gòu)于網(wǎng)絡(luò)之上，誕生即具備了網(wǎng)絡(luò)編程的復(fù)雜性，比普通磁盤文件系統(tǒng)更加復(fù)雜。

2.1.1 HDFS數(shù)據(jù)塊

HDFS以流式數(shù)據(jù)訪問模式來存儲超大文件，運行于商用硬件集群上。數(shù)據(jù)集通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復(fù)制而來，接著長時間在此數(shù)據(jù)集上進行格類分析處理。每次都將涉及該數(shù)據(jù)集的大部分數(shù)據(jù)甚至全部，因此讀取整個數(shù)據(jù)集的時間延遲比讀取第一條記錄時間的延遲更重要。而一次寫入、多次讀取是最高效的訪問模式。有一點要說明的是，HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的，而這可能會以高時間延遲為代價。

HDFS默認的最基本的存儲單元是64M的數(shù)據(jù)塊(block)。HDFS的塊比磁盤塊(512字節(jié))大得多，目的是為了最小化尋址開銷。HDFS上的文件也被劃分為多個分塊(chunk)，作為獨立存儲單元。與其他文件系統(tǒng)不同的是，HDFS中小于一個塊大小的文件不會占據(jù)整個塊的空間。

塊抽象給分布式文件系統(tǒng)帶來的好處：

文件的大小可以大于網(wǎng)絡(luò)中任意一個磁盤的容量。

使用塊抽象而非整個文件作為存儲單元，大大簡化了存儲子系統(tǒng)的設(shè)計，同時也消除了對元數(shù)據(jù)的顧慮。

塊非常適合用于數(shù)據(jù)備份進而提供數(shù)據(jù)容錯能力和可用性。

2.1.2 Namenode和Datanode

namenode和datanode的管理者-工作者模式有點類似主從架構(gòu)。namenode對應(yīng)多個datanode。namenode管理文件系統(tǒng)的命名空間，維護文件系統(tǒng)和內(nèi)部的文件及目錄。datanode是文件系統(tǒng)的真正工作節(jié)點，根據(jù)需要存儲并檢索數(shù)據(jù)塊（一般受namenode調(diào)度），并且定期向namenode發(fā)送它們所存儲的塊的列表。

namenode一旦掛掉，文件系統(tǒng)的所有文件就丟失了，不知道如何根據(jù)datanode的塊來重建文件。因此，namenode的容錯或者備份是很重要的。在HDFS中存在secondarynamenode（雖然不完全是個namenode的備份，更確切的是個輔助節(jié)點）周期性將元數(shù)據(jù)節(jié)點的命名控件鏡像文件和修改日志合并。

圖1 namenode和datanode的管理者-工作者模式

2.2 HBase

跟傳統(tǒng)的關(guān)系型數(shù)據(jù)庫（RDBMS）基于行存儲不同，HBase是一個分布式的，在HDFS上開發(fā)的面向列的分布式數(shù)據(jù)庫。HBase行中的列分成“列族”（column family），所有的列族成員有相同的前綴。所有列族成員都一起存放在文件系統(tǒng)中。

2.2.1 與RDBMS比較

HBase通過在HDFS上提供隨機讀寫來解決Hadoop不能處理的問題。HBase自底層設(shè)計開始即聚焦于各種可伸縮性問題：表可以很“高”，有數(shù)十億個數(shù)據(jù)行；也可以很“寬”，有數(shù)百萬個列；水平分區(qū)并在上千個普通商用機節(jié)點上自動復(fù)制。表的模式是物理存儲的直接反映，使系統(tǒng)有可能提高高效的數(shù)據(jù)結(jié)構(gòu)的序列化、存儲和檢索。

而RDBMS是模式固定、面向行的數(shù)據(jù)庫且具有ACID性質(zhì)和復(fù)雜的SQL查詢處理引擎，強調(diào)事物的強一致性（strong consistency）、參照完整性（referential integrity）、數(shù)據(jù)抽象與物理存儲層相對獨立，以及基于SQL語言的復(fù)雜查詢支持。

2.2.2 HBase特性

簡單列舉下HBase的關(guān)鍵特性。

沒有真正的索引：行是順序存儲的，每行中的列也是，所以不存在索引膨脹的問題，而且插入性能和表的大小有關(guān)。

自動分區(qū)：在表增長的時候，表會自動分裂成區(qū)域（region），并分布到可用的節(jié)點上。

線性擴展：對于新增加的節(jié)點，區(qū)域自動重新進行平衡，負載會均勻分布。

容錯：大量的節(jié)點意味著每個節(jié)點重要性并不突出，所以不用擔心節(jié)點失效問題。

批處理：與MapReduce的集成可以全并行地進行分布式作業(yè)。

2.3 MapReduce

MapReduce是一種可用于數(shù)據(jù)處理的編程模型，是一個簡單易用的軟件框架，基于它寫出來的應(yīng)用程序能夠運行在由上千個商用機器組成的大型集群上，并以一種可靠容錯的方式并行處理上T級別的數(shù)據(jù)集。

2.3.1 Map & Reduce

一個Map/Reduce 作業(yè)（job）通常會把輸入的數(shù)據(jù)集切分為若干獨立的數(shù)據(jù)塊，由 map任務(wù)以完全并行的方式處理它們�？蚣軙䦟ap的輸出先進行排序，然后把結(jié)果輸入給reduce任務(wù)。通常作業(yè)的輸入和輸出都會被存儲在文件系統(tǒng)（一般為HDFS）中。整個框架負責任務(wù)的調(diào)度和監(jiān)控（jobtracker協(xié)調(diào)作業(yè)的運作，tasktracker運行作業(yè)劃分后的任務(wù)），以及重新執(zhí)行已經(jīng)失敗的任務(wù)。

通常，Map/Reduce框架和分布式文件系統(tǒng)是運行在一組相同的節(jié)點上的，也就是說，計算節(jié)點和存儲節(jié)點通常在一起。這種配置允許框架在那些已經(jīng)存好數(shù)據(jù)的節(jié)點上高效地調(diào)度任務(wù)，這可以使整個集群的網(wǎng)絡(luò)帶寬被非常高效地利用。

2.3.2 Matser/Slave架構(gòu)

Map/Reduce框架由一個單獨的master JobTracker 和每個集群節(jié)點一個slave TaskTracker共同組成。master負責調(diào)度構(gòu)成一個作業(yè)的所有任務(wù)，這些任務(wù)分布在不同的slave上，master監(jiān)控它們的執(zhí)行，重新執(zhí)行已經(jīng)失敗的任務(wù)。而slave僅負責執(zhí)行由master指派的任務(wù)。

應(yīng)用程序至少應(yīng)該指明輸入/輸出的位置（路徑），并通過實現(xiàn)合適的接口或抽象類提供map和reduce函數(shù)。再加上其他作業(yè)的參數(shù)，就構(gòu)成了作業(yè)配置（jobconfiguration）。然后，Hadoop的 job client提交作業(yè)（jar包/可執(zhí)行程序等）和配置信息給JobTracker，后者負責分發(fā)這些軟件和配置信息給slave、調(diào)度任務(wù)并監(jiān)控它們的執(zhí)行，同時提供狀態(tài)和診斷信息給job-client。

2.4 Zookeeper

Zookeeper是一個高可用的分布式數(shù)據(jù)管理與系統(tǒng)協(xié)調(diào)框架。簡單的說，就是個分布式協(xié)調(diào)器。它以主從的架構(gòu)，基于Paxos算法實現(xiàn)，保證了分布式環(huán)境中數(shù)據(jù)的強一致性，也因此各種分布式開源項目中都有它的身影。

2.4.1 Zookeeper機制

Zookeeper的核心是一個精簡的文件系統(tǒng)，它的原語操作是一組豐富的構(gòu)件（building block），可用于實現(xiàn)很多協(xié)調(diào)數(shù)據(jù)結(jié)構(gòu)和協(xié)議，包括分布式隊列、分布式鎖和一組同級節(jié)點中的“領(lǐng)導(dǎo)者選舉”（leader election）。

Zookeeper實現(xiàn)的是Paxos算法。Zookeeper集群啟動后自動進行l(wèi)eader selection，投票選出一臺機器作為Leader，其他的都是Follower。通過heartbeat的機制，F(xiàn)ollower從Leader獲取命令或者消息，同步自己的數(shù)據(jù)，和Leader保持一致。為了保證數(shù)據(jù)的一致性，只有當半數(shù)以上的Follower的狀態(tài)和Leader成功同步了之后，才認為這次數(shù)據(jù)更新是成功的。為了選舉方便，Zookeeper集群數(shù)目是奇數(shù)。

3.Hadoop在Facebook變得實時

論文主要解釋了Facebook引進Hadoop的原因。結(jié)合自己的需求，F(xiàn)acebook對hadoop進行了更實時的改進。

3.1 HDFS與MySQL的性能互補

HDFS適合大塊地讀取數(shù)據(jù)（推薦節(jié)點是64M），它關(guān)于隨機讀取的工作的accesslatency比較大，所以一般會用大規(guī)模的MySQL集群結(jié)合memcached這樣的緩存工具來做處理。在Facebook中，從Hadoop中產(chǎn)生的類似中間結(jié)果的數(shù)據(jù)會裝載到MySQL集群或者memcached中去，用來被web層使用。

同時，HDFS的順序讀取性能很好。Facebook需求寫方面的高吞吐量，代價低的彈性存儲，同時要求低延遲和硬盤上高效的順序和隨機讀取。MySQL存儲引擎被證明有比較高的隨機讀取能力，但是隨機寫吞吐率比較差。因此，F(xiàn)acebook決定采用Hadoop和HBase來平衡順序和隨機讀取的性能，而不是只采用MySQL集群來不斷嘗試一種難以把握的balance。具體Facebook的需求將在下一節(jié)仔細剖析。

3.2 Facebook需求

Facebook認為，用他們已有的基于MySQL集群的一些解決方案來處理問題已經(jīng)遇到了瓶頸。之前的用例對工作量的擴展是有挑戰(zhàn)性的。在一個RDBMS的環(huán)境下解決非常高的寫吞吐量，大數(shù)據(jù)，不可預(yù)測增長及其他問題變得十分困難。

3.3 選擇Hadoop和HBase原因

采用Hadoop和HBase來解決以上需求的存儲系統(tǒng)方案的原因可以總結(jié)為以下幾點：

彈性：需要能夠用最小的開銷和零宕機修復(fù)時間來對存儲系統(tǒng)增量式地擴容。這里的擴容應(yīng)該指的是可以比較方便地實時增加服務(wù)器臺數(shù)來應(yīng)對一些高峰或者突發(fā)服務(wù)需求。

高的寫吞吐量

高效的硬盤隨機讀寫

高可用性和容災(zāi)

錯誤隔離：當局部數(shù)據(jù)庫掛掉或者服務(wù)器不能提供服務(wù)的時候，讓最少的用戶受到影響。HDFS應(yīng)對這樣的場景還是很不錯的。

讀寫改的原子性：底層存儲系統(tǒng)針對高并發(fā)量的需求

范圍掃描：指特定場景下高效獲取一個范圍結(jié)果集。

HBase已經(jīng)以key-value存儲的方式提供了高一致性的高寫吞吐，且在大規(guī)模數(shù)據(jù)傳送和快速隨機寫以及流式讀方面表現(xiàn)優(yōu)異。它同時保證了行層次的原子性。從數(shù)據(jù)模型的角度看，面向列的實現(xiàn)給數(shù)據(jù)存儲帶來了極高的靈活性，“寬”行允許在一個table內(nèi)存放百萬數(shù)量級的被索引的值。

雖然HDFS的核心namenode的宕機會帶來巨大影響，但是Facebook有信心打造一個在合理時限內(nèi)的高可用的NameNode。根據(jù)一些實踐測試，F(xiàn)acebook對HDFS進行了設(shè)計和改進，主要針對namenode。將在下節(jié)展開。

3.4 實時HDFS

HDFS剛開始是為了支持MapReduce這樣的并行應(yīng)用的數(shù)據(jù)存取的，是面向批處理系統(tǒng)的，所以在實時方面講本身可能是存在不足的。Facebook主要改造在于一個高可用的AvatarNode。

我們知道HDFS的namenode一旦掛掉，整個集群就得等到namenode再次啟動才能繼續(xù)運行提供服務(wù)，所以需要這個熱備份——AvatarNode的設(shè)計。在HDFS啟動的時候，namenode是從一個叫fsimage的文件里讀取文件系統(tǒng)的元數(shù)據(jù)的。元數(shù)據(jù)信息包括了HDFS上所有文件和目錄的名字和元數(shù)據(jù)。但是namenode不會持續(xù)地去存每一塊block的位置信息。所以冷啟動namenode的時候包括兩部分：首先讀文件系統(tǒng)鏡像；然后，大部分datanode匯報進程上的block信息，以此來恢復(fù)集群上每一塊已知block的位置信息。這樣的冷啟動會花很長時間。

雖然一個備用的可用node可以避免failover時候去讀磁盤上的fsimage，但是依然需要從datanodes里獲取block信息。所以，時間相對還是偏長。于是誕生了AvatarNode。

圖2 實時HDFS

如圖所示。HDFS擁有兩個AvatarNode——Active AvatarNode和Standby AvatarNode。他們形成了一對“主被動熱備份”（active-passive-hot-standby）。AvatarNode是對NameNode的包裝。Facebook的HDFS集群都采用NFS來存一份文件系統(tǒng)鏡像的備份和一份事物日志的備份。Active AvatarNode把自己處理的事務(wù)寫進NFS里的事務(wù)日志。同時，StandbyAvatarNode打開NFS上同一份事務(wù)日志，然后在自己的命名空間內(nèi)開始執(zhí)行事務(wù)，以保證自己的命名空間盡可能和初始信息接近。Standby AvatarNode同時照顧到初始信息的核查并創(chuàng)建新的文件系統(tǒng)鏡像，和HDFS相比就沒有了分離的SecondNameNode。

Datanodes同時和兩個AvatarNode交流。這保證了Standby處也獲得到最新的block狀態(tài)信息，以在分鐘時間級內(nèi)轉(zhuǎn)化成為Activer的Node（之前說namenode的冷啟動的時長問題可以解決了）。Avatar DataNode相互之間輸送心跳，block信息匯報和接受到的block。Avatar DataNodes集成了Zookeeper，因此他們知道主節(jié)點信息，會執(zhí)行主節(jié)點發(fā)送的復(fù)制/刪除命令（基于Zookeeper的leader selection和heartbeat機制），而來自Standby AvatarNode的復(fù)制/刪除請求是忽略的。

對于事務(wù)日志的記錄，還進行了一些改進。

（1）為了讓故障和失效盡可能透明，Standby必須知道失效發(fā)生時的block位置信息，所以對每一塊block分配記錄一個額外的記錄日志。這樣允許客戶端在發(fā)生失效的時刻前還是一直在寫文件。

（2）當Standby向正在被Active寫事務(wù)記錄的日志里讀取事務(wù)信息的時候，有可能讀到的是一個局部的事務(wù)。為了避免這樣的問題，給每個要寫進日志里的事務(wù)增加記錄事務(wù)長度信息，事務(wù)id和校驗和。

要了解更具體的信息，可以從原paper中獲得更多具體的情況。

4.HadoopDB

HadoopDB簡單介紹下設(shè)計理念和他的架構(gòu)。

4.1 HadoopDB理念

HadoopDB是一個混合系統(tǒng)�；舅枷胧怯肕apReduce作為與正在運行著單節(jié)點DBMS實例的多樣化節(jié)點的通信層。查詢語言用SQL表示，并用現(xiàn)有工具翻譯成MapReduce可以接受的語言，使得盡可能多的任務(wù)可以被推送到每個高性能的單節(jié)點數(shù)據(jù)庫上。這樣基于MapReduce的并行化的數(shù)據(jù)庫代價幾乎是零。因為MapReduce是現(xiàn)有的。

HadoopDB背后的一些主要思想包括以下兩個關(guān)鍵字：share-nothing MPP架構(gòu)和parallel databases。

4.2 HadoopDB架構(gòu)介紹

圖3 HadoopDB架構(gòu)

作為一個混合的系統(tǒng)，讓我們看看HadoopDB由哪些部分構(gòu)成：HDFS，MapReduce，SMS Planner，DB Connector等等。HadoopDB的核心框架還是Hadoop，具體就是存儲層HDFS，和處理層MapReduce。關(guān)于HDFS上namenode，datanode各自處理任務(wù)，數(shù)據(jù)備份存儲機制以及MapReduce內(nèi)master-slave架構(gòu)，jobtracker和tasktracker各自的工作機制和任務(wù)負載分配，數(shù)據(jù)本地化特性等內(nèi)容就不詳細說了。下面對主要構(gòu)成部件做簡單介紹：

1.Databae Connector：承擔的是node上獨立數(shù)據(jù)庫系統(tǒng)和TaskTracker之間的接口。圖中可以看到每個single的數(shù)據(jù)庫都關(guān)聯(lián)一個datanode和一個tasktracker。他傳輸SQL語句，得到一些KV返回值。擴展了Hadoop的InputFormat，使得與MapReduce框架實現(xiàn)無縫拼接。

2.Catalog：維持數(shù)據(jù)庫的元數(shù)據(jù)信息。包括兩部分：數(shù)據(jù)庫的連接參數(shù)和元數(shù)據(jù)，如集群中的數(shù)據(jù)集，復(fù)本位置，數(shù)據(jù)分區(qū)屬性。現(xiàn)在是以XML來記錄這些元數(shù)據(jù)信息的。由JobTracker和TaskTracker在必要的時候來獲取相應(yīng)信息。

3.Data LOAder：主要職責涉及根據(jù)給定的分區(qū)key來裝載數(shù)據(jù)，對數(shù)據(jù)進行分區(qū)。包含自身兩個主要Hasher：Global Hasher和Local Hasher。簡單地說，Hasher無非是為了讓分區(qū)更加均衡。

4.SMS Planner：SMS是SQL to MapReduce to SQL的縮寫。HadoopDB通過使他們能執(zhí)行SQL請求來提供一個并行化數(shù)據(jù)庫前端做數(shù)據(jù)處理。SMS是擴展了Hive。關(guān)于Hive我在這里不展開介紹了�？傊顷P(guān)于一種融入到MapReduce job內(nèi)的SQL的變種語言，來連接HDFS內(nèi)存放文件的table。

圖3 HadoopDB構(gòu)成部分

5.CoHadoop

論文提出CoHadoop來解決Hadoop無法把相關(guān)的數(shù)據(jù)定位到同一個node集合下的性能瓶頸。CoHadoop是對Hadoop的一個輕量級擴展，目的是允許應(yīng)用層能控制數(shù)據(jù)的存儲。應(yīng)用層通過某種方式提示CoHadoop某些集合里的文件是相關(guān)性比較大的，可能需要合并，之后CoHadoop就嘗試去轉(zhuǎn)移這些文件以提高一定的數(shù)據(jù)讀取效率。

5.1 研究意義

Hadoop++項目其實也做過類似的事，它將同一個job產(chǎn)生的兩個file共同放置，但是當有新文件注入系統(tǒng)的時候，它需要對數(shù)據(jù)重新組織。

CoHadoop的改進主要給以下幾個操作帶來了比較大的好處：索引（indexing），聚合（grouping），聚集（aggregation），縱向存儲（columnar storage），合并（join）以及sessionization。而像日志分析這樣的操作，涉及到的就是把一些參考數(shù)據(jù)合并起來或者進行sessionization。這可以體現(xiàn)CoHadoop的改進意義所在。

以下是paper關(guān)于CoHadoop的總結(jié)：

這是一種很靈活，動態(tài)，輕量級的共置相關(guān)數(shù)據(jù)文件的方案，而且是直接在HDFS上實現(xiàn)的。

在日志處理方面，確定了兩個用例：join和sessionization，使得在查詢處理方面得到了顯著的性能提高。

作者還研究了CoHadoop的容錯，分布式數(shù)據(jù)和數(shù)據(jù)丟失。

在不同的場景下測試了join和sessionization的效果。

接下來還是介紹下CoHadoop的設(shè)計思想。

5.2 改進設(shè)計介紹

HDFS本身存數(shù)據(jù)的時候是有冗余的。默認是存三分拷貝。這三份復(fù)制品會存在不同的地方。最簡單是存在datanode里。默認的存放方式是第一份拷貝存在新建的本地誕生的node的block里（假設(shè)足夠存），這叫寫“親和”（write affinity）。HDFS然后選擇同一機架上的datanode存放第二個拷貝，選擇不同機架上的一個datanode存第三份拷貝。這是HDFS的本來的機制。那么為了實現(xiàn)相關(guān)數(shù)據(jù)的共置存儲，論文修改了存放策略。

以上Hadoop現(xiàn)有的存放策略主要是為了負載均衡，但是當應(yīng)用需要從不同的文件里去取所需的數(shù)據(jù)的時候，如果能自定義一些策略，那可能會得到顯著的提升。輕量級的CoHadoop使得開發(fā)自定義的策略變得簡單。雖然分區(qū)在Hadoop里實現(xiàn)很簡單，但是共置并不容易，Hadoop也沒有提供這樣類似的可行性功能實現(xiàn)。

圖4 CoHadoop的數(shù)據(jù)存放示意圖

如圖是CoHadoop的數(shù)據(jù)存放示意圖。CoHadoop擴展了HDFS，提出了新的文件層屬性——locator，并且修改了Hadoop的數(shù)據(jù)存放策略以使用這個locator。假設(shè)每個locator由一個整數(shù)值表示（也可以是別的表示方法），那么文件和locator之間可以是一個N：1的關(guān)系。每個HDFS的文件最多和一個locator關(guān)聯(lián)，同一個locator可以關(guān)聯(lián)很多文件。同一個locator下的文件存在同一個datanode集合里，而沒有l(wèi)ocator映射的文件依舊按照默認的Hadoop的存儲機制存放。圖中的A和B就屬于同一個locator，A文件的兩塊block和B文件的三塊Block結(jié)果存在了同一個datanode集合里。

為了更好地管理和跟蹤這些locator和文件之間的映射信息，設(shè)計了一個新的數(shù)據(jù)結(jié)構(gòu)——locatortable存在namenode里。它存放了每個locator映射的文件集。圖中也可以看到。當namenode運行的時候，locator table是在內(nèi)存里動態(tài)維護的。

關(guān)于數(shù)據(jù)存放策略的修改是這么做的：只要有一個新的和locator l關(guān)聯(lián)的文件f被創(chuàng)建，會去locator table里查詢是否存在一個實例是屬于這個locator l的。如果不存在，就新增一條（l，f）在table里，并用HDFS默認的存放方式存這份文件的拷貝們。如果已經(jīng)存在，就可以知道這個l映射的file list，如果從現(xiàn)有的存放了這個list內(nèi)的文件的r個datanode里按一定方式（考慮空間）選出幾個用于存新來的文件的拷貝的節(jié)點，存放這份文件的拷貝們。大致的意思就是這樣。

關(guān)于日志的join和sessionization的改進，就不展開了。簡單貼兩個圖。

圖5 日志join的改進

圖6 日志sessionization的改進

做sessionization，對于日志處理時候MapReduce計算的影響比較。

6.總結(jié)

雖然我對Hadoop有濃厚的興趣，但是自己所能接觸到的項目和環(huán)境，都沒有到達一個比較飽和的需求點。要做分布式存儲？根本用不著動用HBase或者別的NoSQL組成的分布式集群，只需要一個分布式的MySQL集群就可以了，NoSQL可以做的事，其實MySQL何嘗不能完成？只是說NoSQL對某些數(shù)據(jù)的存儲，在某些讀寫性能上有局部的個性化的優(yōu)勢而已。更不必說要用MapReduce去完成什么樣大規(guī)模，TB級數(shù)據(jù)的分布式并行計算了。在數(shù)據(jù)和硬件設(shè)施方面，以至到技術(shù)程度方面，學(xué)校里都沒有滿足條件，沒有如此的需求。

學(xué)校的課程里也沒有涉及到分布式的內(nèi)容。分布式文件系統(tǒng)/存儲/索引之類的話題一直是存在于企業(yè)級別，存在于大公司大數(shù)據(jù)基礎(chǔ)和服務(wù)器集群基礎(chǔ)的。學(xué)校里偶爾可以聽到如阿里開的關(guān)于分布式的講座，也是很基礎(chǔ)的，淺嘗截止。

出生在什么樣的年代，就會接觸什么樣的技術(shù)。學(xué)習(xí)什么樣的技術(shù)，就能充實自己成什么樣的技術(shù)人才。把握Hadoop，把握時代的核心技術(shù)，就掌握了現(xiàn)在大數(shù)據(jù)時代，甚至可以遇見并操控未來！

核心關(guān)注：拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用，蘊涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務(wù)管理理念，功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理，全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域，是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。

轉(zhuǎn)載請注明出處：拓步ERP資訊網(wǎng)http://www.ezxoed.cn/

本文標題：Hadoop 的分布式架構(gòu)改進與應(yīng)用

本文網(wǎng)址：http://www.ezxoed.cn/html/support/11121511713.html

關(guān)鍵詞標簽： Hadoop 的分布式架構(gòu)改進與應(yīng)用,Hadoop Hadoop分布式架構(gòu) HadoopDB架構(gòu),ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進銷存軟件,財務(wù)軟件,倉庫管理軟件,生產(chǎn)管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費ERP,免費ERP軟件,免費ERP系統(tǒng),ERP軟件免費下載,ERP系統(tǒng)免費下載,免費ERP軟件下載,免費進銷存軟件,免費進銷存,免費財務(wù)軟件,免費倉庫管理軟件,免費下載,

本文轉(zhuǎn)自：e-works制造業(yè)信息化門戶網(wǎng)

本文來源于互聯(lián)網(wǎng)，拓步ERP資訊網(wǎng)本著傳播知識、有益學(xué)習(xí)和研究的目的進行的轉(zhuǎn)載，為網(wǎng)友免費提供，并盡力標明作者與出處，如有著作權(quán)人或出版方提出異議，本站將立即刪除。如果您對文章轉(zhuǎn)載有任何疑問請告之我們，以便我們及時糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇：虛擬化鑄就新型運維安全模式

下一篇：信息安全管理體系與等級保護管理要求

相關(guān)文章

服務(wù)支持

拓步ERP系統(tǒng)軟件平臺11.5專業(yè)版v10.1.2...

拓步ERP系統(tǒng)軟件平臺11.5標..

金蝶KIS財務(wù)軟件標準版V8.1..

金蝶KIS財務(wù)軟件迷你版V8.1..

金蝶KIS工業(yè)貿(mào)易專業(yè)版V12...

SQL2000 4in1 ISO..

MSDE2000 SP4 簡體中..

金蝶KIS商貿(mào)高級版V4.0|破..

金蝶KIS財務(wù)軟件行政事業(yè)版V9..

金蝶KIS零售版V4.1|破解版..

熱門培訓(xùn)視頻

拓步ERP系統(tǒng)平臺庫存管理系統(tǒng)培訓(xùn)視頻教材

拓步ERP系統(tǒng)平臺客戶端安裝培訓(xùn)..

拓步ERP財務(wù)管理系統(tǒng)培訓(xùn)視頻

拓步ERP系統(tǒng)平臺數(shù)據(jù)庫安裝培訓(xùn)..

拓步ERP系統(tǒng)平臺通用操作培訓(xùn)視..

拓步ERP系統(tǒng)平臺采購管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺考勤管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務(wù)報表系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務(wù)總帳系統(tǒng)培..

拓步ERP系統(tǒng)平臺應(yīng)收帳款系統(tǒng)培..

熱門電子圖書

拓步ERP財務(wù)管理系統(tǒng)電子圖書

熱門管理軟件

拓步ERP系統(tǒng)管理軟件介紹

拓步ERP平臺系列旗艦版

拓步ERP生產(chǎn)系列標準版（進銷存..

拓步ERP業(yè)務(wù)系列倉存版（倉庫管..

拓步ERP平臺系列標準版

拓步ERP財務(wù)系列迷你版（財務(wù)管..

拓步ERP條碼系列業(yè)務(wù)標準版（條..

拓步ERP平臺系列企業(yè)版

拓步ERP平臺系列專業(yè)版

拓步ERP行業(yè)系列電子行業(yè)版

最新服務(wù)支持

談3D可視化系統(tǒng)在工業(yè)4.0三項集成的應(yīng)用

互聯(lián)網(wǎng)+智能家裝TOP50新鮮出..

淺談業(yè)務(wù)流程治理

解析工業(yè)4.0系列專欄—— 德國..

工業(yè)物聯(lián)網(wǎng)應(yīng)用場景及系統(tǒng)構(gòu)建

數(shù)據(jù)中心四大災(zāi)備技術(shù)解析

2015網(wǎng)絡(luò)、數(shù)據(jù)中心和云該期待..

如何利用云服務(wù)創(chuàng)建強大的備份策略

《中國制造2025》的總體思路圖

未來數(shù)據(jù)中心UPS需求趨勢

點擊

聯(lián)系ERP系統(tǒng)咨詢顧問
點擊

聯(lián)系ERP系統(tǒng)售前顧問-1
點擊

聯(lián)系ERP系統(tǒng)售前顧問-2


	ERP新聞動態(tài) 拓步新聞行業(yè)新聞關(guān)注產(chǎn)品觀點縱橫企業(yè)管理企業(yè)應(yīng)用

	ERP解決方案按ERP應(yīng)用行業(yè)分類按ERP企業(yè)規(guī)模分類按ERP管理領(lǐng)域分類按ERP軟件功能分類按ERP系統(tǒng)特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風險分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標 ERP實施監(jiān)理 ERP評審驗收 ERP績效評價 ERP基礎(chǔ)知識 ERP課程培訓(xùn) ERP培訓(xùn)教育 ERP視頻教材

	CIO技術(shù)專欄 CIO企業(yè)應(yīng)用 CIO網(wǎng)絡(luò)通信 CIO信息安全 CIO基礎(chǔ)設(shè)施 CIO云計算

	ERP技術(shù)支持技術(shù)支持知識庫常見問題資料庫在線學(xué)習(xí)資料庫日常辦公資料庫企業(yè)管理知識庫

	ERP系統(tǒng)價格拓步ERP系統(tǒng)價格體系拓步EIS軟件價格體系合作品牌ERP價格體系技術(shù)支持服務(wù)價格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數(shù)碼Digital 速達SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術(shù)支持快速搜索ERP軟件資訊

	關(guān)于拓步公司介紹公司愿景企業(yè)文化誠聘英才聯(lián)系我們在線留言在線訂購意向下載體驗登記

2021色婷婷综合久久久_国产亚洲午夜高清国产亚洲_亚洲开心婷婷中文字幕_亚洲国产中文精品字幕第一页_国产综合免费视频

ERP技術(shù)支持

技術(shù)支持知識庫

常見問題資料庫

在線學(xué)習(xí)資料庫

日常辦公資料庫

企業(yè)管理知識庫

ERP系統(tǒng)教程

ERP免費下載

ERP在線咨詢

即時聯(lián)系

服務(wù)熱線

快捷互動

猜您喜歡