| 當(dāng)前位置：拓步ERP資訊網(wǎng) >>新聞動(dòng)態(tài) >>企業(yè)應(yīng)用

www.ezxoed.cn拓步ERP|ERP系統(tǒng)|ERP軟件|ERP管理系統(tǒng)軟件|免費(fèi)ERP系統(tǒng)|免費(fèi)ERP軟件|免費(fèi)進(jìn)銷存軟件|免費(fèi)倉庫管理軟件|免費(fèi)下載專業(yè)資訊網(wǎng)-大數(shù)據(jù)架構(gòu)的未來

大數(shù)據(jù)架構(gòu)的未來

發(fā)布日期：2016-3-17 9:10:35 來源：www.ezxoed.cn 編輯：拓步ERP資訊網(wǎng) 瀏覽：評(píng)論

摘要：或許所有讀者都明白這一點(diǎn)：數(shù)據(jù)正在飛速增長(zhǎng)，若是能夠有效利用的話，我們能從這些數(shù)據(jù)中找到非常有價(jià)值的見解。 原標(biāo)題：大數(shù)據(jù)架構(gòu)的未來 原作者：2016/3/15 來源：36大數(shù)據(jù) 作者：佚名
關(guān)鍵字：大數(shù)據(jù) 大數(shù)據(jù)架構(gòu) 數(shù)據(jù)湖

       大數(shù)據(jù)的問題

       或許所有讀者都明白這一點(diǎn)：數(shù)據(jù)正在飛速增長(zhǎng)，若是能夠有效利用的話，我們能從這些數(shù)據(jù)中找到非常有價(jià)值的見解；傳統(tǒng)技術(shù)有很多都是在40年前設(shè)計(jì)的，比如RDBMSs，不足以創(chuàng)造“大數(shù)據(jù)”炒作所宣稱的商業(yè)價(jià)值。在大數(shù)據(jù)技術(shù)的使用上，常見的案例是“客戶單一視圖”；將關(guān)于客戶所知道的一切內(nèi)容放在一起，以便最大化服務(wù)提供與自身收入，比如確定具體需要采用什么促銷方式，又是在什么時(shí)候、通過什么渠道來發(fā)送。

       盡管大數(shù)據(jù)的問題在于，讓我們將這種潛力變?yōu)楝F(xiàn)實(shí)，高等級(jí)的關(guān)鍵功能至少包括下面這些能力：

       合并信息孤井、外在因素與數(shù)據(jù)流；

       ·控制數(shù)據(jù)訪問；

       ·根據(jù)需要轉(zhuǎn)化數(shù)據(jù)；

       ·整合數(shù)據(jù)；

       ·為數(shù)據(jù)分析提供工具；

       ·發(fā)布數(shù)據(jù)報(bào)告；

       ·將見解體現(xiàn)在運(yùn)營過程中；

       ·最小化工作完成的總擁有成本與響應(yīng)時(shí)間。

       用數(shù)據(jù)湖作為答案

       很多公司正在觀望一個(gè)被某些人稱為數(shù)據(jù)湖的架構(gòu)，這個(gè)數(shù)據(jù)平臺(tái)在合并信息孤井?dāng)?shù)據(jù)流以及在單獨(dú)的邏輯位置中執(zhí)行數(shù)據(jù)持久化方面具有靈活性，能夠從企業(yè)自身以及第三方的數(shù)據(jù)中挖掘出見解。將Hadoop（包括Spark在內(nèi)）用于數(shù)據(jù)湖已成大勢(shì)所趨，原因很多：使用總擁有成本較低的普通硬件就能進(jìn)行擴(kuò)展，允許用讀時(shí)模式（schema-on-read）收取大量數(shù)據(jù)，支持開源，包括用SQL和普通語言構(gòu)建分布式處理層。此外，像雅虎和谷歌這樣的webscale公司都是早期標(biāo)桿，借用這種架構(gòu)在解決網(wǎng)站索引相關(guān)的問題時(shí)獲得了巨大的成功。

       Hadoop中的數(shù)據(jù)持久化選項(xiàng)

       這樣一來，從這里開始評(píng)估數(shù)據(jù)湖解決方案的前景似乎很合理。一旦開始從更深的層次理解Hadoop的內(nèi)涵，你就會(huì)發(fā)現(xiàn)里面所包含的項(xiàng)目真的是包羅萬象，涵蓋了數(shù)據(jù)處理的方方面面。用Hadoop在數(shù)據(jù)湖中探測(cè)存儲(chǔ)的數(shù)據(jù)時(shí)，有兩個(gè)主要選項(xiàng)：HDFS和HBase。使用HDFS時(shí)，可以自行決定如何在只添加文件中對(duì)數(shù)據(jù)進(jìn)行編碼，包括JSON、CSV、Avro等等，因?yàn)镠DFS只是一個(gè)文件系統(tǒng)，編碼方式全由你決定。相反，HBase是一個(gè)數(shù)據(jù)庫，其特有的數(shù)據(jù)編碼方式可以將記錄寫入的速度最優(yōu)化，在通過主鍵查詢時(shí)執(zhí)行只讀的速度相對(duì)也很快。

       這也是用Hadoop的數(shù)據(jù)湖之魅力所在，它能實(shí)現(xiàn)真實(shí)情況下的需求。因此，我們就能使用Hadoop來執(zhí)行上面列出的高層次需求了。在像Spark和Hive這樣的Hadoop生態(tài)系統(tǒng)中，仍需用到分布式處理層，但不需HDFS或HBase了，因此你可以從分布式處理層中選擇持久化層面。之前的博文中有相關(guān)案例，描述了使用Spark在MongoDB中讀寫數(shù)據(jù)。還有一篇博文也很類似，證明了MongoDB只是讀取數(shù)據(jù)的另一個(gè)Hive表格。

       索引仍舊很重要

       大多熟悉RDBMSs的技術(shù)人員發(fā)現(xiàn)，從表達(dá)查詢能力到二級(jí)索引，再到加速查詢?nèi)純r(jià)值巨大（即便模式固定、總擁有成本高以及RDBMSs的可擴(kuò)展性有限，這些使得它很難被用作數(shù)據(jù)湖）。如果我們?cè)跀?shù)據(jù)庫持久化中只用到HDFS和HBase，就無法實(shí)現(xiàn)我們期待的數(shù)據(jù)庫臨時(shí)索引了，特別是遇到下面幾個(gè)限制時(shí)：

       臨時(shí)切片：不通過二級(jí)索引，我們?nèi)绾螌?duì)不止一個(gè)主鍵標(biāo)識(shí)出的數(shù)據(jù)切片進(jìn)行有效地分析呢，例如對(duì)我們的最佳客戶——那些消費(fèi)金額超過X的客戶進(jìn)行分析？由于數(shù)據(jù)太過巨大，想要通過掃描找出最佳客戶都會(huì)令工作卡住。

       低延遲報(bào)告：如果沒有靈活的索引方式，我們?nèi)绾卧诖蚊爰?jí)時(shí)間內(nèi)響應(yīng)客戶的需求，為他們提供有價(jià)值的數(shù)據(jù)報(bào)告呢？再次，我們只能使用消費(fèi)者的賬戶號(hào)或者其他主鍵來進(jìn)行快速報(bào)告，而不是通過消費(fèi)者的姓名、電話號(hào)碼、郵編、花費(fèi)等等。特別提到：MongoDB剛剛為基于SQL的報(bào)告工具發(fā)布了BI Connector。

       運(yùn)營化：同樣地，我們?nèi)绾螌⒂袃r(jià)值的見解引入應(yīng)用運(yùn)營中，從而在最大化影響公司和消費(fèi)者的同時(shí)將數(shù)據(jù)變現(xiàn)？想象一下客服專員（CSR）告知消費(fèi)者，因?yàn)閿?shù)據(jù)湖僅支持這個(gè)主鍵，他必須提供賬號(hào)才能查詢所有的信息；或者查詢需要10分鐘時(shí)間。

       當(dāng)然，其中有些問題可以通過變通方法解決，不過會(huì)導(dǎo)致總擁有成本更高、開發(fā)或運(yùn)營工作更多、延遲也更高。例如，使用搜索引擎或者實(shí)體化視圖而不是通過主鍵來查詢；不過稍后還需返回到數(shù)據(jù)庫，在有完整記錄的數(shù)據(jù)庫中對(duì)主表進(jìn)行再次查詢，以獲得所需的完整信息。除了延遲翻倍之外，還需要耗費(fèi)額外的管理、開發(fā)工作，以及單獨(dú)搜索引擎需要的基礎(chǔ)設(shè)施，還有實(shí)體化視圖所需的維護(hù)，加上將數(shù)據(jù)寫入到其他地方造成的一致性問題。保持我們的設(shè)計(jì)原則，只用我們用慣的普通靈活索引不是很好么？

       MongoDB是一個(gè)有效數(shù)據(jù)湖的重要部分

圖大數(shù)據(jù)架構(gòu)

       我們開始討論，探索單用Hadoop是否能滿足數(shù)據(jù)湖的需求，并發(fā)現(xiàn)了至少3個(gè)問題。我們能否在架構(gòu)中另加一層持久化層面來解決這些問題，同時(shí)保持設(shè)計(jì)原則——使用低總擁有成本的普通硬件、開源模式、讀時(shí)模式還有Hadoop分布式數(shù)據(jù)層——與之前一致呢？

       我選擇本文的主題是因?yàn)�，MongoDB就是在Hadoop-only數(shù)據(jù)湖中，補(bǔ)位最優(yōu)秀的數(shù)據(jù)庫。如果使用另一個(gè)開源NoSQL數(shù)據(jù)庫，就會(huì)發(fā)現(xiàn)其中幾乎不含二級(jí)索引（使用二級(jí)索引會(huì)導(dǎo)致無法同步數(shù)據(jù)），也沒有分組和聚合功能。你可以使用其中一些數(shù)據(jù)庫將數(shù)據(jù)寫入數(shù)據(jù)湖，不過如果出于商業(yè)需求想要以靈活的方式使用二級(jí)索引讀取的話，是做不到的。如果想要在數(shù)據(jù)湖中使用開源RDBMS，我們已經(jīng)說過，它們固定的模式、昂貴的垂直擴(kuò)展模型都違背了我們?cè)O(shè)計(jì)數(shù)據(jù)湖的原則。

       因此，推薦使用下面的架構(gòu)來構(gòu)建數(shù)據(jù)湖。

       MongoDB對(duì)數(shù)據(jù)湖非常重要

       這個(gè)架構(gòu)將MongoDB作為持久化層面加入任何需要表達(dá)查詢的數(shù)據(jù)集中，正與你需要索引的三個(gè)原因（上面列舉了）相關(guān)。由于需求數(shù)據(jù)來自消費(fèi)者，無論是否將數(shù)據(jù)發(fā)布到HDFS和/或MongoDB中，我推薦用governance function來確定。無論存儲(chǔ)到HDFS或者M(jìn)ongoDB上，就可以運(yùn)行分布式處理任務(wù)，比如Hive和Spark。不過如果數(shù)據(jù)在MongoDB上，因?yàn)楹Y選標(biāo)準(zhǔn)下放到數(shù)據(jù)庫中，不像在HDFS中那樣掃描文件，你就能在數(shù)據(jù)臨時(shí)切片上運(yùn)行有效分析了。與此相似，MongoDB中的數(shù)據(jù)也可用于實(shí)時(shí)、低延遲報(bào)告，并為構(gòu)建的應(yīng)用所用到的所有系統(tǒng)提供運(yùn)營數(shù)據(jù)平臺(tái)服務(wù)。

       如今一些公司只是將數(shù)據(jù)復(fù)制到Hadoop中進(jìn)行轉(zhuǎn)換，然后再復(fù)制到其他地方，用于完成有價(jià)值的工作。為什么不直接利用數(shù)據(jù)湖，發(fā)揮最大價(jià)值呢？使用MongoDB可以將價(jià)值多次翻倍。

       結(jié)論

       觀察長(zhǎng)期與短期需求，確保這些需求可以通過核心Hadoop分布中的最佳工具，以及MongoDB這樣的生態(tài)環(huán)境實(shí)現(xiàn)，數(shù)據(jù)湖對(duì)你而言就是有價(jià)值且而可行的。一些企業(yè)在使用數(shù)據(jù)湖時(shí)，只花費(fèi)一年時(shí)間清洗所有數(shù)據(jù)，然后將其寫入HDFS，希望在未來能用這些數(shù)據(jù)獲取價(jià)值。結(jié)果卻失望地發(fā)現(xiàn)這些數(shù)據(jù)毫無價(jià)值，事實(shí)上在數(shù)據(jù)與消費(fèi)者之間還存在另一種batch layer層面。

       通過將Hadoop與MongoDB合并，數(shù)據(jù)庫可以確保成功，并是一個(gè)保持較低的總擁有成本，最快響應(yīng)所有用戶（數(shù)據(jù)科學(xué)家、分析師、商業(yè)用戶、消費(fèi)者自身）的靈活數(shù)據(jù)平臺(tái)。有了數(shù)據(jù)湖，公司和員工就能用它來獲取獨(dú)特的見解，與客戶進(jìn)行有效溝通，將數(shù)據(jù)變現(xiàn)并戰(zhàn)勝競(jìng)爭(zhēng)對(duì)手。

核心關(guān)注：拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用，蘊(yùn)涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務(wù)管理理念，功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理，全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域，是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。

轉(zhuǎn)載請(qǐng)注明出處：拓步ERP資訊網(wǎng)http://www.ezxoed.cn/

本文標(biāo)題：大數(shù)據(jù)架構(gòu)的未來

本文網(wǎng)址：http://www.ezxoed.cn/html/news/10515519182.html

關(guān)鍵詞標(biāo)簽： 大數(shù)據(jù)架構(gòu)的未來,大數(shù)據(jù) 大數(shù)據(jù)架構(gòu) 數(shù)據(jù)湖,ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進(jìn)銷存軟件,財(cái)務(wù)軟件,倉庫管理軟件,生產(chǎn)管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費(fèi)ERP,免費(fèi)ERP軟件,免費(fèi)ERP系統(tǒng),ERP軟件免費(fèi)下載,ERP系統(tǒng)免費(fèi)下載,免費(fèi)ERP軟件下載,免費(fèi)進(jìn)銷存軟件,免費(fèi)進(jìn)銷存,免費(fèi)財(cái)務(wù)軟件,免費(fèi)倉庫管理軟件,免費(fèi)下載,

本文轉(zhuǎn)自：e-works制造業(yè)信息化門戶網(wǎng)

本文來源于互聯(lián)網(wǎng)，拓步ERP資訊網(wǎng)本著傳播知識(shí)、有益學(xué)習(xí)和研究的目的進(jìn)行的轉(zhuǎn)載，為網(wǎng)友免費(fèi)提供，并盡力標(biāo)明作者與出處，如有著作權(quán)人或出版方提出異議，本站將立即刪除。如果您對(duì)文章轉(zhuǎn)載有任何疑問請(qǐng)告之我們，以便我們及時(shí)糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇：沒有了！

下一篇： iPaaS實(shí)現(xiàn)的四個(gè)炫酷用例

相關(guān)文章

新聞動(dòng)態(tài)

拓步ERP系統(tǒng)軟件平臺(tái)11.5專業(yè)版v10.1.2...

拓步ERP系統(tǒng)軟件平臺(tái)11.5標(biāo)..

金蝶KIS財(cái)務(wù)軟件標(biāo)準(zhǔn)版V8.1..

金蝶KIS財(cái)務(wù)軟件迷你版V8.1..

金蝶KIS工業(yè)貿(mào)易專業(yè)版V12...

SQL2000 4in1 ISO..

MSDE2000 SP4 簡(jiǎn)體中..

金蝶KIS商貿(mào)高級(jí)版V4.0|破..

金蝶KIS財(cái)務(wù)軟件行政事業(yè)版V9..

金蝶KIS零售版V4.1|破解版..

拓步ERP倉庫管理軟件財(cái)務(wù)管理軟件進(jìn)銷存管理軟件免費(fèi)下載免費(fèi)使用

熱門培訓(xùn)視頻

拓步ERP系統(tǒng)平臺(tái)庫存管理系統(tǒng)培訓(xùn)視頻教材

拓步ERP系統(tǒng)平臺(tái)客戶端安裝培訓(xùn)..

拓步ERP財(cái)務(wù)管理系統(tǒng)培訓(xùn)視頻

拓步ERP系統(tǒng)平臺(tái)數(shù)據(jù)庫安裝培訓(xùn)..

拓步ERP系統(tǒng)平臺(tái)通用操作培訓(xùn)視..

拓步ERP系統(tǒng)平臺(tái)采購管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺(tái)考勤管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺(tái)財(cái)務(wù)報(bào)表系統(tǒng)培..

拓步ERP系統(tǒng)平臺(tái)財(cái)務(wù)總帳系統(tǒng)培..

拓步ERP系統(tǒng)平臺(tái)應(yīng)收帳款系統(tǒng)培..

熱門電子圖書

拓步ERP財(cái)務(wù)管理系統(tǒng)電子圖書

熱門管理軟件

拓步ERP系統(tǒng)管理軟件介紹

拓步ERP平臺(tái)系列旗艦版

拓步ERP生產(chǎn)系列標(biāo)準(zhǔn)版（進(jìn)銷存..

拓步ERP業(yè)務(wù)系列倉存版（倉庫管..

拓步ERP平臺(tái)系列標(biāo)準(zhǔn)版

拓步ERP財(cái)務(wù)系列迷你版（財(cái)務(wù)管..

拓步ERP條碼系列業(yè)務(wù)標(biāo)準(zhǔn)版（條..

拓步ERP平臺(tái)系列企業(yè)版

拓步ERP平臺(tái)系列專業(yè)版

拓步ERP行業(yè)系列電子行業(yè)版

最新新聞動(dòng)態(tài)

大數(shù)據(jù)架構(gòu)的未來

iPaaS實(shí)現(xiàn)的四個(gè)炫酷用例

Android應(yīng)用安全報(bào)告：惡意..

互聯(lián)網(wǎng)物流，能落地才是關(guān)鍵

我國智能制造產(chǎn)業(yè)鏈結(jié)構(gòu)及投資機(jī)遇..

新環(huán)境下電商物流模式思考

格力：直面智能家居的挑戰(zhàn)

移動(dòng)化辦公：Saas的3種困境和..

中國制造2025離散制造業(yè)智能工..

供應(yīng)鏈管理的六大驅(qū)動(dòng)力分析

點(diǎn)擊

聯(lián)系ERP系統(tǒng)咨詢顧問
點(diǎn)擊

聯(lián)系ERP系統(tǒng)售前顧問-1
點(diǎn)擊

聯(lián)系ERP系統(tǒng)售前顧問-2


	ERP新聞動(dòng)態(tài) 拓步新聞行業(yè)新聞關(guān)注產(chǎn)品觀點(diǎn)縱橫企業(yè)管理企業(yè)應(yīng)用

	ERP解決方案按ERP應(yīng)用行業(yè)分類按ERP企業(yè)規(guī)模分類按ERP管理領(lǐng)域分類按ERP軟件功能分類按ERP系統(tǒng)特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達(dá)ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風(fēng)險(xiǎn)分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標(biāo) ERP實(shí)施監(jiān)理 ERP評(píng)審驗(yàn)收 ERP績(jī)效評(píng)價(jià) ERP基礎(chǔ)知識(shí) ERP課程培訓(xùn) ERP培訓(xùn)教育 ERP視頻教材

	CIO技術(shù)專欄 CIO企業(yè)應(yīng)用 CIO網(wǎng)絡(luò)通信 CIO信息安全 CIO基礎(chǔ)設(shè)施 CIO云計(jì)算

	ERP技術(shù)支持技術(shù)支持知識(shí)庫常見問題資料庫在線學(xué)習(xí)資料庫日常辦公資料庫企業(yè)管理知識(shí)庫

	ERP系統(tǒng)價(jià)格拓步ERP系統(tǒng)價(jià)格體系拓步EIS軟件價(jià)格體系合作品牌ERP價(jià)格體系技術(shù)支持服務(wù)價(jià)格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數(shù)碼Digital 速達(dá)SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術(shù)支持快速搜索ERP軟件資訊

	關(guān)于拓步公司介紹公司愿景企業(yè)文化誠聘英才聯(lián)系我們在線留言在線訂購意向下載體驗(yàn)登記

2021色婷婷综合久久久_国产亚洲午夜高清国产亚洲_亚洲开心婷婷中文字幕_亚洲国产中文精品字幕第一页_国产综合免费视频

拓步新聞

行業(yè)新聞

關(guān)注產(chǎn)品

觀點(diǎn)縱橫

企業(yè)管理

企業(yè)應(yīng)用

即時(shí)聯(lián)系

服務(wù)熱線

快捷互動(dòng)

猜您喜歡