在BI/DW領(lǐng)域中,圍繞“哪一種
數(shù)據(jù)倉庫架構(gòu)(Data Warehouse Architecture)最佳?”的爭論一直沒有休止,這個問題同時也是企業(yè)在建立DW時需要決策的關(guān)鍵問題。Bill Inmon的集線器架構(gòu)/企業(yè)信息工廠架構(gòu)(Hub and Spoke / CIF – Corporate Information Factory)與Ralph Kimball的數(shù)據(jù)集市/數(shù)據(jù)倉庫總線架構(gòu)(Data Mart Bus Architecture/Data Warehouse Bus Architecture)則是DW架構(gòu)的爭論焦點(diǎn)。
但是,這些爭論一直無法形成統(tǒng)一的結(jié)論。到底哪種DW架構(gòu)最好,不同的BI/DW從業(yè)者在不同的項(xiàng)目中,面對不同企業(yè)的不同情況時,往往持有不同的說法。
2005年,Thilini Ariyachandra 與Hugh Watson針對DW架構(gòu)做了一個深入的調(diào)查,調(diào)查題目為“哪種數(shù)據(jù)倉庫最成功?”,受訪者由454位曾在各種不同規(guī)模的企業(yè)(絕大多數(shù)是美國企業(yè))中參與了DW規(guī)劃與實(shí)施的人員組成,受訪者根據(jù)DW應(yīng)用實(shí)際情況及經(jīng)驗(yàn)體會做出回答。
為了合理設(shè)計(jì)調(diào)查問卷,在調(diào)查問卷中合理設(shè)置調(diào)查對象(參與調(diào)查的DW架構(gòu))和評判標(biāo)準(zhǔn)(影響DW架構(gòu)選擇的因素及判斷DW架構(gòu)成功的因素等)等內(nèi)容,Watson和Ariyachandra邀請了20位專家組成專家組設(shè)計(jì)調(diào)查問卷及判斷標(biāo)準(zhǔn)等,這20位專家包括了DW領(lǐng)域的兩位先驅(qū)——赫赫有名的Bill Inmon和Ralph Kimball。因此我們可以認(rèn)為這份調(diào)查的結(jié)果是權(quán)威可信的。
參與調(diào)查的DW架構(gòu)
參與“哪種數(shù)據(jù)倉庫架構(gòu)最成功?”調(diào)查的5種DW架構(gòu)
2005年DW架構(gòu)調(diào)查情況
調(diào)查結(jié)果顯示集線器架構(gòu)(hub-and-spoke)、總線架構(gòu)(Bus Architecture)、集中式架構(gòu)(Centralized)三種DW架構(gòu)在接受調(diào)查的企業(yè)的DW實(shí)施中均擁有一定的占有率,分別為39%、26%和17%。
不同數(shù)據(jù)倉庫架構(gòu)的占有率 – 2005年調(diào)查
調(diào)查問卷中針對評判DW架構(gòu)是否成功設(shè)置4個方面的考察標(biāo)準(zhǔn),每個方面的標(biāo)準(zhǔn)都都由多個評分項(xiàng)(子因素)構(gòu)成?疾鞓(biāo)準(zhǔn)包括:
1)信息質(zhì)量(Information quality)—— 架構(gòu)能否有效保證數(shù)據(jù)準(zhǔn)確性、完整性和一致性等;
2)系統(tǒng)質(zhì)量(System quality)—— 架構(gòu)的靈活性、可擴(kuò)展性和集成能力等;
3)用戶影響(Individual impacts)—— 架構(gòu)是否方便用戶簡單快速的獲取數(shù)據(jù),圍繞相關(guān)問題以前所未有的方式進(jìn)行分析和探索,從而提高用戶數(shù)據(jù)決策的速度和能力;
4)組織影響(Organizational impacts)—— 架構(gòu)是否滿足業(yè)務(wù)業(yè)務(wù)需求,支持BI相關(guān)分析應(yīng)用,從而保障戰(zhàn)略業(yè)務(wù)目標(biāo)的達(dá)成并改進(jìn)業(yè)務(wù)過程,具有可度量的高投資回報(bào)率(ROI)。
調(diào)查結(jié)果顯示,各種DW架構(gòu)的得分情況如下(評分因素采取7分制,得分越高表示DW架構(gòu)越成功):
從調(diào)查結(jié)果可以看出,獨(dú)立數(shù)據(jù)集市架構(gòu)(Independent Data Marts)各項(xiàng)得分最低,這證明了獨(dú)立數(shù)據(jù)集市架構(gòu)是糟糕的架構(gòu)這一共識是正確的。
集線器架構(gòu)(hub-and-spoke)在企業(yè)范圍內(nèi)構(gòu)建大型數(shù)據(jù)倉庫時應(yīng)用的最為廣泛,同時集線器架構(gòu)也是花費(fèi)最昂貴和最花費(fèi)時間的架構(gòu),另外,集線器架構(gòu)還需要在建設(shè)之前的前期規(guī)劃中投入大量時間和預(yù)算進(jìn)行全面而慎重的考慮。
調(diào)查結(jié)果還顯示出數(shù)據(jù)倉庫總線架構(gòu)、集線器架構(gòu)、集中式架構(gòu)三者得分相近,從而解釋了為什么這幾種架構(gòu)相互競爭的局面長期存在——因?yàn)樗麄冊诟髯蕴囟ǖ膽?yīng)用場景中都同樣成功,在幾個考評角度上沒有哪一種能夠占據(jù)主導(dǎo)地位。
調(diào)查者認(rèn)為經(jīng)過不斷的演化,數(shù)據(jù)倉庫總線架構(gòu)、集線器架構(gòu)、集中式架構(gòu)三者之間在不斷相互借鑒和趨同,三者的趨同主要體現(xiàn)在以下方面:
1)他們的架構(gòu)在趨同 —— 比如集線器架構(gòu)中數(shù)據(jù)集市采用了維度模型,而總線架構(gòu)在改進(jìn)后強(qiáng)調(diào)事實(shí)表中必須納入細(xì)節(jié)粒度的數(shù)據(jù);
2)交付策略在趨同 —— 都開始強(qiáng)調(diào)在做好長期規(guī)劃的前提下實(shí)現(xiàn)短期內(nèi)的成功交付等做法;
3)實(shí)施方法論也在不斷趨同 —— 比如集線器架構(gòu)的自頂向下top down、總線架構(gòu)的自底向上Bottom up及生命周期life cycle等逐漸變得大同小異。
2010年DW架構(gòu)調(diào)查情況
2010年,Watson和Ariyachandra在另一個收集了400多份回答的調(diào)查中,又一次調(diào)查了DW架構(gòu)的占有率,結(jié)果如下所示:
不同數(shù)據(jù)倉庫架構(gòu)的占有率 – 2010年調(diào)查
注:2005年的集線器架構(gòu)(Hub-and-Spoke)和集中式架構(gòu)(Centralized)在上圖2010年的調(diào)查中,已經(jīng)演化為企業(yè)數(shù)據(jù)倉庫架構(gòu)(EDW,Ent
ERPrise Data Warehouse)。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:哪種數(shù)據(jù)倉庫架構(gòu)最成功?
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10839311786.html