當前有很多企業(yè),迫于優(yōu)化IT環(huán)境成本及企業(yè)效率的需要,急需更有效的方式用以管理和維護跨多個數(shù)據(jù)源的數(shù)據(jù)。同時,日益增加的公司治理費用,運營風(fēng)險和法規(guī)制度,也迫使企業(yè)更加重視核心數(shù)據(jù)的管理。特別是近年來,隨著社交媒體的發(fā)展,為應(yīng)對來自社交數(shù)據(jù)大數(shù)據(jù)及云數(shù)據(jù)管理提出了挑戰(zhàn),企業(yè)對開始將主數(shù)據(jù)管理(MDM,Master data Management)應(yīng)用于企業(yè)中。
Gartner曾經(jīng)過在近期做過一次調(diào)查,2012年全球主數(shù)據(jù)管理軟件的銷量將達到19億美元,較2011年增長21%。在未來5年里,主數(shù)據(jù)管理軟件的銷量將繼續(xù)強勁增長,在2015年達到32億美元。
不過,Gartner同時也指出,當前主數(shù)據(jù)管理的需求仍然是北美和歐洲地區(qū)最大,這兩個區(qū)域的MDM軟件銷量將穩(wěn)步增長,并分別于2013年和2015年達到10億美元大關(guān)。在2013年,MDM軟件收入將在亞洲/太平洋(601099,股吧)地區(qū)實現(xiàn)較快增長,收入將較2012年增長30%,至2.09億美元。
主數(shù)據(jù)管理市場需求以超過20%的速度在逐年增大,在這一領(lǐng)域競爭的廠商也在逐漸增多。通常認為,MDM市場的三大領(lǐng)軍者分別為IBM,甲骨文和SAP。但是2011年,在Gartner公布的2011客戶數(shù)據(jù)解決方案主數(shù)據(jù)管理(MDM)魔力象限報告中,則把Informatica列入位居領(lǐng)導(dǎo)者象限。自此,主數(shù)據(jù)管理市場又多了一個實力派的競爭者。
不辨不明:主數(shù)據(jù)的定義
從Gartner的調(diào)查數(shù)據(jù),我們發(fā)現(xiàn)國內(nèi)對于主數(shù)據(jù)管理的價值還有待進一步提高。在這里,編者先大致地介紹一下主數(shù)據(jù)的定義。對于主數(shù)據(jù)的定義有很多不同的定義,綜合起來可以定義為:企業(yè)內(nèi)能夠跨業(yè)務(wù)重復(fù)使用并且需要共享的高價值數(shù)據(jù)。
那么,具體哪些數(shù)據(jù)才是主數(shù)據(jù)呢?例如,客戶供應(yīng)商帳戶組織單位員工合作伙伴位置信息等都是主數(shù)據(jù),而大部分的交易數(shù)據(jù)帳單數(shù)據(jù)等都不是主數(shù)據(jù);而Informatica中國區(qū)首席產(chǎn)品顧問但彬則一針見血地指出,主數(shù)據(jù)是企業(yè)的核心數(shù)據(jù),是企業(yè)最權(quán)威一致的一系列標識擴展屬和層次關(guān)系,它在企業(yè)運營中擔當著關(guān)鍵角色的數(shù)據(jù)實體。
同時,有些人會將元數(shù)據(jù)和主數(shù)據(jù)混問一談。對此,但彬指出,主數(shù)據(jù)和元數(shù)據(jù)是兩個完全不同的概念。元數(shù)據(jù)是指表示數(shù)據(jù)的相關(guān)信息,比如數(shù)據(jù)定義等,而主數(shù)據(jù)是指實例數(shù)據(jù),比如產(chǎn)品目錄信息等。
主數(shù)據(jù)面臨的難題
但彬認為主數(shù)據(jù)面臨的問題主要有四個方面,其中包括主數(shù)據(jù)的定義流程質(zhì)量和共享等難題。
1 在定義方面,沒有統(tǒng)一的標準沒有明確的定義和范圍。
2 在流程方面,數(shù)據(jù)創(chuàng)建維護等管理流程不一致。
3 在質(zhì)量方面,數(shù)據(jù)缺乏完整性一致性準確性,重復(fù)數(shù)據(jù)多,也導(dǎo)致主數(shù)據(jù)管理難。
4 在共享方面,不知以誰為主共享途徑不暢及訪問控制困難等問題也讓主數(shù)據(jù)共享產(chǎn)生困難。
這些問題的本質(zhì)往往是因為多點維護以及缺乏信任規(guī)則造成的。
精明的IT決策者們正在想方設(shè)法尋找技術(shù)來解決上述問題,而MDM就是恰當之選。MDM是一系列的工具和處理過程,確保企業(yè)主數(shù)據(jù)的高質(zhì)量統(tǒng)一定義和流通便利性,這就正好把主數(shù)據(jù)所面臨的定義流程質(zhì)量和共享等四大難題給一一解決了。
主數(shù)據(jù)管理的三大要素
既然我們已經(jīng)非常清楚主數(shù)據(jù)管理的難題是什么,那么具體該如何化解難題呢?但彬支持主數(shù)據(jù)管理的三個關(guān)鍵點需要確認,包括主數(shù)據(jù)模型主數(shù)據(jù)整合手段和主數(shù)據(jù)服務(wù)等,以幫助解決主數(shù)據(jù)面臨的四大難題。
首先,確定主數(shù)據(jù)模型。企業(yè)需要確定機構(gòu)主數(shù)據(jù)的范圍,然后才是確定機構(gòu)數(shù)據(jù)模型和標準,但幾乎沒有拿來就能用的模型,往往需要根據(jù)不同機構(gòu)的業(yè)務(wù)需求來定義模型,所以主數(shù)據(jù)管理的定制能力很重要,需要支持模型的靈活定義,特別是對未來更多類型主數(shù)據(jù)的支持。
其次,確認主數(shù)據(jù)整合手段。在主數(shù)據(jù)的整合過程中,企業(yè)要選擇的是采用哪種模式進行整合。
一般情況下,整合手段有四種模式:第一種是注冊模式,適用于標示單一的客戶病人產(chǎn)品等;第二種是合并模式,用于支持DI/DW 報表和分析要求,以及法規(guī)遵從等;第三種是共存模式,面向銷售市場客戶服務(wù)支持操作型要求等;第四種是集中模式或交易模式,它同時支持分析型操作型的需求等。不過,這四種模式并不是獨立存在的,往往是多種模式的一個組合,最后,通過SOA服務(wù)方式,將主數(shù)據(jù)管理信息服務(wù)化,供不同應(yīng)用使用。
第三是,配置主數(shù)據(jù)服務(wù)。配置主數(shù)據(jù)服務(wù)是主數(shù)據(jù)管理的關(guān)鍵環(huán)節(jié)。其中,重復(fù)數(shù)據(jù)識別是主數(shù)據(jù)管理中的重要能力,根據(jù)配置的規(guī)則,標示在多個系統(tǒng)中存在的潛在的匹配對象,根據(jù)閾值定義,確定是否匹配,將有疑似的匹配結(jié)果,通過業(yè)務(wù)流程提交人工確認。另外,需要特別說明的是數(shù)據(jù)間的層次關(guān)系,它可以幫助企業(yè)全方位了解信息,其關(guān)鍵要素包括,跨系統(tǒng)跨應(yīng)用能力;為不同的商業(yè)目的, 創(chuàng)建管理多種不同的層次關(guān)系;關(guān)聯(lián)不同的實體,構(gòu)建360度視圖,并且可以保持所有實體關(guān)系歷史。
主數(shù)據(jù)的管理常常被誤解為是個單純的數(shù)據(jù)標準問題,而實際上在企業(yè)內(nèi)部貫徹實施統(tǒng)一的標準需要愿景制度IT等全方位的配合,也就是說,主數(shù)據(jù)管理實質(zhì)上是個管理問題。為MDM建立的獨立信息平臺,最好由業(yè)務(wù)方面的高層來負責,而不是IT部門負責人,因為,很多時候并不是技術(shù)的問題,而是業(yè)務(wù)部門之間的協(xié)調(diào)。
主數(shù)據(jù)管理與數(shù)據(jù)倉庫的區(qū)別
有企業(yè)用戶發(fā)出疑問,企業(yè)剛剛部署了數(shù)據(jù)倉庫,是否可以此基礎(chǔ)上進行主數(shù)據(jù)管理?這兩者有什么區(qū)別呢?
事實上,數(shù)據(jù)倉庫系統(tǒng)的分析結(jié)果可以作為衍生數(shù)據(jù)輸入到 MDM 系統(tǒng)。我們可以從目的處理方式和數(shù)據(jù)量等三個方面來區(qū)分主數(shù)據(jù)和數(shù)據(jù)倉庫的區(qū)別。
主數(shù)據(jù)是經(jīng)常需要維護的,需要確保其時效性和準確性。
首先,兩者的目的不同。主數(shù)據(jù)管理的目的是導(dǎo)出絕對真實的核心數(shù)據(jù),即關(guān)鍵業(yè)務(wù)數(shù)據(jù),同時還得提供主數(shù)據(jù)之間的關(guān)聯(lián)性,而這在數(shù)據(jù)倉庫里是難以找到的。
其次,兩者的處理方式上不同。主數(shù)據(jù)管理是一種偏交易型的系統(tǒng),系統(tǒng)的服務(wù)對象是呼叫中心B2CCRM等業(yè)務(wù)系統(tǒng);而數(shù)據(jù)倉庫是屬于分析型的系統(tǒng),面向的是分析型的應(yīng)用,在大量歷史交易數(shù)據(jù)的基礎(chǔ)上進行多維分析。
最后,兩者的數(shù)據(jù)量上不同。主數(shù)據(jù)管理存儲的僅僅是客戶和產(chǎn)品等核心數(shù)據(jù)的信息;而數(shù)據(jù)倉庫存儲的是來自歷史數(shù)據(jù)和各個維度的匯總數(shù)據(jù),可能是海量數(shù)據(jù)。
詳解Informatica MDM
但彬詳細介紹了Informatica公司解決企業(yè)面臨的主數(shù)據(jù)管理難題的靈丹妙藥Informatica MDM。Informatica MDM在架構(gòu)上分為兩層,底層稱為主數(shù)據(jù)的集成平臺,即Informatica 9,它可以實現(xiàn)數(shù)據(jù)集成數(shù)據(jù)質(zhì)量的清洗識別,同時還提供數(shù)據(jù)孵化的一些功能以實現(xiàn)服務(wù)發(fā)布。在它基礎(chǔ)上是MDM的核心功能,包括模型落地匹配識別信任框架等等都在這上面去實現(xiàn)。
Informatica MDM是單一平臺上的成熟靈活的多領(lǐng)域主數(shù)據(jù)管理解決方案,它可以幫助企業(yè)迅速部署和輕松擴展,解決多個部門和地區(qū)的業(yè)務(wù)問題。Informatica MDM產(chǎn)品的功能主要分成三大部分,七個步驟。這三大部分包括,首先必不可少是要有數(shù)據(jù)的獲取和數(shù)據(jù)的發(fā)布,這是指主數(shù)據(jù)的入口和出口;中間核心部分是任何主數(shù)據(jù)管理產(chǎn)品所需的五項核心功能:發(fā)現(xiàn)建模識別解決和治理。
發(fā)現(xiàn)(Discover)了解主數(shù)據(jù)的來源現(xiàn)狀
建模(Model)用靈活的數(shù)據(jù)模型定義任意類型的主數(shù)據(jù)
清洗(Cleanse)快速匹配和準確識別重復(fù)項目
解決(Resolve)合并以創(chuàng)建可靠唯一的真實來源
治理(Govern)創(chuàng)建使用管理和監(jiān)控主數(shù)據(jù)
但彬強調(diào),以上是一個循環(huán)往復(fù)的過程,當有新的主數(shù)據(jù)出現(xiàn)或經(jīng)過幾大步驟治理后的主數(shù)據(jù)還未達到質(zhì)量要求,則都會進入下一輪的循環(huán)。
盡管主數(shù)據(jù)管理牽涉到多個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)平臺,可以與CRM以及ERP系統(tǒng)進行集成在一起協(xié)同工作。不過,但彬指出,主數(shù)據(jù)管理最好是一個獨立的企業(yè)級信息平臺,可以統(tǒng)一管理企業(yè)主數(shù)據(jù)。一個主數(shù)據(jù)管理解決方案不僅僅是一個軟件平臺,往往還包括一系列的最佳實踐和方法,一些相關(guān)的業(yè)務(wù)團隊以及特定的數(shù)據(jù)處理功能。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標題:如何提升數(shù)據(jù)質(zhì)量 看主數(shù)據(jù)管理怎么說
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10820223260.html