數(shù)據(jù)倉庫:數(shù)據(jù)倉庫是一個支持管理決策的數(shù)據(jù)集合。數(shù)據(jù)是面向主題的、集成的、不易丟失的并且是時間變量。數(shù)據(jù)倉庫是所有操作環(huán)境和外部數(shù)據(jù)源的快照集合。它并不需要非常精確,因為它必須在特定的時間基礎(chǔ)上從操作環(huán)境中提取出來。
數(shù)據(jù)集市:數(shù)據(jù)倉庫只限于單個主題的區(qū)域,例如顧客、部門、地點等。數(shù)據(jù)集市在從數(shù)據(jù)倉庫獲取數(shù)據(jù)時可以依賴于數(shù)據(jù)倉庫,或者當(dāng)它們從操作系統(tǒng)中獲取數(shù)據(jù)時就不依賴于數(shù)據(jù)倉庫。
事實:事實是數(shù)據(jù)倉庫中的信息單元,也是多維空間中的一個單元,受分析單元的限制。事實存儲于一張表中(當(dāng)使用關(guān)系數(shù)據(jù)庫時)或者是多維數(shù)據(jù)庫中的一個單元。每個事實包括關(guān)于事實(銷售額,銷售量,成本,毛利,毛利率等)的基本信息,并且與維度相關(guān)。在某些情況下,當(dāng)所有的必要信息都存儲于維度中時,單純的事實出現(xiàn)就是對于數(shù)據(jù)倉庫足夠的信息。我們稍后討論有關(guān)缺無事實的情況。
維度:維度是用來反映業(yè)務(wù)的一類屬性,這類屬性的集合構(gòu)成一個維度。例如,某個地理維度可能包括國家、地區(qū)、省以及城市的級別。一個時間維度可能包括年、季、月、周、日的級別。
級別:維度層次結(jié)構(gòu)的一個元素。級別描述了數(shù)據(jù)的層次結(jié)構(gòu),從數(shù)據(jù)的最高(匯總程度最大)級別直到最低(最詳細(xì))級別(如大分類-中分類-小分類-細(xì)分類)。級別僅存在于維度內(nèi)。級別基于維度表中的列或維度中的成員屬性。
數(shù)據(jù)清洗:對數(shù)據(jù)倉庫系統(tǒng)無用的或者不符合數(shù)據(jù)格式規(guī)范的數(shù)據(jù)稱之為臟數(shù)據(jù)。清洗的過程就是清除臟數(shù)據(jù)的過程。
數(shù)據(jù)采集:數(shù)據(jù)倉庫系統(tǒng)中后端處理的一部分。數(shù)據(jù)采集過程是指從業(yè)務(wù)系統(tǒng)中收集與數(shù)據(jù)倉庫各指標(biāo)有關(guān)的數(shù)據(jù)。
數(shù)據(jù)轉(zhuǎn)換:解釋業(yè)務(wù)數(shù)據(jù)并修改其內(nèi)容,使之符合數(shù)據(jù)倉庫數(shù)據(jù)格式規(guī)范,并放入數(shù)據(jù)倉庫的數(shù)據(jù)存儲介質(zhì)中。數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)存儲格式的轉(zhuǎn)換以及數(shù)據(jù)表示符的轉(zhuǎn)換(如產(chǎn)品代碼到產(chǎn)品名稱的轉(zhuǎn)換)。
聯(lián)機分析處理(OLAP Online Analytical Processing ):OLAP是一種多維分析技術(shù),用來滿足決策用戶在大量的業(yè)務(wù)數(shù)據(jù)中,從多角度探索業(yè)務(wù)活動的規(guī)律性、市場的運作趨勢的分析需求,并輔助他們進行戰(zhàn)略發(fā)展決策的制定。按照數(shù)據(jù)的存儲方式分OLAP又分為ROLAP、MOLAP和HOLAP。在客戶信息數(shù)據(jù)倉庫CCDW的數(shù)據(jù)環(huán)境下,OLAP提供上鉆、下鉆、切片、旋轉(zhuǎn)等在線分析機制。完成的功能包括多角度實時查詢、簡單的數(shù)據(jù)分析,并輔之于各種圖形展示分析結(jié)果。
數(shù)據(jù)挖掘:在數(shù)據(jù)倉庫的數(shù)據(jù)中發(fā)現(xiàn)新信息的過程被稱為數(shù)據(jù)挖掘,這些新信息不會從操作系統(tǒng)中獲得。
切片:一種用來在數(shù)據(jù)倉庫中將一個維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
切塊:一種用來在數(shù)據(jù)倉庫中將多個維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
星型模式:是數(shù)據(jù)倉庫應(yīng)用程序的最佳設(shè)計模式。它的命名是因其在物理上表現(xiàn)為中心實體,典型內(nèi)容包括指標(biāo)數(shù)據(jù)、輻射數(shù)據(jù),通常是有助于瀏覽和聚集指標(biāo)數(shù)據(jù)的維度。星形圖模型得到的結(jié)果常常是查詢式數(shù)據(jù)結(jié)構(gòu),能夠為快速響應(yīng)用戶的查詢要求提供最優(yōu)的數(shù)據(jù)結(jié)構(gòu)。星形圖還常常產(chǎn)生一種包含維度數(shù)據(jù)和指標(biāo)數(shù)據(jù)的兩層模型。
雪花模式:指一種擴展的星形圖。星形圖通常生成一個兩層結(jié)構(gòu),即只有維度和指標(biāo),雪花圖生成了附加層。實際數(shù)據(jù)倉庫系統(tǒng)建設(shè)過程中,通常只擴展三層:維度(維度實體)、指標(biāo)(指標(biāo)實體)和相關(guān)的描述數(shù)據(jù)(類目細(xì)節(jié)實體)超過三層的雪花圖模型在數(shù)據(jù)倉庫系統(tǒng)中應(yīng)該避免。因為它們開始像更傾向于支持OLTP 應(yīng)用程序的規(guī)格化結(jié)構(gòu),而不是為數(shù)據(jù)倉庫和OLAP應(yīng)用程序而優(yōu)化的非格式化結(jié)構(gòu)。
粒度:粒度將直接決定所構(gòu)建倉庫系統(tǒng)能夠提供決策支持的細(xì)節(jié)級別。粒度越高表示倉庫中的數(shù)據(jù)較粗,反之,較細(xì)。粒度是與具體指標(biāo)相關(guān)的,具體表現(xiàn)在描述此指標(biāo)的某些可分層次維的維值上。例如,時間維度,時間可以分成年、季、月、周、日等。數(shù)據(jù)倉庫模型中所存儲的數(shù)據(jù)的粒度將對信息系統(tǒng)的多方面產(chǎn)生影響。事實表中以各種維度的什么層次作為最細(xì)粒度,將決定存儲的數(shù)據(jù)能否滿足信息分析的功能需求,而粒度的層次劃分、以及聚合表中粒度的選擇將直接影響查詢的響應(yīng)時間。
度量值:在多維數(shù)據(jù)集中,度量值是一組值,這些值基于多維數(shù)據(jù)集的事實數(shù)據(jù)表中的一 列,而且通常為數(shù)字。此外,度量值是所分析的多維數(shù)據(jù)集的中心值。即,度量值是最終用戶瀏覽多維數(shù)據(jù)集時重點查看的數(shù)字?jǐn)?shù)據(jù)(如銷售、毛利、成本)。所選擇的度量值取決于最終用戶所請求的信息類型。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:數(shù)據(jù)倉庫術(shù)語說明