快速了解數(shù)據(jù)倉庫及數(shù)據(jù)建模的常用新術(shù)語
數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個支持管理決策的數(shù)據(jù)集合。數(shù)據(jù)是面向主題的、集成的、不易丟失的并且是時間變量。
數(shù)據(jù)倉庫是所有操作環(huán)境和外部數(shù)據(jù)源的快照集合。它并不需要非常精確,因?yàn)樗仨氃谔囟ǖ臅r間基礎(chǔ)上從操作環(huán)境中提取出來。
數(shù)據(jù)集市
數(shù)據(jù)倉庫只限于單個主題的區(qū)域,例如顧客、部門、地點(diǎn)等。數(shù)據(jù)集市在從數(shù)據(jù)倉庫獲取數(shù)據(jù)時可以依賴于數(shù)據(jù)倉庫,或者當(dāng)它們從操作系統(tǒng)中獲取數(shù)據(jù)時就不依賴于數(shù)據(jù)倉庫。
事實(shí)
事實(shí)是數(shù)據(jù)倉庫中的信息單元,也是多維空間中的一個單元,受分析單元的限制。
事實(shí)存儲于一張表中(當(dāng)使用關(guān)系數(shù)據(jù)庫時)或者是多維數(shù)據(jù)庫中的一個單元。
每個事實(shí)包括關(guān)于事實(shí)(收入、價值、滿意記錄等)的基本信息,并且與維度相關(guān)。
在某些情況下,當(dāng)所有的必要信息都存儲于維度中時,單純的事實(shí)出現(xiàn)就是對于數(shù)據(jù)倉庫足夠的信息。我們稍后討論有關(guān)缺無事實(shí)的情況。
維度
維度是綁定由坐標(biāo)系定義的空間的坐標(biāo)系的軸線。數(shù)據(jù)倉庫中的坐標(biāo)系定義了數(shù)據(jù)單元,其中包含事實(shí)。
坐標(biāo)系的一個例子就是帶有 x 維度和 y 維度的 Cartesian(笛卡爾)坐標(biāo)系。
在數(shù)據(jù)倉庫中,時間總是維度之一。
數(shù)據(jù)挖掘
在數(shù)據(jù)倉庫的數(shù)據(jù)中發(fā)現(xiàn)新信息的過程被稱為數(shù)據(jù)挖掘,這些新信息不會從操作系統(tǒng)中獲得。
分析空間
分析空間是數(shù)據(jù)倉庫中一定量的數(shù)據(jù),用于進(jìn)行數(shù)據(jù)挖掘以發(fā)現(xiàn)新信息同時支持管理決策。
切片
一種用來在數(shù)據(jù)倉庫中將一個維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
切塊
一種用來在數(shù)據(jù)倉庫中將多個維度中的分析空間限制為數(shù)據(jù)子集的技術(shù)。
星型模式
一種使用關(guān)系數(shù)據(jù)庫實(shí)現(xiàn)多維分析空間的模式,稱為星型模式。
星型模式將在本白皮書中稍后進(jìn)行進(jìn)一步討論。
雪花模式
不管什么原因,當(dāng)星型模式的維度需要進(jìn)行規(guī)范化時,星型模式就演進(jìn)為雪花模式。
評論