Wymiarowy model danych w hurtowni danych - samouczek z przykładami

dimensional data model data warehouse tutorial with examples

Wypróbuj Nasz Instrument Do Eliminowania Problemów

Wybierz System Operacyjny Wybierz Program Projekcji (Opcjonalnie)

Opisz Swój Problem

W tym samouczku wyjaśniono zalety i mity wymiarowego modelu danych w hurtowni danych. Dowiedz się również o tabelach wymiarów i tabelach faktów z przykładami:

Testowanie hurtowni danych zostało wyjaśnione w naszym poprzednim samouczku, w tym Seria szkoleń z zakresu hurtowni danych dla wszystkich .

Ogromne dane są organizowane w hurtowni danych (DW) z technikami wymiarowego modelowania danych. Te techniki wymiarowego modelowania danych bardzo ułatwiają użytkownikom końcowym uzyskiwanie informacji o danych biznesowych. Ten samouczek wyjaśnia wszystko o wymiarowych modelach danych w DW.

Wymiarowy model danych w hurtowni danych

Docelowi odbiorcy

Programiści i testerzy hurtowni danych / ETL.
Specjaliści od baz danych z podstawową wiedzą na temat koncepcji baz danych.
Administratorzy baz danych / eksperci Big Data, którzy chcą zrozumieć koncepcje hurtowni danych / ETL.
Absolwenci / świeżo upieczeni studenci, którzy szukają pracy w hurtowni danych.

Czego się nauczysz:

Wymiarowe modele danych

Wymiarowe modele danych to struktury danych, które są dostępne dla użytkowników końcowych w przepływie ETL w celu wykonywania zapytań i analizowania danych. Proces ETL kończy się ładowaniem danych do docelowych modeli danych wymiarowych. Każdy wymiarowy model danych jest zbudowany z tabelą faktów otoczoną tabelami wielu wymiarów.

Kroki, które należy wykonać podczas projektowania wymiarowego modelu danych:

Wymiarowe modele danych - etapy projektowania

Korzyści z wymiarowego modelowania danych

Poniżej wymieniono różne zalety wymiarowego modelowania danych.

Są zabezpieczone do korzystania ze stale zmieniających się środowisk DW.
Ogromne dane można łatwo zbudować za pomocą wymiarowych modeli danych.
Dane z wymiarowych modeli danych są łatwe do zrozumienia i analizy.
Są one szybko dostępne dla użytkowników końcowych w celu wykonywania zapytań z wysoką wydajnością.
Wymiarowe modele danych umożliwiają nam drążenie w dół (lub) hierarchiczne zestawianie danych.

Modelowanie ER a modelowanie danych wymiarowych

Modelowanie ER jest odpowiednie dla systemów operacyjnych, podczas gdy modelowanie wymiarowe jest odpowiednie dla hurtowni danych.
Modelowanie ER utrzymuje szczegółowe bieżące dane transakcyjne, podczas gdy modelowanie wymiarowe zachowuje podsumowanie zarówno bieżących, jak i historycznych danych transakcyjnych.
Modelowanie ER ma znormalizowane dane, podczas gdy modelowanie wymiarowe ma dane zdenormalizowane.
Modelowanie ER wykorzystuje więcej sprzężeń podczas pobierania zapytań, podczas gdy modelowanie wymiarowe wykorzystuje mniejszą liczbę sprzężeń, stąd wydajność zapytań jest szybsza w modelowaniu wymiarowym.

Mity wymiarowego modelowania danych

Poniżej podano niektóre z istniejących mitów dotyczących modelowania danych wymiarowych.

Wymiarowe modele danych są używane tylko do reprezentowania podsumowania danych.
Są specyficzne dla działu w organizacji.
Nie obsługują skalowalności.
Mają służyć raportom i zapytaniom użytkowników końcowych.
Nie możemy zintegrować wymiarowych modeli danych.

Tabele wymiarów

Tabele wymiarów odgrywają kluczową rolę w systemie DW, przechowując wszystkie analizowane wartości metryk. Wartości te są przechowywane w łatwo dostępnych atrybutach wymiarowych (kolumnach) w tabeli. Jakość systemu DW zależy głównie od głębokości atrybutów wymiarów.

Dlatego powinniśmy spróbować podać wiele atrybutów wraz z odpowiadającymi im wartościami w tabelach wymiarów.

Zbadajmy strukturę tabel wymiarów !!

# 1) Klucz do tabeli wymiarów: Każda tabela wymiarów będzie miała dowolny ze swoich atrybutów wymiarów jako klucz podstawowy do jednoznacznej identyfikacji każdego wiersza. W związku z tym różne wartości liczbowe tego atrybutu mogą działać jako klucze podstawowe.

Jeśli wartości atrybutów w żadnym przypadku nie są unikalne, można rozważyć sekwencyjnie generowane numery systemowe jako klucze podstawowe. Są one również nazywane kluczami zastępczymi.

Wymiarowe modele danych muszą mieć ograniczenie integralności referencyjnej dla każdego klucza między wymiarami a faktami. W ten sposób tabele faktów będą miały odniesienie do klucza obcego dla każdego klucza podstawowego / zastępczego w tabeli wymiarów, aby zachować integralność referencyjną.

Jeśli się nie powiedzie, nie można pobrać odpowiednich danych tabeli faktów dla tego klucza wymiaru.

# 2) Stół jest szeroki: Można powiedzieć, że tabele wymiarów są szerokie, ponieważ możemy dodać dowolną liczbę atrybutów do tabeli wymiarów w dowolnym momencie cyklu DW. Architekt DW poprosi zespół ETL o dodanie odpowiednich nowych atrybutów do schematu.

W scenariuszach czasu rzeczywistego można zobaczyć tabele wymiarów z 50 (lub) więcej atrybutami.

# 3) Atrybuty tekstowe: Atrybuty wymiarowe mogą być dowolnego typu, najlepiej tekstowe (lub) liczbowe. Atrybuty tekstowe będą zawierały prawdziwe słowa biznesowe, a nie kody. Tabele wymiarów nie są przeznaczone do obliczeń, dlatego wartości liczbowe są rzadko używane w atrybutach wymiarów.

# 4) Atrybuty mogą nie być bezpośrednio powiązane: Wszystkie atrybuty w tabeli wymiarów mogą nie być ze sobą powiązane.

# 5) Nie znormalizowane: Normalizacja tabeli wymiarów powoduje wyświetlenie większej liczby tabel pośrednich, co nie jest wydajne. Dlatego tabele wymiarów nie są znormalizowane.

Atrybuty wymiarowe mogą pełnić rolę źródła ograniczeń w zapytaniach i mogą być również wyświetlane jako etykiety w raportach. Zapytania będą działać wydajnie, jeśli bezpośrednio wybierzesz atrybut z tabeli wymiarów i odniesiesz się bezpośrednio do odpowiedniej tabeli faktów bez dotykania innych tabel pośrednich.

# 6) Drążenie w dół i rozwijanie: Atrybuty wymiaru umożliwiają drążenie w dół (lub) zestawianie danych w razie potrzeby.

# 7) Wiele hierarchii: Pojedyncza tabela wymiarów mająca wiele hierarchii jest bardzo powszechna. Tabela wymiarów będzie miała prostą hierarchię, jeśli istnieje tylko jedna ścieżka od najniższego poziomu do góry. Podobnie będzie miał wiele hierarchii, jeśli istnieje wiele ścieżek dostępu od najniższego poziomu do góry.

# 8) Kilka rekordów: Tabele wymiarów będą miały mniejszą liczbę rekordów (w setkach) niż tabele faktów (w milionach). Chociaż są one mniejsze niż fakty, zapewniają wszystkie dane wejściowe do tabel faktów.

Oto przykład tabeli wymiarów klientów:

Tabela wymiarów klienta - przykład

Rozumiejąc powyższe koncepcje, możesz zdecydować, czy pole danych może działać jako atrybut wymiaru (czy) nie podczas wyodrębniania danych z samego źródła.

Podstawowy plan załadunku dla wymiaru

Wymiary można tworzyć na dwa sposoby, tj. Poprzez wyodrębnianie danych wymiarów z zewnętrznych systemów źródłowych (lub) System ETL może budować wymiary na podstawie przemieszczania bez angażowania jakichkolwiek źródeł zewnętrznych. Jednak system ETL bez żadnego zewnętrznego przetwarzania jest bardziej odpowiedni do tworzenia tabel wymiarów.

Poniżej znajdują się kroki związane z tym procesem:

wymieniłeś domyślną bramę w swojej sieci

Czyszczenie danych: Dane są czyszczone, weryfikowane, a reguły biznesowe są stosowane przed załadowaniem do tabeli wymiarów, aby zachować spójność.
Zgodność danych: Dane z innych części hurtowni danych powinny być poprawnie zagregowane jako jedna wartość w odniesieniu do każdego pola tabeli wymiarów.
Udostępnij te same domeny: Po potwierdzeniu danych są one ponownie zapisywane w tabelach pomostowych.
Dostarczanie danych: Wreszcie wszystkie wartości atrybutów wymiarowych są ładowane z przypisanymi kluczami głównymi / zastępczymi.

Rodzaje wymiarów

Poniżej wymieniono różne typy wymiarów w celach informacyjnych.

Zaczynajmy!!

# 1) Małe wymiary

Małe wymiary w hurtowni danych działają jak tabele odnośników z mniejszą liczbą wierszy i kolumn. Dane do małych wymiarów można łatwo wczytać z arkuszy kalkulacyjnych. W razie potrzeby małe wymiary można łączyć jako super wymiar.

# 2) Zgodny wymiar

Wymiar dostosowany to wymiar, do którego można odnosić się w ten sam sposób z każdą tabelą faktów, do której jest powiązany.

Wymiar daty jest najlepszym przykładem wymiaru zgodnego, ponieważ atrybuty wymiaru daty, takie jak rok, miesiąc, tydzień, dni itp., Przekazują te same dane w ten sam sposób dla dowolnej liczby faktów.

Przykład zgodnego wymiaru.

Zgodny wymiar - przykład

# 3) Wymiar śmieci

Niewiele atrybutów w tabeli faktów, takich jak flagi i wskaźniki, można przenieść do oddzielnej tabeli wymiarów śmieci. Te atrybuty również nie należą do żadnych innych istniejących tabel wymiarów. Ogólnie wartości tych atrybutów to po prostu „tak / nie” (lub) „prawda / fałsz”.

Tworzenie nowego wymiaru dla każdego pojedynczego atrybutu flagi komplikuje to, tworząc większą liczbę kluczy obcych do tabeli faktów. Jednocześnie zachowanie wszystkich tych flag i informacji o wskaźnikach w rzeczywistych tabelach również zwiększa ilość danych przechowywanych w faktach, co w ten sposób obniża wydajność.

Dlatego najlepszym rozwiązaniem jest utworzenie pojedynczego wymiaru śmieciowego, ponieważ wymiar śmieciowy jest w stanie pomieścić dowolną liczbę wskaźników „tak / nie” lub „prawda / fałsz”. Jednak wymiary śmieciowe przechowują wartości opisowe dla tych wskaźników (tak / nie (lub) prawda / fałsz), takie jak aktywny i oczekujący itp.

W oparciu o złożoność tabeli faktów i jej wskaźników, tabela faktów może mieć jeden lub więcej wymiarów śmieci.

Przykład Junk Dimension.

Wymiar śmieci - przykład

# 4) Wymiar odgrywania ról

Pojedynczy wymiar, do którego można odwoływać się do wielu celów w tabeli faktów, nazywany jest wymiarem odgrywania ról.

Najlepszym przykładem wymiaru odgrywania ról jest ponownie tabela wymiarów Data, ponieważ ten sam atrybut daty w wymiarze może być używany do różnych celów, takich jak data zamówienia, data dostawy, data transakcji, data anulowania, itp.

W razie potrzeby można utworzyć cztery różne widoki w tabeli wymiarów dat w odniesieniu do czterech różnych atrybutów daty w tabeli faktów.

Przykład wymiaru odgrywania ról.

Wymiar odgrywania ról

# 5) Zdegenerowane wymiary

Może istnieć kilka atrybutów, które nie mogą być ani wymiarami (metrykami), ani faktami (miarami), ale wymagają analizy. Wszystkie takie atrybuty można przenieść do zdegenerowanych wymiarów.

Na przykład, możesz traktować numer zamówienia, numer faktury itp. jako zdegenerowane atrybuty wymiaru.

Przykład zdegenerowanego wymiaru.

Wymiar zdegenerowany - przykład

# 6) Powoli zmieniające się wymiary

Wolno zmieniający się wymiar to rodzaj, w którym dane mogą zmieniać się powoli w dowolnym momencie, a nie w okresowych, regularnych odstępach czasu. Zmodyfikowane dane w tabelach wymiarów można obsługiwać na różne sposoby, jak wyjaśniono poniżej.

Możesz wybrać typ SCD, aby zareagować na zmianę indywidualnie dla każdego atrybutu w tabeli wymiarów.

(i) SCD typu 1

W typie 1, gdy następuje zmiana wartości atrybutów wymiarowych, istniejące wartości są nadpisywane nowo zmodyfikowanymi wartościami, co jest niczym innym jak aktualizacją.
Stare dane nie są przechowywane w celach informacyjnych.
Wcześniejszych raportów nie można odtworzyć z powodu braku starych danych.
Łatwy w utrzymaniu.
Wpływ na tabele faktów jest większy.

Przykład SCD typu 1:

Type1_SCD

(Ii) SCD typu 2

W typie 2, gdy następuje zmiana wartości atrybutów wymiarowych, nowy wiersz zostanie wstawiony ze zmodyfikowanymi wartościami bez zmiany starych danych wiersza.
Jeśli w którejkolwiek z tabel faktów istnieje odniesienie do klucza obcego do starego rekordu, wówczas stary klucz zastępczy jest aktualizowany wszędzie o nowy klucz zastępczy automatycznie.
Powyższy krok ma bardzo mniejszy wpływ na zmiany tabeli faktów.
Po zmianach stare dane nie są nigdzie uwzględniane.
W typie 2 możemy śledzić wszystkie zmiany zachodzące w atrybutach wymiarowych.
Nie ma ograniczeń co do przechowywania danych historycznych.
W typie 2 dodanie kilku atrybutów do każdego wiersza, takich jak zmieniona data, efektywna data-godzina, data-godzina zakończenia, powód zmiany i bieżąca flaga jest opcjonalne. Jest to jednak istotne, jeśli firma chce poznać liczbę zmian wprowadzonych w określonym przedziale czasu.

Przykład SCD typu 2:

Type2_SCD

(Iii) SCD typu 3

W typie 3, gdy następuje zmiana wartości atrybutów wymiarowych, nowe wartości są aktualizowane, ale stare wartości nadal pozostają ważne jako druga opcja.
Zamiast dodawać nowy wiersz dla każdej zmiany, zostanie dodana nowa kolumna, jeśli wcześniej nie istniała.
Stare wartości są umieszczane w wyżej dodanych atrybutach, a dane głównego atrybutu są nadpisywane zmienioną wartością, jak w typie 1.
Istnieje ograniczenie przechowywania danych historycznych.
Wpływ na tabele faktów jest większy.

Przykład SCD typu 3:

Type3_SCD

(iv) SCD typu 4

W typie 4 bieżące dane są przechowywane w jednej tabeli.
Wszystkie dane historyczne są przechowywane w innej tabeli.

Przykład SCD typu 4:

Type4_SCD

(v) SCD typu 6

Tabela wymiarów może również zawierać kombinację wszystkich trzech typów SCD 1, 2 i 3, która jest znana jako powoli zmieniający się wymiar typu 6 (lub) hybrydowego.

Tabele faktów

Tabele faktów przechowują zestaw wartości mierzonych ilościowo, które są używane do obliczeń. Wartości z tabeli faktów są wyświetlane w raportach biznesowych. W przeciwieństwie do tekstowych typów danych tabel wymiarów, typ danych tabel faktów jest znacznie liczbowy.

Tabele faktów są głębokie, podczas gdy tabele wymiarów są szerokie, ponieważ tabele faktów będą miały większą liczbę wierszy i mniejszą liczbę kolumn. Klucz podstawowy zdefiniowany w tabeli faktów służy przede wszystkim do oddzielnej identyfikacji każdego wiersza. Klucz podstawowy jest również nazywany w rzeczywistości kluczem złożonym.

Jeśli w tabeli faktów brakuje klucza złożonego, a dowolne dwa rekordy zawierają te same dane, bardzo trudno jest rozróżnić dane i odnieść się do danych w tabelach wymiarów.

Dlatego też, jeśli jako klucz złożony istnieje odpowiedni klucz unikatowy, dobrze jest wygenerować numer kolejny dla każdego rekordu tabeli faktów. Inną alternatywą jest utworzenie połączonego klucza podstawowego. Zostanie to wygenerowane przez konkatenację wszystkich odpowiednich kluczy podstawowych tabel wymiarów w wierszach.

Pojedyncza tabela faktów może być otoczona wieloma tabelami wymiarów. Za pomocą kluczy obcych, które istnieją w rzeczywistych tabelach, można odnieść się do odpowiedniego kontekstu (pełne dane) mierzonych wartości w tabelach wymiarów. Za pomocą zapytań użytkownicy będą efektywnie przeprowadzać drążenie w dół i zwijać.

Najniższy poziom danych, które można przechowywać w tabeli faktów, nazywany jest szczegółowością. Liczba tabel wymiarów skojarzonych z tabelą faktów jest odwrotnie proporcjonalna do szczegółowości danych tej tabeli faktów. tj. najmniejsza wartość pomiaru wymaga odniesienia do większej liczby tabel wymiarów.

W modelu wymiarowym tabele faktów zachowują relację wiele do wielu z tabelami wymiarów.

Przykład tabeli faktów sprzedaży:

Tabela faktów sprzedaży - przykład

Plan obciążenia dla tabel faktów

Możesz wydajnie załadować dane tabeli faktów, biorąc pod uwagę następujące wskaźniki:

# 1) Upuść i przywróć indeksy

Indeksy w rzeczywistości poprawiają wydajność podczas wykonywania zapytań dotyczących danych, ale obniżają wydajność podczas ładowania danych. Dlatego przed załadowaniem jakichkolwiek ogromnych danych do tabel faktów należy przede wszystkim usunąć wszystkie indeksy z tej tabeli, załadować dane i przywrócić indeksy.

# 2) Oddzielne wkładki z aktualizacji

Nie łącz wstawiania i aktualizowania rekordów podczas ładowania do tabeli faktów. Jeśli liczba aktualizacji jest mniejsza, osobno przetwarzaj wstawki i aktualizacje. Jeśli liczba aktualizacji jest większa, zaleca się skrócenie i ponowne załadowanie tabeli faktów w celu uzyskania szybkich wyników.

# 3) Partycjonowanie

Dokonaj fizycznego partycjonowania tabeli faktów na minitabele, aby uzyskać lepszą wydajność zapytań dotyczących danych zbiorczych w tabeli faktów. Z wyjątkiem administratorów baz danych i zespołu ETL nikt nie będzie świadomy podziałów na fakty.

Jako przykład , można podzielić tabelę na partycje według miesiąca, kwartału, roku itd. Podczas wykonywania zapytań uwzględniane są tylko dane podzielone na partycje zamiast skanowania całej tabeli.

# 4) Ładuj równolegle

wywiad z inżynierem sieci pytania 250 + wyjaśnienia pytań i odpowiedzi pdf

Mamy teraz pomysł na partycje w tabelach faktów. Partycje na faktach są również korzystne podczas ładowania ogromnych danych do faktów. Aby to zrobić, najpierw podziel dane logicznie na różne pliki danych i uruchom zadania ETL w celu równoległego załadowania wszystkich tych logicznych części danych.

# 5) Narzędzie do ładowania zbiorczego

W przeciwieństwie do innych systemów RDBMS, system ETL nie musi bezpośrednio utrzymywać dzienników wycofywania zmian w przypadku awarii w trakcie transakcji. Tutaj „ładowanie zbiorcze” odbywa się w faktach zamiast w „wstawkach SQL” w celu załadowania ogromnych danych. Jeśli pojedyncze ładowanie nie powiedzie się, całe dane można łatwo przeładować (lub) można je kontynuować od miejsca, w którym zostało przerwane przy ładowaniu zbiorczym.

# 6) Usuwanie rekordu faktów

Usunięcie rekordu tabeli faktów ma miejsce tylko wtedy, gdy firma wyraźnie tego chce. Jeśli istnieją jakiekolwiek dane z tabeli faktów, których już nie ma w systemach źródłowych, można je usunąć fizycznie (lub) logicznie.

Fizyczne usunięcie: Niechciane rekordy są trwale usuwane z tabeli faktów.
Usuwanie logiczne: Do tabeli faktów zostanie dodana nowa kolumna, np. „Usunięte” typu Bit (lub) Boolean. Działa jak flaga reprezentująca usunięte rekordy. Musisz upewnić się, że nie wybierasz usuniętych rekordów podczas sprawdzania danych tabeli faktów.

# 7) Sekwencja aktualizacji i usunięć w tabeli faktów

Gdy istnieją jakiekolwiek dane do zaktualizowania, najpierw należy zaktualizować tabele wymiarów, a następnie w razie potrzeby zaktualizować klucze zastępcze w tabeli przeglądowej, a następnie zaktualizować odpowiednią tabelę faktów. Usunięcie ma miejsce w odwrotnej kolejności, ponieważ usunięcie wszystkich niechcianych danych z tabel faktów ułatwia usuwanie połączonych niechcianych danych z tabel wymiarów.

Powinniśmy postępować zgodnie z powyższą sekwencją w obu przypadkach, ponieważ tabele wymiarów i tabele faktów zachowują integralność referencyjną przez cały czas.

Rodzaje faktów

Na podstawie zachowania danych z tabel faktów są one klasyfikowane jako tabele faktów transakcji, tabele faktów migawek i tabele faktów zbiorczych migawek. Wszystkie te trzy typy mają różne funkcje z różnymi strategiami ładowania danych.

# 1) Tabele faktów dotyczących transakcji

Jak nazwa wskazuje, tabele faktów transakcji przechowują dane na poziomie transakcji dla każdego zdarzenia, które ma miejsce. Tego rodzaju dane można łatwo przeanalizować na samym poziomie tabeli faktów. Ale w celu dalszej analizy możesz również odwołać się do powiązanych wymiarów.

Na przykład, każda sprzedaż (lub) zakup w witrynie marketingowej powinna zostać załadowana do tabeli faktów transakcji.

Przykład tabeli faktów transakcji przedstawiono poniżej.

Tabela faktów transakcji

# 2) Okresowe tabele faktów z migawkami

Jak nazwa wskazuje, dane w okresowej tabeli faktów snapshot są przechowywane w postaci migawek (obrazów) w okresowych odstępach czasu, np. Na każdy dzień, tydzień, miesiąc, kwartał itp. W zależności od potrzeb biznesowych.

Jest więc jasne, że jest to agregacja danych przez cały czas. Dlatego fakty dotyczące migawek są bardziej złożone w porównaniu z tabelami faktów transakcji. Na przykład, wszelkie dane z raportów o przychodach z wyników można przechowywać w tabelach faktów w postaci migawek, aby ułatwić do nich dostęp.

Poniżej przedstawiono przykład okresowej tabeli faktów z migawkami.

Okresowa tabela faktów Migawka

# 3) Gromadzenie tabel podsumowania faktów

Zbiorcze tabele faktów z migawkami umożliwiają przechowywanie danych w tabelach przez cały okres istnienia produktu. Działa to jako połączenie dwóch powyższych typów, w których dane mogą być wstawiane przez dowolne zdarzenie w dowolnym momencie jako migawka.

W tym typie dodatkowe kolumny z datami i dane dla każdego wiersza są aktualizowane wraz z każdym kamieniem milowym tego produktu.

Przykład zbiorczej tabeli faktów z migawki.

Zbiorcze tabele faktów z migawkami

Oprócz powyższych trzech typów, oto kilka innych typów tabel faktów:

# 4) Bez faktów tabele faktów: Fakt to zbiór miar, podczas gdy fakt mniej obejmuje tylko zdarzenia (lub) warunki, które nie zawierają żadnych miar. Tabela faktów bez faktów jest używana głównie do śledzenia systemu. Dane w tych tabelach mogą być analizowane i wykorzystywane do raportowania.

Na przykład, możesz poszukać danych pracownika, który skorzystał z urlopu i rodzaju urlopu w ciągu roku itp. Uwzględniając wszystkie te niejasne szczegóły faktów, tabela z pewnością zwiększy rozmiar faktów.

Przykład bezbłędnej tabeli faktów pokazano poniżej.

Factless_fact

# 5) Zgodne tabele faktów: Fakt potwierdzony to fakt, do którego można odnosić się w ten sam sposób w każdej zbiorczej bazie danych, do której jest on powiązany.

Specyfikacje tabeli faktów

Poniżej podano specyfikacje tabeli faktów.

Nazwa faktu: Jest to ciąg opisujący w skrócie funkcjonalność tabeli faktów.
Proces biznesowy: Rozmowy o biznesie muszą być wypełnione tabelą faktów.
Pytania: Wymienia listę pytań biznesowych, na które odpowiedzi będzie zawierała tabela faktów.
Ziarno: Wskazuje najniższy poziom szczegółowości związany z danymi tej tabeli faktów.
Wymiary: Wypisz wszystkie tabele wymiarów skojarzone z tą tabelą faktów.
Środki: Obliczone wartości zapisane w tabeli faktów.
Częstotliwość obciążenia Reprezentuje przedziały czasowe ładowania danych do tabeli faktów.
Pierwsze rzędy: Odwołaj się do początkowych danych wprowadzonych do tabeli faktów po raz pierwszy.

Przykład wymiarowego modelowania danych

Możesz dowiedzieć się, jak można zaprojektować tabele wymiarów i tabele faktów dla systemu, patrząc na poniższy diagram modelowania danych wymiarowych dla sprzedaży i zamówień.

Przykład modelowania danych wymiarowych

Wniosek

Do tej pory powinieneś zdobyć doskonałą wiedzę na temat technik modelowania danych wymiarowych, ich korzyści, mitów, tabel wymiarów, tabel faktów, a także ich typów i procesów.

Sprawdź nasz nadchodzący samouczek, aby dowiedzieć się więcej o schematach hurtowni danych !!

=> Odwiedź tutaj, aby nauczyć się hurtowni danych od podstaw.

Wymiarowy model danych w hurtowni danych - samouczek z przykładami

Wymiarowe modele danych

Korzyści z wymiarowego modelowania danych

Modelowanie ER a modelowanie danych wymiarowych

Mity wymiarowego modelowania danych

Tabele wymiarów

Podstawowy plan załadunku dla wymiaru

Rodzaje wymiarów

# 1) Małe wymiary

# 2) Zgodny wymiar

# 3) Wymiar śmieci

# 4) Wymiar odgrywania ról

# 5) Zdegenerowane wymiary

# 6) Powoli zmieniające się wymiary

Tabele faktów

Plan obciążenia dla tabel faktów

Rodzaje faktów

# 1) Tabele faktów dotyczących transakcji

# 2) Okresowe tabele faktów z migawkami

# 3) Gromadzenie tabel podsumowania faktów

Specyfikacje tabeli faktów

Przykład wymiarowego modelowania danych

Wniosek

rekomendowane lektury

Ciekawe Artykuły

Wybór Redakcji

The Game Awards dokucza występowi Władcy Pierścieni: Gollum

Samouczek Pythona dla początkujących (praktyczne BEZPŁATNE szkolenie Python)

Wśród nominowanych do Game Awards 2022 są Ragnarok, Elden Ring i Nibel

Windows Defender kontra Avast - który z nich jest lepszym antywirusem

Narzędzia i dostawcy usług do testowania penetracji aplikacji mobilnych

Cotton 100% i Cotton Panorama docierają 29 października, zamówienia w przedsprzedaży na SNES/Mega Drive są aktywne

Bohaterka Horizon, Aloy, pojawi się w Fall Guys

Snow Blind to kolejna odsłona serii Mortal Kombat Legends

Zwiastun Grand Theft Auto VI doskonale oddaje esencję mojego rodzinnego miasta

TMNT: Cowabunga Collection będzie zawierała wycofanie kodu sieciowego dla zawodników turniejowych

Azure Striker Gunvolt w końcu otrzymuje japońskie podkłady głosowe na 3DS

Kangur Kao wraca tego lata i wygląda ostro

Skytex Softbox - the perfect solution for professional photography and videography.