dimensional data model data warehouse tutorial with examples
W tym samouczku wyjaśniono zalety i mity wymiarowego modelu danych w hurtowni danych. Dowiedz się również o tabelach wymiarów i tabelach faktów z przykładami:
Testowanie hurtowni danych zostało wyjaśnione w naszym poprzednim samouczku, w tym Seria szkoleń z zakresu hurtowni danych dla wszystkich .
Ogromne dane są organizowane w hurtowni danych (DW) z technikami wymiarowego modelowania danych. Te techniki wymiarowego modelowania danych bardzo ułatwiają użytkownikom końcowym uzyskiwanie informacji o danych biznesowych. Ten samouczek wyjaśnia wszystko o wymiarowych modelach danych w DW.
Docelowi odbiorcy
- Programiści i testerzy hurtowni danych / ETL.
- Specjaliści od baz danych z podstawową wiedzą na temat koncepcji baz danych.
- Administratorzy baz danych / eksperci Big Data, którzy chcą zrozumieć koncepcje hurtowni danych / ETL.
- Absolwenci / świeżo upieczeni studenci, którzy szukają pracy w hurtowni danych.
Czego się nauczysz:
Wymiarowe modele danych
Wymiarowe modele danych to struktury danych, które są dostępne dla użytkowników końcowych w przepływie ETL w celu wykonywania zapytań i analizowania danych. Proces ETL kończy się ładowaniem danych do docelowych modeli danych wymiarowych. Każdy wymiarowy model danych jest zbudowany z tabelą faktów otoczoną tabelami wielu wymiarów.
Kroki, które należy wykonać podczas projektowania wymiarowego modelu danych:
Korzyści z wymiarowego modelowania danych
Poniżej wymieniono różne zalety wymiarowego modelowania danych.
- Są zabezpieczone do korzystania ze stale zmieniających się środowisk DW.
- Ogromne dane można łatwo zbudować za pomocą wymiarowych modeli danych.
- Dane z wymiarowych modeli danych są łatwe do zrozumienia i analizy.
- Są one szybko dostępne dla użytkowników końcowych w celu wykonywania zapytań z wysoką wydajnością.
- Wymiarowe modele danych umożliwiają nam drążenie w dół (lub) hierarchiczne zestawianie danych.
Modelowanie ER a modelowanie danych wymiarowych
- Modelowanie ER jest odpowiednie dla systemów operacyjnych, podczas gdy modelowanie wymiarowe jest odpowiednie dla hurtowni danych.
- Modelowanie ER utrzymuje szczegółowe bieżące dane transakcyjne, podczas gdy modelowanie wymiarowe zachowuje podsumowanie zarówno bieżących, jak i historycznych danych transakcyjnych.
- Modelowanie ER ma znormalizowane dane, podczas gdy modelowanie wymiarowe ma dane zdenormalizowane.
- Modelowanie ER wykorzystuje więcej sprzężeń podczas pobierania zapytań, podczas gdy modelowanie wymiarowe wykorzystuje mniejszą liczbę sprzężeń, stąd wydajność zapytań jest szybsza w modelowaniu wymiarowym.
Mity wymiarowego modelowania danych
Poniżej podano niektóre z istniejących mitów dotyczących modelowania danych wymiarowych.
- Wymiarowe modele danych są używane tylko do reprezentowania podsumowania danych.
- Są specyficzne dla działu w organizacji.
- Nie obsługują skalowalności.
- Mają służyć raportom i zapytaniom użytkowników końcowych.
- Nie możemy zintegrować wymiarowych modeli danych.
Tabele wymiarów
Tabele wymiarów odgrywają kluczową rolę w systemie DW, przechowując wszystkie analizowane wartości metryk. Wartości te są przechowywane w łatwo dostępnych atrybutach wymiarowych (kolumnach) w tabeli. Jakość systemu DW zależy głównie od głębokości atrybutów wymiarów.
Dlatego powinniśmy spróbować podać wiele atrybutów wraz z odpowiadającymi im wartościami w tabelach wymiarów.
Zbadajmy strukturę tabel wymiarów !!
# 1) Klucz do tabeli wymiarów: Każda tabela wymiarów będzie miała dowolny ze swoich atrybutów wymiarów jako klucz podstawowy do jednoznacznej identyfikacji każdego wiersza. W związku z tym różne wartości liczbowe tego atrybutu mogą działać jako klucze podstawowe.
Jeśli wartości atrybutów w żadnym przypadku nie są unikalne, można rozważyć sekwencyjnie generowane numery systemowe jako klucze podstawowe. Są one również nazywane kluczami zastępczymi.
Wymiarowe modele danych muszą mieć ograniczenie integralności referencyjnej dla każdego klucza między wymiarami a faktami. W ten sposób tabele faktów będą miały odniesienie do klucza obcego dla każdego klucza podstawowego / zastępczego w tabeli wymiarów, aby zachować integralność referencyjną.
Jeśli się nie powiedzie, nie można pobrać odpowiednich danych tabeli faktów dla tego klucza wymiaru.
# 2) Stół jest szeroki: Można powiedzieć, że tabele wymiarów są szerokie, ponieważ możemy dodać dowolną liczbę atrybutów do tabeli wymiarów w dowolnym momencie cyklu DW. Architekt DW poprosi zespół ETL o dodanie odpowiednich nowych atrybutów do schematu.
W scenariuszach czasu rzeczywistego można zobaczyć tabele wymiarów z 50 (lub) więcej atrybutami.
# 3) Atrybuty tekstowe: Atrybuty wymiarowe mogą być dowolnego typu, najlepiej tekstowe (lub) liczbowe. Atrybuty tekstowe będą zawierały prawdziwe słowa biznesowe, a nie kody. Tabele wymiarów nie są przeznaczone do obliczeń, dlatego wartości liczbowe są rzadko używane w atrybutach wymiarów.
# 4) Atrybuty mogą nie być bezpośrednio powiązane: Wszystkie atrybuty w tabeli wymiarów mogą nie być ze sobą powiązane.
# 5) Nie znormalizowane: Normalizacja tabeli wymiarów powoduje wyświetlenie większej liczby tabel pośrednich, co nie jest wydajne. Dlatego tabele wymiarów nie są znormalizowane.
Atrybuty wymiarowe mogą pełnić rolę źródła ograniczeń w zapytaniach i mogą być również wyświetlane jako etykiety w raportach. Zapytania będą działać wydajnie, jeśli bezpośrednio wybierzesz atrybut z tabeli wymiarów i odniesiesz się bezpośrednio do odpowiedniej tabeli faktów bez dotykania innych tabel pośrednich.
# 6) Drążenie w dół i rozwijanie: Atrybuty wymiaru umożliwiają drążenie w dół (lub) zestawianie danych w razie potrzeby.
# 7) Wiele hierarchii: Pojedyncza tabela wymiarów mająca wiele hierarchii jest bardzo powszechna. Tabela wymiarów będzie miała prostą hierarchię, jeśli istnieje tylko jedna ścieżka od najniższego poziomu do góry. Podobnie będzie miał wiele hierarchii, jeśli istnieje wiele ścieżek dostępu od najniższego poziomu do góry.
# 8) Kilka rekordów: Tabele wymiarów będą miały mniejszą liczbę rekordów (w setkach) niż tabele faktów (w milionach). Chociaż są one mniejsze niż fakty, zapewniają wszystkie dane wejściowe do tabel faktów.
Oto przykład tabeli wymiarów klientów:
Rozumiejąc powyższe koncepcje, możesz zdecydować, czy pole danych może działać jako atrybut wymiaru (czy) nie podczas wyodrębniania danych z samego źródła.
Podstawowy plan załadunku dla wymiaru
Wymiary można tworzyć na dwa sposoby, tj. Poprzez wyodrębnianie danych wymiarów z zewnętrznych systemów źródłowych (lub) System ETL może budować wymiary na podstawie przemieszczania bez angażowania jakichkolwiek źródeł zewnętrznych. Jednak system ETL bez żadnego zewnętrznego przetwarzania jest bardziej odpowiedni do tworzenia tabel wymiarów.
Poniżej znajdują się kroki związane z tym procesem:
wymieniłeś domyślną bramę w swojej sieci
- Czyszczenie danych: Dane są czyszczone, weryfikowane, a reguły biznesowe są stosowane przed załadowaniem do tabeli wymiarów, aby zachować spójność.
- Zgodność danych: Dane z innych części hurtowni danych powinny być poprawnie zagregowane jako jedna wartość w odniesieniu do każdego pola tabeli wymiarów.
- Udostępnij te same domeny: Po potwierdzeniu danych są one ponownie zapisywane w tabelach pomostowych.
- Dostarczanie danych: Wreszcie wszystkie wartości atrybutów wymiarowych są ładowane z przypisanymi kluczami głównymi / zastępczymi.
Rodzaje wymiarów
Poniżej wymieniono różne typy wymiarów w celach informacyjnych.
Zaczynajmy!!
# 1) Małe wymiary
Małe wymiary w hurtowni danych działają jak tabele odnośników z mniejszą liczbą wierszy i kolumn. Dane do małych wymiarów można łatwo wczytać z arkuszy kalkulacyjnych. W razie potrzeby małe wymiary można łączyć jako super wymiar.
# 2) Zgodny wymiar
Wymiar dostosowany to wymiar, do którego można odnosić się w ten sam sposób z każdą tabelą faktów, do której jest powiązany.
Wymiar daty jest najlepszym przykładem wymiaru zgodnego, ponieważ atrybuty wymiaru daty, takie jak rok, miesiąc, tydzień, dni itp., Przekazują te same dane w ten sam sposób dla dowolnej liczby faktów.
Przykład zgodnego wymiaru.
# 3) Wymiar śmieci
Niewiele atrybutów w tabeli faktów, takich jak flagi i wskaźniki, można przenieść do oddzielnej tabeli wymiarów śmieci. Te atrybuty również nie należą do żadnych innych istniejących tabel wymiarów. Ogólnie wartości tych atrybutów to po prostu „tak / nie” (lub) „prawda / fałsz”.
Tworzenie nowego wymiaru dla każdego pojedynczego atrybutu flagi komplikuje to, tworząc większą liczbę kluczy obcych do tabeli faktów. Jednocześnie zachowanie wszystkich tych flag i informacji o wskaźnikach w rzeczywistych tabelach również zwiększa ilość danych przechowywanych w faktach, co w ten sposób obniża wydajność.
Dlatego najlepszym rozwiązaniem jest utworzenie pojedynczego wymiaru śmieciowego, ponieważ wymiar śmieciowy jest w stanie pomieścić dowolną liczbę wskaźników „tak / nie” lub „prawda / fałsz”. Jednak wymiary śmieciowe przechowują wartości opisowe dla tych wskaźników (tak / nie (lub) prawda / fałsz), takie jak aktywny i oczekujący itp.
W oparciu o złożoność tabeli faktów i jej wskaźników, tabela faktów może mieć jeden lub więcej wymiarów śmieci.
Przykład Junk Dimension.
# 4) Wymiar odgrywania ról
Pojedynczy wymiar, do którego można odwoływać się do wielu celów w tabeli faktów, nazywany jest wymiarem odgrywania ról.
Najlepszym przykładem wymiaru odgrywania ról jest ponownie tabela wymiarów Data, ponieważ ten sam atrybut daty w wymiarze może być używany do różnych celów, takich jak data zamówienia, data dostawy, data transakcji, data anulowania, itp.
W razie potrzeby można utworzyć cztery różne widoki w tabeli wymiarów dat w odniesieniu do czterech różnych atrybutów daty w tabeli faktów.
Przykład wymiaru odgrywania ról.
# 5) Zdegenerowane wymiary
Może istnieć kilka atrybutów, które nie mogą być ani wymiarami (metrykami), ani faktami (miarami), ale wymagają analizy. Wszystkie takie atrybuty można przenieść do zdegenerowanych wymiarów.
Na przykład, możesz traktować numer zamówienia, numer faktury itp. jako zdegenerowane atrybuty wymiaru.
Przykład zdegenerowanego wymiaru.
# 6) Powoli zmieniające się wymiary
Wolno zmieniający się wymiar to rodzaj, w którym dane mogą zmieniać się powoli w dowolnym momencie, a nie w okresowych, regularnych odstępach czasu. Zmodyfikowane dane w tabelach wymiarów można obsługiwać na różne sposoby, jak wyjaśniono poniżej.
Możesz wybrać typ SCD, aby zareagować na zmianę indywidualnie dla każdego atrybutu w tabeli wymiarów.
(i) SCD typu 1
- W typie 1, gdy następuje zmiana wartości atrybutów wymiarowych, istniejące wartości są nadpisywane nowo zmodyfikowanymi wartościami, co jest niczym innym jak aktualizacją.
- Stare dane nie są przechowywane w celach informacyjnych.
- Wcześniejszych raportów nie można odtworzyć z powodu braku starych danych.
- Łatwy w utrzymaniu.
- Wpływ na tabele faktów jest większy.
Przykład SCD typu 1:
(Ii) SCD typu 2
- W typie 2, gdy następuje zmiana wartości atrybutów wymiarowych, nowy wiersz zostanie wstawiony ze zmodyfikowanymi wartościami bez zmiany starych danych wiersza.
- Jeśli w którejkolwiek z tabel faktów istnieje odniesienie do klucza obcego do starego rekordu, wówczas stary klucz zastępczy jest aktualizowany wszędzie o nowy klucz zastępczy automatycznie.
- Powyższy krok ma bardzo mniejszy wpływ na zmiany tabeli faktów.
- Po zmianach stare dane nie są nigdzie uwzględniane.
- W typie 2 możemy śledzić wszystkie zmiany zachodzące w atrybutach wymiarowych.
- Nie ma ograniczeń co do przechowywania danych historycznych.
- W typie 2 dodanie kilku atrybutów do każdego wiersza, takich jak zmieniona data, efektywna data-godzina, data-godzina zakończenia, powód zmiany i bieżąca flaga jest opcjonalne. Jest to jednak istotne, jeśli firma chce poznać liczbę zmian wprowadzonych w określonym przedziale czasu.
Przykład SCD typu 2:
(Iii) SCD typu 3
- W typie 3, gdy następuje zmiana wartości atrybutów wymiarowych, nowe wartości są aktualizowane, ale stare wartości nadal pozostają ważne jako druga opcja.
- Zamiast dodawać nowy wiersz dla każdej zmiany, zostanie dodana nowa kolumna, jeśli wcześniej nie istniała.
- Stare wartości są umieszczane w wyżej dodanych atrybutach, a dane głównego atrybutu są nadpisywane zmienioną wartością, jak w typie 1.
- Istnieje ograniczenie przechowywania danych historycznych.
- Wpływ na tabele faktów jest większy.
Przykład SCD typu 3:
(iv) SCD typu 4
- W typie 4 bieżące dane są przechowywane w jednej tabeli.
- Wszystkie dane historyczne są przechowywane w innej tabeli.
Przykład SCD typu 4:
(v) SCD typu 6
- Tabela wymiarów może również zawierać kombinację wszystkich trzech typów SCD 1, 2 i 3, która jest znana jako powoli zmieniający się wymiar typu 6 (lub) hybrydowego.
Tabele faktów
Tabele faktów przechowują zestaw wartości mierzonych ilościowo, które są używane do obliczeń. Wartości z tabeli faktów są wyświetlane w raportach biznesowych. W przeciwieństwie do tekstowych typów danych tabel wymiarów, typ danych tabel faktów jest znacznie liczbowy.
Tabele faktów są głębokie, podczas gdy tabele wymiarów są szerokie, ponieważ tabele faktów będą miały większą liczbę wierszy i mniejszą liczbę kolumn. Klucz podstawowy zdefiniowany w tabeli faktów służy przede wszystkim do oddzielnej identyfikacji każdego wiersza. Klucz podstawowy jest również nazywany w rzeczywistości kluczem złożonym.
Jeśli w tabeli faktów brakuje klucza złożonego, a dowolne dwa rekordy zawierają te same dane, bardzo trudno jest rozróżnić dane i odnieść się do danych w tabelach wymiarów.
Dlatego też, jeśli jako klucz złożony istnieje odpowiedni klucz unikatowy, dobrze jest wygenerować numer kolejny dla każdego rekordu tabeli faktów. Inną alternatywą jest utworzenie połączonego klucza podstawowego. Zostanie to wygenerowane przez konkatenację wszystkich odpowiednich kluczy podstawowych tabel wymiarów w wierszach.
Pojedyncza tabela faktów może być otoczona wieloma tabelami wymiarów. Za pomocą kluczy obcych, które istnieją w rzeczywistych tabelach, można odnieść się do odpowiedniego kontekstu (pełne dane) mierzonych wartości w tabelach wymiarów. Za pomocą zapytań użytkownicy będą efektywnie przeprowadzać drążenie w dół i zwijać.
Najniższy poziom danych, które można przechowywać w tabeli faktów, nazywany jest szczegółowością. Liczba tabel wymiarów skojarzonych z tabelą faktów jest odwrotnie proporcjonalna do szczegółowości danych tej tabeli faktów. tj. najmniejsza wartość pomiaru wymaga odniesienia do większej liczby tabel wymiarów.
W modelu wymiarowym tabele faktów zachowują relację wiele do wielu z tabelami wymiarów.
Przykład tabeli faktów sprzedaży:
Plan obciążenia dla tabel faktów
Możesz wydajnie załadować dane tabeli faktów, biorąc pod uwagę następujące wskaźniki:
# 1) Upuść i przywróć indeksy
Indeksy w rzeczywistości poprawiają wydajność podczas wykonywania zapytań dotyczących danych, ale obniżają wydajność podczas ładowania danych. Dlatego przed załadowaniem jakichkolwiek ogromnych danych do tabel faktów należy przede wszystkim usunąć wszystkie indeksy z tej tabeli, załadować dane i przywrócić indeksy.
# 2) Oddzielne wkładki z aktualizacji
Nie łącz wstawiania i aktualizowania rekordów podczas ładowania do tabeli faktów. Jeśli liczba aktualizacji jest mniejsza, osobno przetwarzaj wstawki i aktualizacje. Jeśli liczba aktualizacji jest większa, zaleca się skrócenie i ponowne załadowanie tabeli faktów w celu uzyskania szybkich wyników.
# 3) Partycjonowanie
Dokonaj fizycznego partycjonowania tabeli faktów na minitabele, aby uzyskać lepszą wydajność zapytań dotyczących danych zbiorczych w tabeli faktów. Z wyjątkiem administratorów baz danych i zespołu ETL nikt nie będzie świadomy podziałów na fakty.
Jako przykład , można podzielić tabelę na partycje według miesiąca, kwartału, roku itd. Podczas wykonywania zapytań uwzględniane są tylko dane podzielone na partycje zamiast skanowania całej tabeli.
# 4) Ładuj równolegle
wywiad z inżynierem sieci pytania 250 + wyjaśnienia pytań i odpowiedzi pdf
Mamy teraz pomysł na partycje w tabelach faktów. Partycje na faktach są również korzystne podczas ładowania ogromnych danych do faktów. Aby to zrobić, najpierw podziel dane logicznie na różne pliki danych i uruchom zadania ETL w celu równoległego załadowania wszystkich tych logicznych części danych.
# 5) Narzędzie do ładowania zbiorczego
W przeciwieństwie do innych systemów RDBMS, system ETL nie musi bezpośrednio utrzymywać dzienników wycofywania zmian w przypadku awarii w trakcie transakcji. Tutaj „ładowanie zbiorcze” odbywa się w faktach zamiast w „wstawkach SQL” w celu załadowania ogromnych danych. Jeśli pojedyncze ładowanie nie powiedzie się, całe dane można łatwo przeładować (lub) można je kontynuować od miejsca, w którym zostało przerwane przy ładowaniu zbiorczym.
# 6) Usuwanie rekordu faktów
Usunięcie rekordu tabeli faktów ma miejsce tylko wtedy, gdy firma wyraźnie tego chce. Jeśli istnieją jakiekolwiek dane z tabeli faktów, których już nie ma w systemach źródłowych, można je usunąć fizycznie (lub) logicznie.
- Fizyczne usunięcie: Niechciane rekordy są trwale usuwane z tabeli faktów.
- Usuwanie logiczne: Do tabeli faktów zostanie dodana nowa kolumna, np. „Usunięte” typu Bit (lub) Boolean. Działa jak flaga reprezentująca usunięte rekordy. Musisz upewnić się, że nie wybierasz usuniętych rekordów podczas sprawdzania danych tabeli faktów.
# 7) Sekwencja aktualizacji i usunięć w tabeli faktów
Gdy istnieją jakiekolwiek dane do zaktualizowania, najpierw należy zaktualizować tabele wymiarów, a następnie w razie potrzeby zaktualizować klucze zastępcze w tabeli przeglądowej, a następnie zaktualizować odpowiednią tabelę faktów. Usunięcie ma miejsce w odwrotnej kolejności, ponieważ usunięcie wszystkich niechcianych danych z tabel faktów ułatwia usuwanie połączonych niechcianych danych z tabel wymiarów.
Powinniśmy postępować zgodnie z powyższą sekwencją w obu przypadkach, ponieważ tabele wymiarów i tabele faktów zachowują integralność referencyjną przez cały czas.
Rodzaje faktów
Na podstawie zachowania danych z tabel faktów są one klasyfikowane jako tabele faktów transakcji, tabele faktów migawek i tabele faktów zbiorczych migawek. Wszystkie te trzy typy mają różne funkcje z różnymi strategiami ładowania danych.
# 1) Tabele faktów dotyczących transakcji
Jak nazwa wskazuje, tabele faktów transakcji przechowują dane na poziomie transakcji dla każdego zdarzenia, które ma miejsce. Tego rodzaju dane można łatwo przeanalizować na samym poziomie tabeli faktów. Ale w celu dalszej analizy możesz również odwołać się do powiązanych wymiarów.
Na przykład, każda sprzedaż (lub) zakup w witrynie marketingowej powinna zostać załadowana do tabeli faktów transakcji.
Przykład tabeli faktów transakcji przedstawiono poniżej.
# 2) Okresowe tabele faktów z migawkami
Jak nazwa wskazuje, dane w okresowej tabeli faktów snapshot są przechowywane w postaci migawek (obrazów) w okresowych odstępach czasu, np. Na każdy dzień, tydzień, miesiąc, kwartał itp. W zależności od potrzeb biznesowych.
Jest więc jasne, że jest to agregacja danych przez cały czas. Dlatego fakty dotyczące migawek są bardziej złożone w porównaniu z tabelami faktów transakcji. Na przykład, wszelkie dane z raportów o przychodach z wyników można przechowywać w tabelach faktów w postaci migawek, aby ułatwić do nich dostęp.
Poniżej przedstawiono przykład okresowej tabeli faktów z migawkami.
# 3) Gromadzenie tabel podsumowania faktów
Zbiorcze tabele faktów z migawkami umożliwiają przechowywanie danych w tabelach przez cały okres istnienia produktu. Działa to jako połączenie dwóch powyższych typów, w których dane mogą być wstawiane przez dowolne zdarzenie w dowolnym momencie jako migawka.
W tym typie dodatkowe kolumny z datami i dane dla każdego wiersza są aktualizowane wraz z każdym kamieniem milowym tego produktu.
Przykład zbiorczej tabeli faktów z migawki.
Oprócz powyższych trzech typów, oto kilka innych typów tabel faktów:
# 4) Bez faktów tabele faktów: Fakt to zbiór miar, podczas gdy fakt mniej obejmuje tylko zdarzenia (lub) warunki, które nie zawierają żadnych miar. Tabela faktów bez faktów jest używana głównie do śledzenia systemu. Dane w tych tabelach mogą być analizowane i wykorzystywane do raportowania.
Na przykład, możesz poszukać danych pracownika, który skorzystał z urlopu i rodzaju urlopu w ciągu roku itp. Uwzględniając wszystkie te niejasne szczegóły faktów, tabela z pewnością zwiększy rozmiar faktów.
Przykład bezbłędnej tabeli faktów pokazano poniżej.
# 5) Zgodne tabele faktów: Fakt potwierdzony to fakt, do którego można odnosić się w ten sam sposób w każdej zbiorczej bazie danych, do której jest on powiązany.
Specyfikacje tabeli faktów
Poniżej podano specyfikacje tabeli faktów.
- Nazwa faktu: Jest to ciąg opisujący w skrócie funkcjonalność tabeli faktów.
- Proces biznesowy: Rozmowy o biznesie muszą być wypełnione tabelą faktów.
- Pytania: Wymienia listę pytań biznesowych, na które odpowiedzi będzie zawierała tabela faktów.
- Ziarno: Wskazuje najniższy poziom szczegółowości związany z danymi tej tabeli faktów.
- Wymiary: Wypisz wszystkie tabele wymiarów skojarzone z tą tabelą faktów.
- Środki: Obliczone wartości zapisane w tabeli faktów.
- Częstotliwość obciążenia Reprezentuje przedziały czasowe ładowania danych do tabeli faktów.
- Pierwsze rzędy: Odwołaj się do początkowych danych wprowadzonych do tabeli faktów po raz pierwszy.
Przykład wymiarowego modelowania danych
Możesz dowiedzieć się, jak można zaprojektować tabele wymiarów i tabele faktów dla systemu, patrząc na poniższy diagram modelowania danych wymiarowych dla sprzedaży i zamówień.
Wniosek
Do tej pory powinieneś zdobyć doskonałą wiedzę na temat technik modelowania danych wymiarowych, ich korzyści, mitów, tabel wymiarów, tabel faktów, a także ich typów i procesów.
Sprawdź nasz nadchodzący samouczek, aby dowiedzieć się więcej o schematach hurtowni danych !!
=> Odwiedź tutaj, aby nauczyć się hurtowni danych od podstaw.
rekomendowane lektury
- Samouczek dotyczący testowania hurtowni danych z przykładami | Przewodnik po testach ETL
- Przykłady eksploracji danych: najczęstsze zastosowania eksploracji danych 2021
- Python DateTime Tutorial z przykładami
- Podstawy hurtowni danych: kompletny przewodnik z przykładami
- Samouczek dotyczący testowania objętościowego: przykłady i narzędzia do testowania objętościowego
- 10 najpopularniejszych narzędzi hurtowni danych i technologii testowania
- Eksploracja danych: proces, techniki i główne problemy w analizie danych
- Jak przeprowadzić testy oparte na danych w SoapUI Pro - samouczek SoapUI nr 14