top 32 best datastage interview questions
Lista najczęściej zadawanych pytań i odpowiedzi do wywiadów z datastage, które pomogą Ci przygotować się do nadchodzącej rozmowy kwalifikacyjnej:
DataStage to bardzo popularne narzędzie ETL, które było dostępne na obecnym rynku.
W tym artykule udostępniam zestaw bardzo przydatnych pytań-odpowiedzi przeznaczonych do wywiadów z IBM Datastage. Przejrzenie poniższych pytań do wywiadu Datastage może ułatwić ci złamanie wywiadu.
Omówiliśmy szczegółowe odpowiedzi na pytania do wywiadów Datastage, które będą pomocne dla świeżo upieczonych i doświadczonych profesjonalistów.
Zalecana lektura => Pytania do rozmowy kwalifikacyjnej testującej ETL
Najczęstsze pytania i odpowiedzi do wywiadów dotyczących datastage
Zaczynajmy!
Pytanie 1) Co to jest Datastage?
Odpowiedzi: Datastage to plik Narzędzie ETL podane przez IBM który wykorzystuje graficzny interfejs użytkownika do projektowania rozwiązań integracji danych. Było to pierwsze narzędzie ETL, które dało koncepcję paralelizmu.
Jest dostępny w 3 różnych edycjach
- Wersja serwerowa
- Wersja Enterprise
- Edycja MVS
Pytanie 2) Podkreśl główne cechy Datastage?
Odpowiedzi: Główne cechy Datastage zostały przedstawione poniżej:
- Jest to komponent integracji danych serwera informacyjnego IBM Infosphere.
- Jest to narzędzie oparte na GUI. Wystarczy przeciągnąć i upuścić obiekty Datastage i przekonwertować je na kod Datastage.
- Służy do wykonywania operacji ETL (wyodrębnianie, przekształcanie, ładowanie)
- Zapewnia łączność z wieloma źródłami i wieloma celami w tym samym czasie
- Zapewnia techniki partycjonowania i przetwarzania równoległego, które umożliwiają zadaniom Datastage przetwarzanie ogromnych ilości danych dość szybciej.
- Posiada łączność na poziomie przedsiębiorstwa.
P # 3) Jakie są główne zastosowania narzędzia Datastage?
Odpowiedzi: Datastage to narzędzie ETL, które jest używane głównie do wyodrębniania danych z systemów źródłowych, przekształcania tych danych i ostatecznie ładowania ich do systemów docelowych.
P # 4) Jakie są główne różnice zaobserwowane między wersjami 7.xi 8.x programu DataStage?
Odpowiedzi: Tutaj to główne różnice między obiema wersjami
7.x | 8.x |
---|---|
Wersja 7.x była zależna od platformy | Ta wersja jest niezależna od platformy |
Ma dwuwarstwową architekturę, w której datastage jest zbudowany na serwerze Unix | Ma trójwarstwową architekturę, w której na dole mamy bazę danych serwera UNIX, a następnie bazę danych XMETA, która działa jako repozytorium, a następnie mamy na górze bazę danych. |
Nie ma koncepcji zestawu parametrów | Mamy zestawy parametrów, których można używać w dowolnym miejscu projektu. |
Projektant i menadżer byli dwoma osobnymi klientami | W tej wersji klient menedżera został połączony z klientem projektanta |
Musieliśmy ręcznie wyszukiwać oferty pracy w tej wersji | Tutaj mamy opcję szybkiego wyszukiwania w repozytorium, w którym możemy łatwo wyszukiwać oferty pracy. |
P # 5) Czy możesz wskazać główne cechy serwera informacyjnego IBM Infosphere?
Odpowiedzi: Główne cechy pakietu serwerów informacyjnych IBM Infosphere to:
jak otworzyć plik .java
- Zapewnia pojedynczą platformę do integracji danych. Może łączyć się z wieloma systemami źródłowymi, a także zapisywać w wielu systemach docelowych.
- Opiera się na scentralizowanych warstwach. Wszystkie składniki pakietu mogą współdzielić podstawową architekturę pakietu.
- Posiada warstwy dla ujednoliconego repozytorium, dla zintegrowanych usług metadanych i wspólnego silnika równoległego.
- Dostarcza narzędzi do analizy, czyszczenia, monitorowania, przekształcania i dostarczania danych.
- Posiada możliwości przetwarzania masowo równoległego. Okazuje się, że przetwarzanie jest bardzo szybkie.
P # 6) Jakie są różne warstwy w architekturze serwera informacji?
Odpowiedzi: Poniżej przedstawiono różne warstwy architektury serwera informacji
- Zunifikowany interfejs użytkownika
- Usługi wspólne
- Ujednolicone przetwarzanie równoległe
- Ujednolicone metadane
- Wspólna łączność
P # 7) Co może być systemem źródła danych?
Odpowiedzi: Może to być tabela bazy danych, plik płaski, a nawet aplikacja zewnętrzna, np. People soft.
P # 8) Na którym interfejsie będziesz pracować jako programista?
Odpowiedzi: Jako programista Datastage pracujemy nad interfejsem klienta Datastage, znanym jako projektant Datastage, który należy zainstalować w systemie lokalnym. W zapleczu jest połączony z serwerem Datastage.
P # 9) Jakie są różne typowe usługi w Datastage?
Odpowiedzi: Poniżej znajduje się lista typowych usług w Datastage:
- Usługi metadanych
- Ujednolicone wdrażanie usług
- Służby Bezpieczeństwa
- Usługi w zakresie pętli i raportowania.
P # 10) Jak rozpocząć tworzenie projektu Datastage?
Odpowiedzi: Pierwszym krokiem jest utworzenie zadania Datastage na serwerze Datastage. Wszystkie tworzone przez nas obiekty Datastage są przechowywane w projekcie Datastage. Projekt Datastage to oddzielne środowisko na serwerze dla zadań, tabel, definicji i procedur.
Projekt Datastage to oddzielne środowisko na serwerze dla zadań, tabel, definicji i procedur.
P # 11) Co to jest praca DataStage?
Odpowiedzi: Zadanie Datastage to po prostu kod DataStage, który tworzymy jako programista. Zawiera różne etapy połączone ze sobą w celu zdefiniowania przepływu danych i procesu.
Etapy to nic innego jak wdrażane funkcjonalności.
Na przykład: Załóżmy, że chcę zrobić sumę kwoty sprzedaży. Może to być operacja „grupuj według”, która zostanie wykonana na jednym etapie.
Teraz chcę zapisać wynik do pliku docelowego. Tak więc ta operacja zostanie wykonana przez inny etap. Kiedy już zdefiniowałem oba etapy, muszę zdefiniować przepływ danych z mojego etapu „grupa po” do etapu pliku docelowego. Ten przepływ danych jest definiowany przez łącza DataStage.
Kiedy już zdefiniowałem oba etapy, muszę zdefiniować przepływ danych z etapu „grupa po” do etapu pliku docelowego. Ten przepływ danych jest definiowany przez łącza DataStage.
P # 12) Co to są sekwencje DataStage?
Odpowiedzi: Sekwencja datastage łączy zadania DataStage w logicznym przepływie.
jak pisać automatyczne skrypty testowe
P # 13) Jeśli chcesz używać tego samego fragmentu kodu w różnych zadaniach, jak to osiągniesz?
Odpowiedzi: Można to zrobić za pomocą udostępnionych kontenerów. Udostępniliśmy pojemniki do ponownego użycia. Współdzielony kontener to element pracy wielokrotnego użytku, składający się z etapów i łączy. Możemy wywołać udostępniony kontener w różnych zadaniach Datastage.
P # 14) Gdzie są przechowywane zadania Datastage?
Odpowiedzi: Zadania Datastage są przechowywane w repozytorium. Mamy różne foldery, w których możemy przechowywać zadania Datastage.
P # 15) Gdzie widzisz różne etapy w projektancie?
Odpowiedzi: Wszystkie etapy są dostępne w oknie o nazwie ' Paleta ' . Ma różne kategorie w zależności od rodzaju funkcji, jaką pełni scena.
Różne kategorie etapów w Palecie to - Ogólne, Jakość danych, Baza danych, Rozwój, Plik, Przetwarzanie itp.
P # 16) Jakie są etapy przetwarzania?
Odpowiedzi: Etapy przetwarzania pozwalają nam zastosować rzeczywistą transformację danych.
Na przykład , The ' Agregator ”w kategorii Przetwarzanie pozwala nam zastosować wszystkie operacje„ grupuj według ”. Podobnie mamy inne etapy przetwarzania, takie jak etap „Łączenie”, który pozwala nam połączyć dane pochodzące z dwóch różnych strumieni wejściowych.
P # 17) Jakie kroki są potrzebne do utworzenia prostego podstawowego zadania Datastage?
Odpowiedzi: Kliknij Plik -> Kliknij Nowy -> Wybierz zadanie równoległe i naciśnij OK. Otworzy się równoległe okno zadań. W tej równoległej pracy możemy połączyć różne etapy i zdefiniować przepływ danych między nimi. Najprostszym zadaniem DataStage jest zadanie ETL.
W tym celu najpierw musimy wyodrębnić dane z systemu źródłowego, dla którego możemy użyć etapu pliku lub etapu bazy danych, ponieważ moim systemem źródłowym może być tabela bazy danych lub plik.
Załóżmy, że czytamy dane z pliku tekstowego. W takim przypadku przeciągniemy i upuścimy etap „Plik sekwencyjny” do równoległego okna zadania. Teraz musimy przeprowadzić transformację na tych danych. Skorzystamy z etapu „Transformer”, który jest dostępny w kategorii Przetwarzanie. Możemy napisać dowolną logikę pod sceną Transformer.
Na koniec musimy załadować przetworzone dane do jakiejś tabeli docelowej. Powiedzmy, że moją docelową bazą danych jest DB2. W tym celu wybierzemy etap konektora DB2. Następnie będziemy łączyć te stany danych poprzez sekwencyjne łącza.
Po tym , musimy skonfigurować etapy tak, aby wskazywały na właściwy system plików lub bazę danych.
Na przykład, Dla etapu Plik sekwencyjny musimy zdefiniować obowiązkowe parametry, takie jak nazwa pliku, lokalizacja pliku, metadane kolumny.
Następnie musimy skompilować zadanie Datastage. Kompilowanie zadania sprawdza składnię zadania i tworzy plik wykonywalny dla zadania Datastage, który można wykonać w czasie wykonywania.
Q # 18) Nazwij różne metody sortowania w Datastage.
Odpowiedzi: Dostępne są dwie metody:
- Sortowanie linków
- Wbudowane sortowanie danych
P # 19) W przypadku wsadu, jeśli zadanie nie powiedzie się w międzyczasie i chcesz ponownie uruchomić wsad od tego konkretnego zadania, a nie od zera, to co zrobisz?
Odpowiedzi: W Datastage istnieje opcja sekwencji zadań - „Dodaj punkty kontrolne, aby sekwencję można było uruchomić ponownie w przypadku niepowodzenia” . Jeśli ta opcja jest zaznaczona, możemy ponownie uruchomić sekwencję zadań od miejsca, w którym się nie powiodła.
P # 20) Jak importujesz i eksportujesz zadania Datastage?
Odpowiedzi: F. lub to, poniżej funkcje wiersza poleceń do tego
- Import: dsimport.exe
- Eksport: dsexport.exe
P # 21) Jakie są procedury w Datastage? Zbierz różne rodzaje procedur.
Odpowiedzi: rutynowe to zestaw funkcji, które są definiowane przez menedżera DS. Jest prowadzony przez stopień transformatora.
Istnieją 3 rodzaje procedur:
- Procedury równoległe
- Procedury mainframe
- Procedury serwera
P # 22) Jak usunąć zduplikowane wartości w DataStage?
Odpowiedzi: Istnieją dwa sposoby obsługi zduplikowanych wartości
aplikacja do kart czasu na iPhone'a i Androida
- Możemy użyć etapu remove duplicate, aby wyeliminować duplikaty.
- Możemy użyć etapu Sortowanie, aby usunąć duplikat. Etap sortowania ma właściwość o nazwie „zezwalaj na duplikaty”. Nie otrzymamy zduplikowanych wartości w wyniku sortowania po ustawieniu tej właściwości na wartość false.
P # 23) Jakie rodzaje widoków są dostępne w dyrektorze Datastage?
Odpowiedzi: W dyrektorze Datastage dostępne są 3 rodzaje widoków. Oni są:
- Widok dziennika
- Widok statusu
- Widok stanowiska
Q # 24) Rozróżnij Informatica i Datastage. Który byś wybrał i dlaczego?
Odpowiedzi: Informatica i DataStage to potężne narzędzia ETL.
Wymienione punkty rozróżniają oba narzędzia:
Przetwarzanie danych | Datastage | |
---|---|---|
Przetwarzanie równoległe | Informatica nie obsługuje przetwarzania równoległego. | W przeciwieństwie do tego, datastage zapewnia mechanizm przetwarzania równoległego. |
Wdrażanie SCD | Implementacja SCD (wolno zmieniających się wymiarów) w Informatice jest dość prosta. | Jednak implementacja SCD w datastage jest skomplikowana. Datastage obsługuje dyski SCD jedynie za pomocą niestandardowych skryptów. |
Kontrola wersji | Informatica obsługuje kontrolę wersji poprzez rejestrację i wyewidencjonowanie obiektów. | Jednak nie mamy tej funkcji w datastage. |
Dostępne transformacje | Dostępne są mniejsze transformacje. | Datastage oferuje większą różnorodność przekształceń niż Informatica. |
Moc wyszukiwania | Informatica zapewnia bardzo potężne dynamiczne wyszukiwanie pamięci podręcznej | Nie mamy czegoś podobnego w datastage. |
Moim zdaniem wybrałbym Informatica zamiast Datastage. Powodem jest to, że dla mnie Informatica jest bardziej systematyczny i przyjazny dla użytkownika niż DataStage.
Innym ważnym powodem jest to, że debugowanie i obsługa błędów jest znacznie lepsza w Informatica w porównaniu z Datastage. Tak więc naprawianie problemów staje się łatwiejsze w Informatica. Datastage nie zapewnia pełnej obsługi błędów.
=> Chcesz dowiedzieć się więcej o Informatica? Mamy szczegółowe wyjaśnienie tutaj.
Q # 25) Podaj pojęcie zmiennych systemowych.
Odpowiedzi: Zmienne systemowe to zmienne tylko do odczytu zaczynające się od „@” który może zostać odczytany przez stopień transformatora lub procedurę. Służą do pobierania informacji o systemie.
P # 26) Jaka jest różnica między etapem pasywnym a aktywnym?
Odpowiedzi: Etapy pasywne są wykorzystywane do ekstrakcji i ładowania, podczas gdy etapy aktywne są wykorzystywane do transformacji.
P # 27) Jakie rodzaje kontenerów są dostępne w Datastage?
Odpowiedzi: Mamy poniżej 2 kontenerów w Datastage:
- Lokalny kontener
- Współdzielony kontener
P # 28) Czy wartość zmiennej pomostowej jest przechowywana tymczasowo czy na stałe?
Odpowiedzi: Tymczasowo. Jest to zmienna tymczasowa.
P # 29) Jakie są różne rodzaje zadań w Datastage?
Odpowiedzi: W Datastage mamy dwa rodzaje zadań:
- Zadania serwera (działają sekwencyjnie)
- Zadania równoległe (są wykonywane równolegle)
Q # 30) Jakie jest zastosowanie Datastage Director?
Odpowiedzi: Za pośrednictwem dyrektora Datastage możemy zaplanować zadanie, zweryfikować zadanie, wykonać zadanie i monitorować zadanie.
P # 31) Jakie są różne rodzaje pliku skrótu?
Odpowiedzi: Mamy 2 typy plików hash:
- Statyczny plik skrótu
- Dynamiczny plik skrótu
P # 32) Co to jest etap jakości?
Odpowiedzi: Etap jakości (zwany również etapem integralności) to etap, który pomaga w łączeniu razem danych pochodzących z różnych źródeł.
Wniosek
Powinieneś mieć przy sobie przydatną wiedzę o architekturze Datastage, jej głównych cechach i powinieneś umieć wyjaśnić, czym różni się ona od innych popularnych narzędzi ETL.
dodatkowo , powinieneś mieć rzetelny pomysł na różne etapy i ich wykorzystanie, kompleksowy sposób tworzenia zadania Datastage i jego uruchamiania.
Zalecana lektura => Co to jest testowanie ETL?
Wszystkiego najlepszego!
rekomendowane lektury
- ETL Testing Interview Pytania i odpowiedzi
- 10 najlepszych narzędzi do mapowania danych przydatnych w procesie ETL (LISTA 2021)
- 15 najlepszych narzędzi ETL w 2021 roku (pełna zaktualizowana lista)
- Samouczek dotyczący testowania hurtowni danych z przykładami | Przewodnik po testach ETL
- Samouczek dotyczący testowania hurtowni danych ETL (kompletny przewodnik)
- Testowanie ETL vs. Testowanie DB - Bliższe spojrzenie na potrzeby testowania ETL, planowanie i narzędzia ETL
- Jak przeprowadzić testy ETL za pomocą narzędzia Informatica PowerCenter
- Metadane w hurtowni danych (ETL) wyjaśnione w przykładach
- Komunikat prasowy - iCEDQ Soft Nowa wersja platformy testowania ETL i migracji danych
- 10 najlepszych narzędzi testowych ETL w 2021 r
- Co to jest proces ETL (wyodrębnianie, przekształcanie, ładowanie) w hurtowni danych?