32 najlepsze pytania i odpowiedzi do wywiadów z danymi

top 32 best datastage interview questions

Wypróbuj Nasz Instrument Do Eliminowania Problemów

Wybierz System Operacyjny Wybierz Program Projekcji (Opcjonalnie)

Opisz Swój Problem

Lista najczęściej zadawanych pytań i odpowiedzi do wywiadów z datastage, które pomogą Ci przygotować się do nadchodzącej rozmowy kwalifikacyjnej:

DataStage to bardzo popularne narzędzie ETL, które było dostępne na obecnym rynku.

W tym artykule udostępniam zestaw bardzo przydatnych pytań-odpowiedzi przeznaczonych do wywiadów z IBM Datastage. Przejrzenie poniższych pytań do wywiadu Datastage może ułatwić ci złamanie wywiadu.

Omówiliśmy szczegółowe odpowiedzi na pytania do wywiadów Datastage, które będą pomocne dla świeżo upieczonych i doświadczonych profesjonalistów.

Zalecana lektura => Pytania do rozmowy kwalifikacyjnej testującej ETL

Pytania i odpowiedzi do wywiadu dotyczącego datastage

Najczęstsze pytania i odpowiedzi do wywiadów dotyczących datastage

Zaczynajmy!

Pytanie 1) Co to jest Datastage?

Odpowiedzi: Datastage to plik Narzędzie ETL podane przez IBM który wykorzystuje graficzny interfejs użytkownika do projektowania rozwiązań integracji danych. Było to pierwsze narzędzie ETL, które dało koncepcję paralelizmu.

IBM

Jest dostępny w 3 różnych edycjach

Wersja serwerowa
Wersja Enterprise
Edycja MVS

Pytanie 2) Podkreśl główne cechy Datastage?

Odpowiedzi: Główne cechy Datastage zostały przedstawione poniżej:

Jest to komponent integracji danych serwera informacyjnego IBM Infosphere.
Jest to narzędzie oparte na GUI. Wystarczy przeciągnąć i upuścić obiekty Datastage i przekonwertować je na kod Datastage.
Służy do wykonywania operacji ETL (wyodrębnianie, przekształcanie, ładowanie)
Zapewnia łączność z wieloma źródłami i wieloma celami w tym samym czasie
Zapewnia techniki partycjonowania i przetwarzania równoległego, które umożliwiają zadaniom Datastage przetwarzanie ogromnych ilości danych dość szybciej.
Posiada łączność na poziomie przedsiębiorstwa.

P # 3) Jakie są główne zastosowania narzędzia Datastage?

Odpowiedzi: Datastage to narzędzie ETL, które jest używane głównie do wyodrębniania danych z systemów źródłowych, przekształcania tych danych i ostatecznie ładowania ich do systemów docelowych.

P # 4) Jakie są główne różnice zaobserwowane między wersjami 7.xi 8.x programu DataStage?

Odpowiedzi: Tutaj to główne różnice między obiema wersjami

7.x	8.x
Wersja 7.x była zależna od platformy	Ta wersja jest niezależna od platformy
Ma dwuwarstwową architekturę, w której datastage jest zbudowany na serwerze Unix	Ma trójwarstwową architekturę, w której na dole mamy bazę danych serwera UNIX, a następnie bazę danych XMETA, która działa jako repozytorium, a następnie mamy na górze bazę danych.
Nie ma koncepcji zestawu parametrów	Mamy zestawy parametrów, których można używać w dowolnym miejscu projektu.
Projektant i menadżer byli dwoma osobnymi klientami	W tej wersji klient menedżera został połączony z klientem projektanta
Musieliśmy ręcznie wyszukiwać oferty pracy w tej wersji	Tutaj mamy opcję szybkiego wyszukiwania w repozytorium, w którym możemy łatwo wyszukiwać oferty pracy.

P # 5) Czy możesz wskazać główne cechy serwera informacyjnego IBM Infosphere?

Odpowiedzi: Główne cechy pakietu serwerów informacyjnych IBM Infosphere to:

jak otworzyć plik .java

Zapewnia pojedynczą platformę do integracji danych. Może łączyć się z wieloma systemami źródłowymi, a także zapisywać w wielu systemach docelowych.
Opiera się na scentralizowanych warstwach. Wszystkie składniki pakietu mogą współdzielić podstawową architekturę pakietu.
Posiada warstwy dla ujednoliconego repozytorium, dla zintegrowanych usług metadanych i wspólnego silnika równoległego.
Dostarcza narzędzi do analizy, czyszczenia, monitorowania, przekształcania i dostarczania danych.
Posiada możliwości przetwarzania masowo równoległego. Okazuje się, że przetwarzanie jest bardzo szybkie.

P # 6) Jakie są różne warstwy w architekturze serwera informacji?

Odpowiedzi: Poniżej przedstawiono różne warstwy architektury serwera informacji

Zunifikowany interfejs użytkownika
Usługi wspólne
Ujednolicone przetwarzanie równoległe
Ujednolicone metadane
Wspólna łączność

P # 7) Co może być systemem źródła danych?

Odpowiedzi: Może to być tabela bazy danych, plik płaski, a nawet aplikacja zewnętrzna, np. People soft.

P # 8) Na którym interfejsie będziesz pracować jako programista?

Odpowiedzi: Jako programista Datastage pracujemy nad interfejsem klienta Datastage, znanym jako projektant Datastage, który należy zainstalować w systemie lokalnym. W zapleczu jest połączony z serwerem Datastage.

P # 9) Jakie są różne typowe usługi w Datastage?

Odpowiedzi: Poniżej znajduje się lista typowych usług w Datastage:

Usługi metadanych
Ujednolicone wdrażanie usług
Służby Bezpieczeństwa
Usługi w zakresie pętli i raportowania.

P # 10) Jak rozpocząć tworzenie projektu Datastage?

Odpowiedzi: Pierwszym krokiem jest utworzenie zadania Datastage na serwerze Datastage. Wszystkie tworzone przez nas obiekty Datastage są przechowywane w projekcie Datastage. Projekt Datastage to oddzielne środowisko na serwerze dla zadań, tabel, definicji i procedur.

Projekt Datastage to oddzielne środowisko na serwerze dla zadań, tabel, definicji i procedur.

P # 11) Co to jest praca DataStage?

Odpowiedzi: Zadanie Datastage to po prostu kod DataStage, który tworzymy jako programista. Zawiera różne etapy połączone ze sobą w celu zdefiniowania przepływu danych i procesu.

Etapy to nic innego jak wdrażane funkcjonalności.

Na przykład: Załóżmy, że chcę zrobić sumę kwoty sprzedaży. Może to być operacja „grupuj według”, która zostanie wykonana na jednym etapie.

Teraz chcę zapisać wynik do pliku docelowego. Tak więc ta operacja zostanie wykonana przez inny etap. Kiedy już zdefiniowałem oba etapy, muszę zdefiniować przepływ danych z mojego etapu „grupa po” do etapu pliku docelowego. Ten przepływ danych jest definiowany przez łącza DataStage.

Kiedy już zdefiniowałem oba etapy, muszę zdefiniować przepływ danych z etapu „grupa po” do etapu pliku docelowego. Ten przepływ danych jest definiowany przez łącza DataStage.

łącza do datastage

P # 12) Co to są sekwencje DataStage?

Odpowiedzi: Sekwencja datastage łączy zadania DataStage w logicznym przepływie.

jak pisać automatyczne skrypty testowe

P # 13) Jeśli chcesz używać tego samego fragmentu kodu w różnych zadaniach, jak to osiągniesz?

Odpowiedzi: Można to zrobić za pomocą udostępnionych kontenerów. Udostępniliśmy pojemniki do ponownego użycia. Współdzielony kontener to element pracy wielokrotnego użytku, składający się z etapów i łączy. Możemy wywołać udostępniony kontener w różnych zadaniach Datastage.

P # 14) Gdzie są przechowywane zadania Datastage?

Odpowiedzi: Zadania Datastage są przechowywane w repozytorium. Mamy różne foldery, w których możemy przechowywać zadania Datastage.

P # 15) Gdzie widzisz różne etapy w projektancie?

Odpowiedzi: Wszystkie etapy są dostępne w oknie o nazwie ' Paleta ' . Ma różne kategorie w zależności od rodzaju funkcji, jaką pełni scena.

Różne kategorie etapów w Palecie to - Ogólne, Jakość danych, Baza danych, Rozwój, Plik, Przetwarzanie itp.

P # 16) Jakie są etapy przetwarzania?

Odpowiedzi: Etapy przetwarzania pozwalają nam zastosować rzeczywistą transformację danych.

Na przykład , The ' Agregator ”w kategorii Przetwarzanie pozwala nam zastosować wszystkie operacje„ grupuj według ”. Podobnie mamy inne etapy przetwarzania, takie jak etap „Łączenie”, który pozwala nam połączyć dane pochodzące z dwóch różnych strumieni wejściowych.

P # 17) Jakie kroki są potrzebne do utworzenia prostego podstawowego zadania Datastage?

Odpowiedzi: Kliknij Plik -> Kliknij Nowy -> Wybierz zadanie równoległe i naciśnij OK. Otworzy się równoległe okno zadań. W tej równoległej pracy możemy połączyć różne etapy i zdefiniować przepływ danych między nimi. Najprostszym zadaniem DataStage jest zadanie ETL.

W tym celu najpierw musimy wyodrębnić dane z systemu źródłowego, dla którego możemy użyć etapu pliku lub etapu bazy danych, ponieważ moim systemem źródłowym może być tabela bazy danych lub plik.

Załóżmy, że czytamy dane z pliku tekstowego. W takim przypadku przeciągniemy i upuścimy etap „Plik sekwencyjny” do równoległego okna zadania. Teraz musimy przeprowadzić transformację na tych danych. Skorzystamy z etapu „Transformer”, który jest dostępny w kategorii Przetwarzanie. Możemy napisać dowolną logikę pod sceną Transformer.

Na koniec musimy załadować przetworzone dane do jakiejś tabeli docelowej. Powiedzmy, że moją docelową bazą danych jest DB2. W tym celu wybierzemy etap konektora DB2. Następnie będziemy łączyć te stany danych poprzez sekwencyjne łącza.

Po tym , musimy skonfigurować etapy tak, aby wskazywały na właściwy system plików lub bazę danych.

Na przykład, Dla etapu Plik sekwencyjny musimy zdefiniować obowiązkowe parametry, takie jak nazwa pliku, lokalizacja pliku, metadane kolumny.

Następnie musimy skompilować zadanie Datastage. Kompilowanie zadania sprawdza składnię zadania i tworzy plik wykonywalny dla zadania Datastage, który można wykonać w czasie wykonywania.

Q # 18) Nazwij różne metody sortowania w Datastage.

Odpowiedzi: Dostępne są dwie metody:

Sortowanie linków
Wbudowane sortowanie danych

metody sortowania

P # 19) W przypadku wsadu, jeśli zadanie nie powiedzie się w międzyczasie i chcesz ponownie uruchomić wsad od tego konkretnego zadania, a nie od zera, to co zrobisz?

Odpowiedzi: W Datastage istnieje opcja sekwencji zadań - „Dodaj punkty kontrolne, aby sekwencję można było uruchomić ponownie w przypadku niepowodzenia” . Jeśli ta opcja jest zaznaczona, możemy ponownie uruchomić sekwencję zadań od miejsca, w którym się nie powiodła.

P # 20) Jak importujesz i eksportujesz zadania Datastage?

Odpowiedzi: F. lub to, poniżej funkcje wiersza poleceń do tego

Import: dsimport.exe
Eksport: dsexport.exe

P # 21) Jakie są procedury w Datastage? Zbierz różne rodzaje procedur.

Odpowiedzi: rutynowe to zestaw funkcji, które są definiowane przez menedżera DS. Jest prowadzony przez stopień transformatora.

Istnieją 3 rodzaje procedur:

Procedury równoległe
Procedury mainframe
Procedury serwera

procedury na etapie danych

P # 22) Jak usunąć zduplikowane wartości w DataStage?

Odpowiedzi: Istnieją dwa sposoby obsługi zduplikowanych wartości

aplikacja do kart czasu na iPhone'a i Androida

Możemy użyć etapu remove duplicate, aby wyeliminować duplikaty.
Możemy użyć etapu Sortowanie, aby usunąć duplikat. Etap sortowania ma właściwość o nazwie „zezwalaj na duplikaty”. Nie otrzymamy zduplikowanych wartości w wyniku sortowania po ustawieniu tej właściwości na wartość false.

P # 23) Jakie rodzaje widoków są dostępne w dyrektorze Datastage?

Odpowiedzi: W dyrektorze Datastage dostępne są 3 rodzaje widoków. Oni są:

Widok dziennika
Widok statusu
Widok stanowiska

Q # 24) Rozróżnij Informatica i Datastage. Który byś wybrał i dlaczego?

Odpowiedzi: Informatica i DataStage to potężne narzędzia ETL.

Wymienione punkty rozróżniają oba narzędzia:

	Przetwarzanie danych	Datastage
Przetwarzanie równoległe	Informatica nie obsługuje przetwarzania równoległego.	W przeciwieństwie do tego, datastage zapewnia mechanizm przetwarzania równoległego.
Wdrażanie SCD	Implementacja SCD (wolno zmieniających się wymiarów) w Informatice jest dość prosta.	Jednak implementacja SCD w datastage jest skomplikowana. Datastage obsługuje dyski SCD jedynie za pomocą niestandardowych skryptów.
Kontrola wersji	Informatica obsługuje kontrolę wersji poprzez rejestrację i wyewidencjonowanie obiektów.	Jednak nie mamy tej funkcji w datastage.
Dostępne transformacje	Dostępne są mniejsze transformacje.	Datastage oferuje większą różnorodność przekształceń niż Informatica.
Moc wyszukiwania	Informatica zapewnia bardzo potężne dynamiczne wyszukiwanie pamięci podręcznej	Nie mamy czegoś podobnego w datastage.

Moim zdaniem wybrałbym Informatica zamiast Datastage. Powodem jest to, że dla mnie Informatica jest bardziej systematyczny i przyjazny dla użytkownika niż DataStage.

Innym ważnym powodem jest to, że debugowanie i obsługa błędów jest znacznie lepsza w Informatica w porównaniu z Datastage. Tak więc naprawianie problemów staje się łatwiejsze w Informatica. Datastage nie zapewnia pełnej obsługi błędów.

=> Chcesz dowiedzieć się więcej o Informatica? Mamy szczegółowe wyjaśnienie tutaj.

Q # 25) Podaj pojęcie zmiennych systemowych.

Odpowiedzi: Zmienne systemowe to zmienne tylko do odczytu zaczynające się od „@” który może zostać odczytany przez stopień transformatora lub procedurę. Służą do pobierania informacji o systemie.

P # 26) Jaka jest różnica między etapem pasywnym a aktywnym?

Odpowiedzi: Etapy pasywne są wykorzystywane do ekstrakcji i ładowania, podczas gdy etapy aktywne są wykorzystywane do transformacji.

P # 27) Jakie rodzaje kontenerów są dostępne w Datastage?

Odpowiedzi: Mamy poniżej 2 kontenerów w Datastage:

Lokalny kontener
Współdzielony kontener

P # 28) Czy wartość zmiennej pomostowej jest przechowywana tymczasowo czy na stałe?

Odpowiedzi: Tymczasowo. Jest to zmienna tymczasowa.

P # 29) Jakie są różne rodzaje zadań w Datastage?

Odpowiedzi: W Datastage mamy dwa rodzaje zadań:

Zadania serwera (działają sekwencyjnie)
Zadania równoległe (są wykonywane równolegle)

Q # 30) Jakie jest zastosowanie Datastage Director?

Odpowiedzi: Za pośrednictwem dyrektora Datastage możemy zaplanować zadanie, zweryfikować zadanie, wykonać zadanie i monitorować zadanie.

P # 31) Jakie są różne rodzaje pliku skrótu?

Odpowiedzi: Mamy 2 typy plików hash:

Statyczny plik skrótu
Dynamiczny plik skrótu

P # 32) Co to jest etap jakości?

Odpowiedzi: Etap jakości (zwany również etapem integralności) to etap, który pomaga w łączeniu razem danych pochodzących z różnych źródeł.

Wniosek

Powinieneś mieć przy sobie przydatną wiedzę o architekturze Datastage, jej głównych cechach i powinieneś umieć wyjaśnić, czym różni się ona od innych popularnych narzędzi ETL.

dodatkowo , powinieneś mieć rzetelny pomysł na różne etapy i ich wykorzystanie, kompleksowy sposób tworzenia zadania Datastage i jego uruchamiania.

Zalecana lektura => Co to jest testowanie ETL?

Wszystkiego najlepszego!

32 najlepsze pytania i odpowiedzi do wywiadów z danymi

Najczęstsze pytania i odpowiedzi do wywiadów dotyczących datastage

Wniosek

rekomendowane lektury

Ciekawe Artykuły

Wybór Redakcji

The Game Awards dokucza występowi Władcy Pierścieni: Gollum

Samouczek Pythona dla początkujących (praktyczne BEZPŁATNE szkolenie Python)

Wśród nominowanych do Game Awards 2022 są Ragnarok, Elden Ring i Nibel

Windows Defender kontra Avast - który z nich jest lepszym antywirusem

Narzędzia i dostawcy usług do testowania penetracji aplikacji mobilnych

Cotton 100% i Cotton Panorama docierają 29 października, zamówienia w przedsprzedaży na SNES/Mega Drive są aktywne

Bohaterka Horizon, Aloy, pojawi się w Fall Guys

Snow Blind to kolejna odsłona serii Mortal Kombat Legends

Zwiastun Grand Theft Auto VI doskonale oddaje esencję mojego rodzinnego miasta

TMNT: Cowabunga Collection będzie zawierała wycofanie kodu sieciowego dla zawodników turniejowych

Azure Striker Gunvolt w końcu otrzymuje japońskie podkłady głosowe na 3DS

Kangur Kao wraca tego lata i wygląda ostro

Skytex Softbox - the perfect solution for professional photography and videography.