how perform etl testing using informatica powercenter tool
Det er en kendt kendsgerning, at ETL-test er et af de afgørende aspekter af enhver Business Intelligence (BI) -baseret applikation. For at få kvalitetssikring og accept til at blive live i erhvervslivet, skal BI-applikationen testes i god tid.
Det primære mål med ETL - test er at sikre, at ER uddrag, T ransformere & L oad-funktionalitet fungerer i henhold til forretningskravene og synkroniseret med præstationsstandarderne.
Før vi graver i ETL-test med Computing , er det vigtigt at vide, hvad ETL og Informatica er.
Hvad du lærer:
- Hvad du lærer i denne ETL-tutorial:
- Informatica PowerCenter ETL testværktøj:
- Forståelse af ETL-test specifikt for Informatica:
- Klassificering af ETL-test i Informatica:
- Fordele ved at bruge Informatica som et ETL-værktøj:
- Nogle nyttige tip til at hjælpe dig med Informatica ETL-test:
- Konklusion:
- Anbefalet læsning
Hvad du lærer i denne ETL-tutorial:
- Grundlæggende om ETL, Informatica & ETL test.
- Forståelse af ETL-test specifikt for Informatica.
- Klassificering af ETL-test i Informatica.
- Prøveeksempler til Informatica ETL-test.
- Fordele ved at bruge Informatica som en ETL-værktøj .
- Tips & tricks til at hjælpe dig med at teste.
I databehandling henviser Extract, Transform, Load (ETL) til en proces i databaseanvendelse og især i datalager, der udfører:
- Dataekstraktion - Uddrag data fra homogene eller heterogene datakilder.
- Datatransformation - Formaterer dataene til den krævede type.
- Dataindlæsning - Flyt og gem dataene til en permanent placering til langvarig brug.
Informatica PowerCenter ETL testværktøj:
Informatica PowerCenter er et kraftfuldt ETL-værktøj fra Informatica Corporation. Det er en enkelt, samlet virksomhedsdataintegrationsplatform til at få adgang til, opdage og integrere data fra stort set ethvert forretningssystem i ethvert
Det er en enkelt samlet virksomhedsdataintegrationsplatform til at få adgang til, opdage og integrere data fra stort set ethvert forretningssystem i ethvert format og levere disse data i hele virksomheden med enhver hastighed. igennem Informatica PowerCenter , opretter vi arbejdsgange, der udfører ETL-operationer fra ende til anden.
Download og installer Informatica PowerCenter:
For at installere og konfigurere Informatica PowerCenter 9.x skal du bruge nedenstående link med trinvise instruktioner:
=> Informatica PowerCenter 9 Installations- og konfigurationsvejledning
Forståelse af ETL-test specifikt for Informatica:
ETL-testere har ofte relevante spørgsmål om, hvad man skal teste i Informatica, og hvor meget testdækning er der behov for?
Lad mig tage dig gennem en rundvisning om, hvordan man udfører ETL-test, der er specifik for Informatica.
De vigtigste aspekter, der i det væsentlige skal dækkes af Informatica ETL-test, er:
- Test af funktionaliteten i Informatica-arbejdsgangen og dens komponenter; alle de transformationer, der er brugt i de underliggende tilknytninger.
- For at kontrollere datafuldstændigheden (dvs. sikre, om de projicerede data indlæses til målet uden afkortning og datatab),
- Bekræftelse af, om dataene indlæses til målet inden for estimerede tidsgrænser (dvs. evaluering af arbejdsgangens ydeevne),
- Sikring af, at workflowet ikke tillader indlæsning af ugyldige eller uønskede data i målet.
Klassificering af ETL-test i Informatica:
For bedre forståelse og lette testeren kan ETL-test i Informatica opdeles i to hoveddele -
bedste skærmbillede værktøj til Windows 10
# 1) Test på højt niveau
# 2) Detaljeret test
For det første i test på højt niveau:
- Du kan kontrollere, om Informatica-arbejdsgangen og relaterede objekter er gyldige eller ej.
- Kontroller, om arbejdsprocessen er afsluttet med succes.
- Bekræft, om alle de nødvendige sessioner / opgaver udføres i arbejdsgangen.
- Valider, hvis dataene indlæses i det ønskede målkatalog og med det forventede filnavn (hvis arbejdsgangen opretter en fil) osv.
I en nøddeskal kan du sige, at test på højt niveau inkluderer alle de grundlæggende sundhedskontrol.
Kommer til den næste del, dvs. detaljeret test i Informatica , vil du gå i dybden for at validere, hvis den logik, der er implementeret i Informatica, fungerer som forventet med hensyn til resultater og ydeevne.
- Du skal udføre validering af outputdata på feltniveau, som vil bekræfte, at hver transformation fungerer fint
- Kontroller, om optællingen tæller på hvert behandlingsniveau, og endelig om målet er som forventet.
- Overvåg grundigt elementer som kildekvalificering og mål i kilde / målstatistik for sessionen
- Sørg for, at løbetiden for Informatica-workflowet er på niveau med den estimerede kørselstid.
For at opsummere kan vi sige, at den detaljerede test inkluderer en streng validering af slutningen til slutningen af Informatica-arbejdsgangen og den relaterede datastrøm.
Lad os tage et eksempel her:
Vi har en flad fil, der indeholder data om forskellige produkter. Den gemmer detaljer som produktets navn, beskrivelse, kategori, udløbsdato, pris osv.
Mit krav er at hente hver produktregistrering fra filen, generere et unikt produkt-id svarende til hver post og indlæse det i måldatabasetabellen. Jeg har også brug for at undertrykke de produkter, der enten hører til kategorien 'C', eller hvis udløbsdato er mindre end den aktuelle dato.
Sig, min flade fil (kilde) ser sådan ud:
(Bemærk:Klik på et hvilket som helst billede for at se et forstørret billede)
Baseret på mine krav angivet ovenfor skal min databasetabel (Target) se sådan ud:
Tabelnavn: Tbl_Product
Prod_ID (primær nøgle) | Produktnavn | Prod_description | Prod_category | Prod_udløbsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14/8/2017 | 150 |
1002 | DEF | Dette er produkt DEF. | S | 10/6/2018 | 700 |
1003 | PQRS | Dette er produkt PQRS. | M | 23.5.2019 | 1500 |
Lad os nu sige, at vi har udviklet en Informatica-arbejdsgang for at få løsningen til mine ETL-krav.
Den underliggende Informatica-kortlægning læser data fra den flade fil, sender dataene gennem en routertransformation, der vil kassere rækker, som enten har produktkategori som 'C' eller udløbsdato, så bruger jeg en sekvensgenerering til at oprette den unikke primære nøgle værdier for Kolonne Prod_ID i Produkttabel.
Endelig indlæses poster i produkttabellen, som er målet for min Informatica-kortlægning.
Eksempler:
Nedenfor er eksempler på testtilfælde for scenariet forklaret ovenfor.
Du kan bruge disse testcases som en skabelon i dit Informatica-testprojekt og tilføje / fjerne lignende testcases afhængigt af funktionaliteten i din arbejdsgang.
# 1) Test-sags-id: T001
Test sag Formål: Bekræft workflow - (workflow_name)
Test procedure:
- Gå til workflow manager
- Åbn workflow
- Workflows menu-> klik på validér
Inputværdi / testdata: Kilder og mål er tilgængelige og forbundet
Kilder: (alle kildeforekomster navn)
Kortlægninger: (alle kortlægningsnavne)
Mål: (navn på alle målinstanser)
Session: (alle sessioners navn)
Forventede resultater: Meddelelse i statuslinjen til arbejdsflowmanager: “Workflow (workflow_name) is valid“
Faktiske resultater: Meddelelse i statuslinjen til arbejdsflowmanager: “Workflow (workflow_name) is valid“
Bemærkninger:Passere
Tester Kommentarer:
# 2) Test-sags-id: T002
Test sag Formål: For at sikre, om arbejdsgangen kører korrekt
Test procedure:
- Gå til workflow manager
- Åbn workflow
- Højreklik i workflowdesigner, og vælg Start workflow
- Kontroller status i Workflow Monitor
Inputværdi / testdata: Samme som testdata for T001
Forventede resultater: Besked i outputvinduet i Workflow Manager: Opgaveopdatering: (workflow_name) (Succeeded)
Faktiske resultater: Besked i outputvinduet i Workflow Manager: Opgaveopdatering: (workflow_name) (Succeeded)
Bemærkninger:Passere
Tester Kommentarer: Workflow lykkedes
Bemærk: Du kan let se status for workflow-kørsel (mislykkedes / lykkedes) i Workflow-monitor som vist i nedenstående eksempel. Når arbejdsgangen er afsluttet, reflekteres status automatisk i arbejdsflowovervågningen.
webtjenester interview spørgsmål og svar til erfarne
I ovenstående skærmbillede kan du se starttidspunktet og sluttiden for arbejdsgangen såvel som status som succes.
# 3) Test Case ID: T003
Test sag Formål: For at validere, hvis det ønskede antal poster bliver indlæst til målet
Test procedure: Når arbejdsgangen er kørt med succes, skal du gå til måltabellen i databasen
Kontroller antallet af rækker i måldatabasetabellen
Inputværdi / testdata: 5 rækker i kildefilen
Mål: databasetabel - (Tbl_Product)
Forespørgsel, der skal køres i SQL-server: Vælg antal (1) fra (Tbl_Product)
Forventede resultater: 3 rækker valgt
Faktiske resultater: 3 rækker valgt
Bemærkninger:Passere
Tester Kommentarer:
# 4) Test Case ID: T004
Test sag Formål: For at kontrollere, om sekvensgenerator i Informatica-kortlægning fungerer fint for at udfylde (primær_nøglekolonne_navn f.eks. Prod_ID) kolonne
Test procedure: Når arbejdsgangen er kørt med succes, skal du gå til måltabellen i databasen
Kontroller den unikke sekvens, der er genereret i kolonne Prod_ID
Inputværdi / testdata: værdi for Prod_ID efterladt tom for hver række i kildefilen
Sekvensgenerator kortlagt til Prod_ID-kolonnen i kortlægningen
Sekvensgeneratorens startværdi indstillet til 1001
Mål: databasetabel- (Tbl_Product) åbnet i SQL Server
Forventede resultater: Værdi fra 1001 til 1003 udfyldt i forhold til hver række for Prod_ID-kolonnen
Faktiske resultater: Værdi fra 1001 til 1003 udfyldt i forhold til hver række for Prod_ID-kolonnen
Bemærkninger:Passere
Tester Kommentarer:
# 5) Test sag ID: T005
Java webservices interview spørgsmål og svar til erfarne
Test sag Formål: For at validere, hvis routertransformation fungerer fint for at undertrykke poster, hvis produktkategorien er 'C', eller produktet er udløbet.
Test procedure: Når arbejdsgangen er kørt med succes, skal du gå til måltabellen i databasen
Kør forespørgslen på måltabellen for at kontrollere, om de ønskede poster er blevet undertrykt.
Inputværdi / testdata: 5 rækker i kildefilen
Mål: databasetabel - (Tbl_Product)
Forespørgsel, der skal køres i SQL-server: Vælg * fra produkt, hvor Prod_category = ’C’ eller Prod_expiry_date< sysdate ;
Forventede resultater: ingen rækker valgt
Faktiske resultater: ingen rækker valgt
Bemærkninger:Passere
Tester Kommentarer: (hvis nogen)
# 6) Test Case ID: T006
Test sag Formål: For at kontrollere arbejdsgangens ydeevne ved at registrere arbejdsprocessens kørselstid.
Test procedure:
- Åbn arbejdsflowmonitoren, og kør, der blev udført som en del af T001.
- Registrer start- og sluttidspunktet for arbejdsgangen.
- Beregn den samlede køretid ved at fratrække starttidspunkt fra sluttidspunktet.
Inputværdi / testdata: Workflow har kørt med succes
Starttidspunkt for workflow i skærmen
Sluttid for arbejdsgang i skærm.
Forventede resultater: 2 min. 30 sek
Faktiske resultater: 2 min. 15 sek
Bemærkninger:Passere
Tester Kommentarer: Betragter testen som 'bestået', hvis den faktiske løbetid er +/- 10% af den forventede løbetid.
# 7) Test Case ID: T007
Test sag Formål: At validere data på måltabelkolonniveau for at sikre, at der ikke er datatab.
Test procedure: Når workflowet har kørt med succes, skal du gå til SQL Server.
Kør forespørgslen på måltabellen for at kontrollere, at der ikke er tab af data.
Inputværdi / testdata: Workflow har kørt med succes
Én prøveoptegnelse fra kildeflad fil.
SQL-forespørgsel: Vælg Top 1 * fra Tbl_Patient;
Forventede resultater:
1 række returneret
Prod_ID (primær nøgle) | Produktnavn | Prod_description | Prod_category | Prod_udløbsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14/8/2017 | 150 |
Faktiske resultater:
1 række returneret.
Prod_ID (primær nøgle) | Produktnavn | Prod_description | Prod_category | Prod_udløbsdato | Prod_pris |
---|---|---|---|---|---|
1001 | ABC | Dette er produkt ABC. | M | 14/8/2017 | 150 |
Bemærkninger:Passere
Tester Kommentarer: Betragter testen som 'bestået', hvis den faktiske løbetid er +/- 10% af den forventede løbetid.
Fordele ved at bruge Informatica som et ETL-værktøj:
Informatica er et populært og succesfuldt ETL-værktøj, fordi:
- Det har en høj 'go live' succesrate (næsten 100%)
- Informatica har muligheden for at muliggøre Lean Integration.
- Det er et moderat prissat værktøj sammenlignet med andre ETL-værktøjer.
- Den leveres med intern jobplanlægning. Så der er ikke behov for at bruge tredjepartsplanlægger separat som nogle andre ETL-værktøjer gør.
- Nem træning og tilgængelighed af værktøjer har gjort Informatica mere populært.
Nogle nyttige tip til at hjælpe dig med Informatica ETL-test:
- Generer testdata, før testscenarierne udføres.
- Testdataene skal være synkroniseret med den testcase, den bruges til.
- Sørg for, at du har dækket alle de 3 scenarier - ingen data indsendes, ugyldige data indsendes, og gyldige data indsendes som input til Informatica-arbejdsgangen.
- Sørg for at teste, at alle de krævede data bliver indlæst til at målrette helt. Til dette kan du bruge testcase - T003 beskrevet ovenfor som en prøve.
- Det er meget vigtigt at teste, at workflowet udfører alle datatransformationer korrekt i henhold til forretningsregler.
- Jeg vil foreslå, at for hver transformation, der anvendes i din Informatica-kortlægning, skal du have en tjekliste til at verificere outputdata mod den. På den måde kan du nemt rapportere fejl, hvis enhver transformation ikke fungerer fint.
Konklusion:
Så vi har set detaljeret nogle af eksempler på testtilfælde, der kan bruges som en skabelon til at dække ETL-test i Informatica. Som jeg nævnte tidligere, kan du tilføje / fjerne / ændre disse testsager afhængigt af det scenarie, du har i dit projekt.
Som jeg nævnte tidligere, kan du tilføje / fjerne / ændre disse testsager afhængigt af det scenarie, du har i dit projekt.
Informatica PowerCenter er et fundament for alle dataintegrationsaktiviteter.
Du kan nemt udføre scriptfri automatiseret test af data, der er kopieret til test-, udviklings- eller produktionsmiljø, og det er grunden til, at PowerCenter er det mest populære ETL-værktøj i dag.
Anbefalet læsning => ETL vs. DB-test - Et nærmere kig på ETL-testbehov
Om forfatteren: Dette er en gæsteartikel af Priya K. Hun har 4+ års praktisk erfaring med at udvikle og støtte Informatica ETL-applikationer.
Du er velkommen til at sende dine forespørgsler / kommentarer om dette ETL-værktøj.
Anbefalet læsning
- Bedste softwaretestværktøjer 2021 (QA Test Automation Tools)
- Sådan udføres test af backend
- ETL Testing Interview Spørgsmål og svar
- ETL Testing Tutorial Data Warehouse Testing Tutorial (En komplet guide)
- Test af Primer eBook Download
- ETL vs. DB-test - Et nærmere kig på ETL-testbehov, planlægning og ETL-værktøjer
- Load Testing ved hjælp af LoadUI - Et gratis og open source Load Testing Tool
- Top 10 ETL-testværktøjer i 2021