11 best data warehouse etl automation tools
Liste og sammenligning af de bedste ETL-automatiseringsværktøjer med funktioner og priser. Vælg Data Warehouse Automation-softwaren fra denne liste i henhold til dine krav :
Data Warehouse og ETL Automation Software er en applikation til automatisering, overvågning og styring af kritiske dataprocesser.
ETL-automatiseringsværktøjer har dataintegrations- og transformationsfunktioner til enhver datakompleksitet. Data Warehouse og ETL-automatiseringssoftware kan automatisere op til 80% af datalagerets livscyklus.
Virksomheder indsamler, behandler og beskytter oplysninger relateret til forretningsbeslutninger, den daglige drift og kundeoplevelsen. Al denne information er indsamlet fra forskellige applikationer, silede systemer og andre eksterne kilder.
Derfor er virksomheder nødt til at bruge forskellige ad-hoc-løsninger, automatiseringsscripts og ETL-automatiseringsværktøjer. Denne hurtige stigning i antallet af applikationer, cloud-systemer og IoT-berøringspunkter gør datalagring kompleks.
Workload Automation-løsninger konsoliderer og koordinerer flere datastyringsværktøjer som ETL-værktøjer og BI-platforme og forenkler datalagerene. Brug af Workload Automation-løsningen giver dig en enkelt løsning til automatisering, overvågning og styring af kritiske dataprocesser.
Faktakontrol: Ifølge Enterprise Management Associates , næsten halvdelen af alle datavarehus- og ETL-operationer udføres af Workload Automation Software. 57% af it-fagfolk betragter automatisering af arbejdsbelastning som et centralt aspekt af it-operationer. Workload Automation Software bruges ofte til at koordinere og konsolidere forskellige værktøjer og platforme.Pro Tip: Data Warehouse Automation Software kan automatisere, overvåge og administrere kritiske dataprocesser på en enkelt platform. Mens du vælger løsningen, skal du tjekke for understøttede dataplatforme, værktøjs fleksibilitet, kompatibilitet med andre systemer og pris.
Hvad du lærer:
- Data Warehouse Automation Tool og fordelene
- Liste over de bedste ETL-automatiseringsværktøjer
- Sammenligning af datavarehus-automatiseringsværktøjer
- # 1) ActiveBatch (anbefales)
- # 2) Zapbi ETL Data Warehouse Automation Software
- # 3) WhereScape Data Warehouse Automation
- # 4) Astera ETL-software
- # 5) Klik på Skriv
- # 6) Oracle Data Warehouse
- # 7) Amazon Redshift
- # 8) Bitvis QualiDI
- # 9) Validering af informatica-data
- # 10) Codoid ETL Test Services
- # 11) Datagaps ETL Validator
- Konklusion
Data Warehouse Automation Tool og fordelene
Data Warehouse Automation-værktøjer indeholder ETL & ETL dataintegrationsprocesser, kildedatamodellering, forbindelse til flere dataudbydere og denormaliserede, normaliserede og flerdimensionelle datastrukturer.
Billedet nedenfor viser dig komponenterne i Data Warehouse Automation.
websted, der konverterer youtube-videoer til mp3
(billede kilde )
Brug af Data Warehouse Automation Tools giver dig forbedret datakvalitet og præcision. Dette giver virksomheder adgang til pålidelige data og avanceret og nøjagtig rapportering og analyse. Det hjælper virksomheder med hurtigt at reagere på de stadigt skiftende markedsforhold. Det giver forbedret forretningsfleksibilitet.
Dette er kode-fri værktøjer, og du vil være i stand til at automatisere på halvdelen af tiden uden scripting. Det giver indsigt i realtid og har tilpassbare alarmeringsfunktioner.
=> Kontakt os at foreslå din liste her.Liste over de bedste ETL-automatiseringsværktøjer
Her er listen over populære Data Warehouse Automation Software:
- ActiveBatch (bedst samlet)
- ZAP Data Hub
- WhereScape Data Warehouse Automation
- Astera ETL-software
- Klik på Skriv
- Oracle Data Warehouse
- Amazon Redshift
- Bitvis QualiDi
- Informatica-datavalidering
- Codoid ETL testtjenester
- Datagaps ETL Validator
Sammenligning af datavarehus-automatiseringsværktøjer
Værktøjer | Vores vurderinger | Om værktøjet | Bedst til | Understøttede datakilder | Gratis prøveversion |
ActiveBatch | Workload Automation Tool | Optimering af end-to-end processer og orkestrering af flere ETL-værktøjer. | Microsoft SQL, Oracle Databases, Informatica, Hadoop-økosystemet og andre gennem API-tilgængelighed. | ActiveBatchDemo og en 30-dages gratis prøveperiode. | |
ZAP Data Hub | Data Warehouse Automation Software | Brugervenlig løsning til forretningsdata. | Microsoft Dynamics, Salesforce, Sage og Oracle og SQL-databaser. | ZAP Data HubGratis demo tilgængelig. | |
WhereScape | Automatisering af datalager og infrastruktur | Automatisering af design og til hurtige projekter. | Microsoft SQL Server, IBM DB2, IBM Netezza, Oracle osv. | WhereScapeAnmod om en demo. | |
Astera | Data Management Løsninger | Opbygning af et integreret dataøkosystem. | Ældre og moderne datakilder. | AsteraLedig | |
Klik på | Dataanalyse og dataintegrationsløsninger | Automatiseret og kontinuerlig forbedring. | Oracle, SQL Server, Teradata, Exadata, Azure SQL Data, AWS Redshift. | Klik påLedig |
Lad os gennemgå hvert ETL Testing Automation-værktøj i detaljer:
# 1) ActiveBatch(Anbefales)
ActiveBatch er bedst til optimering af dine ETL-processer.
ActiveBatch Workload Automation indeholder funktionerne Data Warehouse og ETL Automation, der hjælper dig med at optimere dine ETL-processer til realtids datalagring.
ActiveBatch har et integreret jobbibliotek, der giver dig mulighed for at opbygge og automatisere pålidelige end-to-end-arbejdsgange på halve tiden. Dette bibliotek har mange forudbyggede, platformneutrale stik, der hjælper dig med strømlining af datalager og ETL-processer uden scripting.
Funktioner:
- ActiveBatch Workload Automation-værktøjet giver et servicebibliotek, der integrerer alt virtuelt. Det giver fuld API-tilgængelighed, der giver dig mulighed for at indlæse og udføre WSDL'er, SOAP Web Services, RESTful Services osv.
- Avancerede planlægningsfunktioner giver dig mulighed for at udløse datalagring og ETL-processer i henhold til eksterne forhold. Det giver dig mulighed for at udføre begrænsningsbaseret planlægning og detaljeret planlægning af dato / tid.
- Tilføj flere kontrolpunkter inden for datalagerprocesser, så trin kan genstartes uden at påvirke hele batchprocessen.
- Auditing og Governance-funktioner hjælper dig med at strømline forretningsregler på tværs af teams, afdelinger og geografiske placeringer og drive styring på tværs af virksomheden.
- Du kan forhindre uautoriseret adgang ved hjælp af detaljerede tilladelser, multifaktorautentificering og privilegeret adgangsadministration.
Dom: ActiveBatch Workload Automation giver dig mulighed for at opbygge pålidelige og end-to-end workflows til at styre data og afhængigheder på tværs af forskellige, heterogene systemer. Den har en intuitiv træk-og-slip-workflowdesigner til at oprette end-to-end-arbejdsgange. ActiveBatch har rig og begivenhedsdrevet arkitektur.
Pris: Demo og en 30-dages gratis prøveperiode. Du kan få et tilbud på prisoplysninger. En demo vil være tilgængelig på anmodning.
=> Besøg ActiveBatch-webstedet# 2) Zapbi ETL Data Warehouse Automation Software
Bedst som en brugervenlig løsning til forretningsdata.
ZAP er ETL Data Warehouse automatiseringssoftware, der er kompatibel med flere ERP-, CRM- og finansielle systemer og databaser. Du får automatisk datastyring til PowerBI, Tableau, Qlik eller ethvert BI-værktøj med selvbetjening. Det er nyttigt at støtte forskellige afdelinger på tværs af virksomheder med datalagring.
Det kan implementeres i skyen, på stedet eller i en hybrid kombination. ZAP Data Hub er leverandør af vigtig datastyring til alle brugere af al Business Intelligence-software og giver sikker, effektiv og nøjagtig adgang til dit datavarehus.
Det indsamler, integrerer og forbereder automatisk data til BI-brugere gennem funktioner i dataindsamling, dataintegration, dataforberedelse og datastyring.
Funktioner:
- ZAP Data Hub har en grafisk grænseflade med nul kode og følger en smidig tilgang. Det giver guiden-baseret automatisering.
- Det bliver lettere at tilføje datakilderne selv med de skiftende rapporteringsbehov.
- Platformen er optimeret til Microsoft Dynamics, Salesforce, Sage, Oracle og SQL databaser.
- ZAP Data Hub giver funktionerne i Hybrid Data Collection.
- Det har intuitive datamodelleringsfunktioner, der giver dig mulighed for at trække og slippe elementer.
Dom: ZAP Data Hub er en brugervenlig færdigpakket ETL Data Warehouse-automatiseringssoftware. Det er et billigt og fleksibelt værktøj til forretningsdata. Det er til dataprofessionelle, der kræver hurtige, automatiserede og smidige datalagerbygninger. Ved hjælp af ZAP Data Hub vil du være i stand til at imødekomme rapporteringsbehov, da datakilder let kan tilføjes.
Pris: Du kan få et tilbud for prisoplysninger.
Internet side: Zapbi ETL Data Warehouse Automation Software
# 3) WhereScape Data Warehouse Automation
Bedst til automatisering af designs og til hurtige projekter.
WhereScape tilbyder produktet WhereScape 3D til planlægning, model og design af enhver form for datainfrastrukturprojekter. Det har datafindings- og profileringsfunktioner. Det tilbyder yderligere to produkter, dvs. WhereScape® Red og WhereScape® Data Vault Express.
WhereScape Automation er platformen til design, udvikling, implementering og drift. Det er værktøjet til såvel lokale som cloud-dataplatforme. Det har indbygget dimensionelle, 3NF og Data Vault 2.0 metoder.
WhereScape: Understøttede datakilder og platforme er Microsoft SQL Server, IBM DB2, IBM Netezza, Oracle, Snowflake, Teradata, Hadoop, Hive osv. Det understøtter filformaterne CSV, JSON og XML.
Funktioner:
- WhereScape har funktioner til Amazon Redshift, Apache Kafka, Exasol, Microsoft SQL Server, Microsoft Azure, Oracle, Snowflake, Teradata osv.
- Det giver automatisering til Snowflake, der kombinerer native Snowflake-funktioner, guider og bedste praksis.
- WhereScape Automation for Teradata har kapaciteter fra Teradata, der minimerer udviklingskompleksitet og hjælper dig med at levere Teradata-infrastrukturprojekter hurtigere.
Dom: WhereScape Data Automation er den integrerede, metadatadrevne og fuldt dokumenterede platform. WhereScape 3D kan reducere tid til produktion med 80%.
Pris: Du kan få et tilbud på prisoplysninger. En demo er tilgængelig på anmodning.
Internet side: WhereScape
# 4) Astera ETL-software
Bedst til opbygning af et integreret dataøkosystem.
Astera ETL Software giver en løsning til at opbygge et integreret dataøkosystem. Det har dataintegrations- og transformationsfunktioner til data af enhver kompleksitet. Det understøtter data fra forskellige formater fra komplekse hierarkiske filer og strukturerede dokumenter til industriformater som EDI og ældre data.
Det giver problemfri forbindelse til lokale databaser, skybaserede applikationer og visualiseringsværktøjer. Det har funktioner til at skrive data til BI og visualiseringsværktøjer.
Astera leverer indbyggede stik til PowerBI og Tableau, der gør integration og transformation af data til indsigt lettere. Det er en højtydende, brugervenlig ETL-software.
Funktioner
- Astera ETL Software har en kodefri og brugervenlig grænseflade.
- Det har klyngebaseret arkitektur og fremskynder derfor integrationen og transformationen af store datasæt ved at distribuere job på tværs af flere noder.
- Det understøtter alle dataformater.
- Det har et omfattende bibliotek med stik.
- Du vil være i stand til nemt at integrere, analysere og opbygge komplekse XML-, JSON- og EDI-filer.
Dom: Dette dataintegrationsværktøj giver dig et samlet overblik over dine dataaktiver og hjælper dig med at tage holistiske, datadrevne beslutninger.
Ved at bruge Astera Centerprise kan virksomheder synkronisere, transformere og flytte data til destinationen. Dens klyngebaserede arkitektur giver dig høj ydeevne og parallelbehandlingsmotor.
Pris: En gratis prøveversion er tilgængelig. Du kan få et tilbud på Astera Centerprise eller Astera ReportMiner. Pr. Anmeldelser starter prisen for Astera Centerprise på $ 30K pr. År, og Astera ReportMiner Enterprise starter på $ 20K pr. År.
Internet side: Astera ETL-software
# 5) Klik på Skriv
Bedst til automatiseret og kontinuerlig forbedring.
Qlik Compose var tidligere kendt som Attunity Compose. Det bemyndiger dataarkitekterne og datalagerteamene. Den indeholder funktionaliteter til design, bygning og drift af virksomhedens datalager. Du vil være i stand til at generere ETL-kommandoer uden manuel kodning.
Funktioner:
- Qlik Compose har funktioner til at lancere nyt datalager og datamarts, på stedet og i skyen.
- Da forretningskravene ændres hurtigt, vil du være i stand til at opdatere datalagermodeller og nye datakilder.
- Det har funktioner, der giver dig mulighed for at køre ETL-job til tiden eller efter behov. Du kan overvåge disse job i realtid.
Dom: Qlik hjælper dig med at levere forretningsværdier hurtigere med færre ressourcer og til lavere omkostninger. Dataarkitekter og it-teams kan oprette datalagermodeller i Qlik Compose-designstudiet. Det giver dem også mulighed for at importere industristandardmodeller som Inmon, Kimball og Data Vault.
Pris: Qlik Compose har to prisplaner for Data Analytics, dvs. Qlik Sense Business ($ 30 / bruger / måned) og Qlik Sense Enterprise SaaS ($ 70 pr. Måned). En gratis prøveversion er tilgængelig.
Til dataintegration tilbyder den fem planer, dvs. Qlik Replicate, Qlik Compose for Data Lakes, Qlik Compose for Data Warehouse, Qlik Enterprise Manager og Qlik Catalog.
Internet side: Klik på Skriv
# 6) Oracle Data Warehouse
Bedst til udvikling af datadrevne applikationer.
Oracle Autonomous Data Warehouse er en skybaseret tjeneste, der giver funktionaliteterne til at automatisere klargøring, konfiguration, sikring, tuning, skalering, patch, sikkerhedskopiering og reparation af datalageret.
Det er en elastisk og automatiseret skaleringsløsning. Det giver funktionerne i performance tuning og sikkerhed. Du vil være i stand til at bygge sofistikerede analytiske modeller.
Oracle Autonomous Data Warehouse har et bredt sæt indbyggede konvergerede databasefunktioner, der giver dig mulighed for at aktivere enkle forespørgsler på tværs af flere datatyper. Det giver funktionerne i maskinindlæringsanalyse, enkel indlæsning af data og datavisualiseringer.
Det understøtter flere arbejdsbelastninger som analytisk SQL, maskinindlæring, graf og rumlig. Det har funktioner til at køre flere forespørgsler på tværs af flere datatyper.
Funktioner:
- Oracle Autonomous Data Warehouse hjælper dig med at udvikle datadrevne applikationer og opbygge sofistikerede analytiske modeller.
- Det gør brug af kontinuerlig forespørgseloptimering, tabelindeksering, datasammendrag og automatisk tuning, der giver dig høj ydeevne, selv med det voksende datamængde og antallet af brugere.
- Autonome datalager skaleres med tjenestens løbende kørsel, hvilket er i modsætning til andre tjenester, der kræver nedetid for at skalere.
- Det giver omfattende data- og privatlivsbeskyttelse ved at kryptere data i hvile og i bevægelse, beskytte regulerede data, anvende alle sikkerhedsrettelser, muliggøre revision og udføre trusselsregistrering.
Dom: Oracle Autonomous Data Warehouse er en forenklet datalagerstyringsløsning med autonom administration. Det er platformen med funktioner i autonom styring, ydeevne, sikkerhed, Oracle machine learning, grafanalyse og rumanalyse.
åbne en xml-fil i Excel
Pris: Oracle Autonomous Data Warehouse-pris starter ved $ 1.3441 OCPU pr. Time.
Internet side: Oracle Data Warehouse
# 7) Amazon Redshift
Bedst til præstationsintensive arbejdsbelastninger.
Amazon Redshift er et skybaseret datalager, der giver integration til dine Data Lake- og AWS-tjenester. Det er den mest skalerbare platform og giver den bedste ydeevne.
Redshift giver funktionerne til forespørgsel på petabytes af strukturerede og semistrukturerede data på tværs af dit datalager, den operationelle database og din datasø ved hjælp af standard SQL. Det bliver lettere for dig at få indsigt i alle dine data.
Funktioner:
- Du kan gemme resultaterne af dine forespørgsler til din S3-datasø ved hjælp af åbne formater som Apache Parquet.
- Redshift er det hurtigste cloud-datalager. Nye RA3-forekomster hjælper dig med præstationsintensive arbejdsbelastninger. Det kan forbedre ydeevnen 3 gange end det andet cloud-datalager.
- I henhold til dine præstationskrav kan du vælge størrelsen på Redshift-klyngen.
- Det skalerer automatisk din datalagerkapacitet uden behov for at tilføje og betale for yderligere beregningsforekomster.
Dom: Redshift styrker analytiske arbejdsbelastninger og kan derfor bruges af Fortune 500-virksomheder, startups og mellemstore virksomheder.
Redshift har en ny distribueret og hardware-accelereret cache, Advanced Query Accelerator (AQUA), der får Redshift til at køre 10 * hurtigere end de andre. Det koster dig kun for brugen og er derfor en omkostningseffektiv løsning. Det er en 50% billigere løsning end andre.
Pris: Amazon Redshift kan prøves gratis i to måneder. Du kan starte med $ 0,25 pr. Time og skalere op til petabyte for under $ 1000 pr. Terabyte om året.
Internet side: Amazon Redshift
# 8) Bitvis QualiDI
Bedst til centraliseret test af et eller flere ETL-værktøjer.
Bitwise QualiDI er et ETL-testværktøj. Det centraliserer testen af et eller flere ETL-værktøjer. Den udfører datavalidering, mens den transformerer datasæt fra flere operationelle systemer til et datalager. Det kan bruges til at automatisere ETL-test fra enhver kilde til ethvert mål.
Det kan styre den komplekse ETL-testcyklus. Bitwise QualiDI vil sikre kvalitet gennem hele livscyklussen. Det har et indbygget version management system til krav og test cases.
bedste gratis software til forbedring af pc-ydeevne
Funktioner:
- QualiDI leverer avancerede funktioner til Big data-test, JIRA-integration, indbygget planlægningsfunktion, understøttelse af kontinuerlig integration og komplekse transformationsregler, generering af logiske testdata og skalerbar arkitektur i henhold til kravet.
- Til test giver den funktionerne i automatiseret testoprettelse, automatisk datasammenligning, testplanlægning, validering af metadata osv.
- Det understøtter et heterogent sæt datalagre.
- Det giver funktioner til administration, rapportering og sporing.
Dom: QualiDI er en løsning, der dækker hele virksomheden. Dette ETL-testautomatiseringsværktøj vil være en ende-til-ende-platform til centralisering af test af et eller flere ETL-værktøjer. Det er en one-stop-shop for alle ETL-testkrav. Med dette værktøj bliver det lettere at imødekomme ændringsanmodninger og forbedringer.
Pris: Du kan anmode om en prøveperiode og et tilbud på prisoplysningerne.
Internet side: Bitvis QualiDI
# 9) Validering af informatica-data
Bedst til ETL-test.
Informatica Data Validation har et ETL-testværktøj. Din ETL-test bliver hurtigere og automatiseret i produktionsmiljøer og udvikling og test. Uden at have programmeringsevner vil du være i stand til at levere komplet, gentagelig og auditiv testdækning hurtigere.
Funktioner:
- Informatica Data Validation har ETL-testautomations- og styringsfunktioner, som vil validere, at produktionssystemer ikke kompromitteres af dataopdateringsprocessen.
- Det har funktioner til kilde til mål-test.
- Et stort sæt forudbyggede operatører hjælper dig med at opbygge denne type ETL-test uden programmeringsevner.
Dom: Informatica Data Validation-platformen giver automatisering og synlighed til ETL-test. Værktøjet vil sikre, at pålidelige data leveres gennem opdateringer til produktionssystemet.
Pris: En gratis prøveversion er tilgængelig for platformen. Du kan få et tilbud på prisoplysninger.
Internet side: Informatica-datavalidering
# 10) Codoid ETL Test Services
Bedst til dataanalysetest.
Codoid leverer ETL- og dataanalysetesttjenester. Det validerer kilde til mål og datakvalitet. Den udfører dataekstraktion fra heterogene datakilder som relationsdatabaser, CSV, regneark osv. Efter udvinding omdanner den dataene og indlæser dem derefter i et datalager.
Funktioner:
- Codoid udfører validering af produktionsdata. Du får korrekte, pålidelige og konsekvente forretningsoplysninger, da Codoids ETL-test- og valideringsteknikker sikrer produktionsafstemning.
- Det har funktioner til at udføre Test af applikationsopgradering.
- Det vil validere dataene ende-til-ende og skitsere afhjælpning, der forhindrer fremtidig datakorruption.
- Det tester for datafuldstændigheden.
- Dens automatiserede metadatatestprocedure kontrollerer datatype, datalængde, indeks osv.
Dom: Codoid Data Analytics testtjenester giver fordelene ved testdækning, kvalitetsindsigt, testeffektivitet og samarbejde. Løsningen er tilgængelig til konkurrencedygtige priser.
Pris: Du kan få et tilbud på prisoplysninger.
Internet side: Codoid ETL testtjenester
# 11) Datagaps ETL Validator
Bedst som en automatiseringsplatform til datatestning.
Datagaps leverer ETL-testværktøjer som ETL Validator. Det er en omfattende datatestningsautomationsplatform med funktioner i ETL-testautomatisering, visuel testcase-builder, datakvalitetsprøvning, dataprofiltestning, DB-metadata-test, flad filtest og end-to-end datatest.
Det muliggør kontinuerlig integration ved automatisering af datatest.
Funktioner:
- Datagaps ETL Validator har en visuel test case builder, der har træk-og-slip-funktioner.
- Det giver en forespørgselsbygger, der giver dig mulighed for at definere tests uden manuelt at indtaste forespørgsler.
- Det kan sammenligne data på tværs af heterogene platforme som populære relationsdatabaser, Hadoop-, XML- og Flat-filer.
- Det kan forbindes til en lang række datakilder, relationsdatabaser, cloud-datalager, Data Lake, flade filer og SaaS.
Dom: ETL-validator er platformen med funktioner og funktioner til integration med Jenkins, e-mail-underretninger og webrapportering.
Pris: Datagaps ETL Validator tilbyder en gratis prøveperiode i 30 dage. Du kan få et tilbud på prisoplysninger.
Internet side: Datagaps ETL Validator
Konklusion
Data Warehouse Automation-værktøjer eliminerer behovet for gentagne design, udvikling, implementering og operationelle opgaver i datalagerets livscyklus. Det vil hurtigt spore processen med dataintegration og har kapacitet til effektivt at arbejde med big data.
ActiveBatch er vores TOP-anbefaling til Data Warehouse Automation-værktøjet.
Workload Automation-løsninger som ActiveBatch forenkler også datalagerene. Det konsoliderer og koordinerer flere datastyringsværktøjer som ETL-værktøjer og BI-platforme.
Det giver fordele med Big Data og Hadoop Automation, support til forskellige Hadoop-undersæt, Auditing & Governance og avanceret planlægning.
Vi håber, at denne detaljerede gennemgang af Data Warehouse og ETL Automation Software hjælper dig med at vælge den rigtige til din virksomhed.
Forskningsproces:
- Det tager tid at undersøge og skrive denne artikel: 24 timer
- Samlede værktøjer undersøgt online: 21
- Topværktøjer, der er opført på listen: 11
Anbefalet læsning
- Vejledning til test af datavarehus med eksempler | ETL testguide
- ETL Testing Tutorial Data Warehouse Testing Tutorial (En komplet guide)
- Oracle Data Warehouse: Data Warehouse Architecture & More
- De 10 bedste datakortningsværktøjer, der er nyttige i ETL-processen (2021 LIST)
- 10 bedste datamodelleringsværktøjer til at styre komplekse designs
- Metadata i datavarehus (ETL) forklaret med eksempler
- Top 10 populære datalagerværktøjer og testteknologier
- Hvad er en datasø | Data Warehouse vs Data Lake