Share via


Wat is Data Factory in Microsoft Fabric?

Data Factory biedt u een moderne ervaring voor gegevensintegratie voor het opnemen, voorbereiden en transformeren van gegevens uit een uitgebreide set gegevensbronnen (bijvoorbeeld databases, datawarehouse, Lakehouse, realtime gegevens en meer). Of u nu een burger of professionele ontwikkelaar bent, u kunt de gegevens transformeren met intelligente transformaties en gebruikmaken van een uitgebreide set activiteiten. Met Data Factory in Microsoft Fabric brengen we snelle kopieermogelijkheden (gegevensverplaatsing) naar zowel gegevensstromen als gegevenspijplijnen. Met Fast Copy kunt u gegevens verplaatsen tussen uw favoriete gegevensarchieven die razendsnel worden opgeslagen. Het belangrijkste is dat u met Fast Copy gegevens naar uw Lakehouse en Data Warehouse in Microsoft Fabric kunt brengen voor analyse.

Data Factory implementeert twee primaire functies op hoog niveau: gegevensstromen en pijplijnen.

  • Met gegevensstromen kunt u meer dan 300 transformaties gebruiken in de ontwerpfunctie voor gegevensstromen, zodat u gegevens eenvoudiger en flexibeler kunt transformeren dan elk ander hulpprogramma, waaronder slimme gegevenstransformaties op basis van AI.
  • Met gegevenspijplijnen kunt u gebruikmaken van de out-of-the-box uitgebreide mogelijkheden voor gegevensindeling om flexibele gegevenswerkstromen op te stellen die voldoen aan de behoeften van uw bedrijf.

Gegevensstromen

Gegevensstromen bieden een interface met weinig code voor het opnemen van gegevens uit honderden gegevensbronnen, waarbij uw gegevens worden getransformeerd met behulp van meer dan 300 gegevenstransformaties. Vervolgens kunt u de resulterende gegevens laden in meerdere bestemmingen, zoals Azure SQL-databases en meer. Gegevensstromen kunnen herhaaldelijk worden uitgevoerd met behulp van handmatige of geplande vernieuwing, of als onderdeel van een indeling van een gegevenspijplijn.

Gegevensstromen worden gebouwd met behulp van de vertrouwde Power Query-ervaring die momenteel beschikbaar is in verschillende Microsoft-producten en -services, zoals Excel, Power BI, Power Platform, Dynamics 365 Insights-toepassingen en meer. Power Query biedt alle gebruikers, van burger tot professionele gegevensintegrators, de mogelijkheid om gegevensopname en gegevenstransformaties uit te voeren in hun gegevensomgeving. Voer joins, aggregaties, gegevensopschoning, aangepaste transformaties en nog veel meer uit van een gebruiksvriendelijke, zeer visuele gebruikersinterface met weinig code.

Screenshot of the Power BI user interface showing the dataflow experience.

Gegevenspijplijnen

Gegevenspijplijnen maken krachtige werkstroommogelijkheden mogelijk op cloudschaal. Met gegevenspijplijnen kunt u complexe werkstromen bouwen waarmee uw gegevensstroom kan worden vernieuwd, PB-groottegegevens kunnen worden verplaatst en geavanceerde controlestroompijplijnen kunnen worden gedefinieerd.

Gebruik gegevenspijplijnen om complexe ETL- en data factory-werkstromen te bouwen die veel verschillende taken op schaal kunnen uitvoeren. Mogelijkheden voor controlestromen zijn ingebouwd in gegevenspijplijnen waarmee u werkstroomlogica kunt bouwen, die lussen en voorwaarden biedt.

Voeg een configuratiegestuurde kopieeractiviteit toe samen met het vernieuwen van uw gegevensstroom met weinig code in één pijplijn voor een end-to-end ETL-gegevenspijplijn. U kunt zelfs code-first-activiteiten toevoegen voor Spark Notebooks, SQL-scripts, opgeslagen procs en meer.

Screenshot of the user interface showing copy activity.

Als u aan de slag wilt met Microsoft Fabric, gaat u naar Quickstart: Uw eerste Gegevensstroom Gen2 maken om gegevens op te halen en te transformeren.