Vad är dataflöden?

Anteckning

Gällande november 2020:

  • Common Data Service har bytt namn till Microsoft Dataverse. Läs mer
  • Vissa termer i Microsoft Dataverse har uppdaterats. Till exempel är entiteten tabell och fältet är nu kolumn. Läs mer

Den här artikeln kommer snart att uppdateras för att avspegla den senaste terminologin.

Dataflöden är en molnbaserad dataförberedelseteknik med självbetjäning. Med dataflöden kan kunder mata in, transformera och läsa in data i Microsoft Dataverse-miljöer, Power BI-arbetsytor eller din organisations Azure Data Lake Storage konto. Dataflöden redigeras med hjälp av Power Query, en enhetlig dataanslutning och förberedelseupplevelse som redan finns i många Microsoft-produkter, inklusive Excel och Power BI. Kunder kan utlösa dataflöden som körs antingen på begäran eller automatiskt enligt ett schema. data hålls alltid uppdaterade.

Dataflöden kan skapas i flera Microsoft-produkter

Dataflöden finns i flera Microsoft-produkter och kräver inte att en dataflödesspecifik licens skapas eller körs. Dataflöden är tillgängliga i Power Apps, Power BI och Dynamics 365 Customer Insights. Möjligheten att skapa och köra dataflöden paketeras med dessa produkters licenser. Dataflödesfunktioner är oftast gemensamma för alla produkter som de finns i, men vissa produktspecifika funktioner kan finnas i dataflöden som skapats i en produkt jämfört med andra.

Hur fungerar dataflödet?

Hur fungerar dataflöden?

Föregående bild visar en övergripande vy över hur ett dataflöde definieras. Ett dataflöde hämtar data från olika datakällor (fler än 80 datakällor stöds redan). Baserat på de transformeringar som konfigurerats med Power Query redigeringsupplevelsen transformerar dataflödet sedan data med hjälp av dataflödesmotorn. Slutligen läses data in till utdatamålet, vilket kan vara en Microsoft Power Platform-miljö, en Power BI-arbetsyta eller organisationens Azure Data Lake Storage-konto.

Dataflöden körs i molnet

Dataflöden är molnbaserade. När ett dataflöde redigeras och sparas lagras dess definition i molnet. Ett dataflöde körs också i molnet. Men om en datakälla finns lokalt kan en lokal datagateway användas för att extrahera data till molnet. När en dataflödeskörning utlöses sker datatransformering och beräkning i molnet och målet finns alltid i molnet.

Dataflöden körs i molnet.

Dataflöden använder en kraftfull transformeringsmotor

Power Query är datatransformeringsmotorn som används i dataflödet. Den här motorn är tillräckligt bra för att stödja många avancerade omvandlingar. Den använder också ett enkelt, men kraftfullt, grafiskt användargränssnitt som kallas Power Query Editor. Du kan använda dataflöden med den här redigeraren för att utveckla dina dataintegreringslösningar snabbare och enklare.

Power Query transformationer.

Dataflödesintegrering med Microsoft Power Platform och Dynamics 365

Eftersom ett dataflöde lagrar de resulterande entiteterna i molnbaserad lagring kan andra tjänster interagera med de data som produceras av dataflöden.

Dataflödesintegrering med Microsoft Power Platform och Dynamics 365.

Till exempel kan Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- och Dynamics 365-program hämta data som produceras av dataflödet genom att ansluta till Dataverse, en Power Platform-dataflödesanslutning eller direkt genom laken, beroende på vilket mål som konfigurerades när dataflödet skapades.

Fördelar med dataflöden

I följande lista visas några av fördelarna med att använda dataflöden:

  • Ett dataflöde frikopplar datatransformeringsskiktet från modellerings- och visualiseringsskiktet i en Power BI lösning.

  • Datatransformeringskoden kan finnas på en central plats, ett dataflöde, i stället för att spridas ut mellan flera artefakter.

  • En dataflödesskapare behöver bara Power Query kunskaper. I en miljö med flera skapare kan dataflödesskaparen ingå i ett team som tillsammans skapar hela BI-lösningen eller det operativa programmet.

  • Ett dataflöde är produktoberoende. Det är inte en komponent i Power BI endast; du kan hämta dess data i andra verktyg och tjänster.

  • Dataflöden kan dra nytta av Power Query, en kraftfull, grafisk datatransformeringsupplevelse med självbetjäning.

  • Dataflöden körs helt och hållet i molnet. Ingen ytterligare infrastruktur krävs.

  • Du har flera alternativ för att börja arbeta med dataflöden med hjälp av licenser för Power Apps, Power BI och Customer Insights.

  • Även om dataflöden kan omvandlas på ett avancerat sätt är de utformade för självbetjäningsscenarier och kräver ingen IT- eller utvecklarbakgrund.

Användningsfall för dataflöden

Du kan använda dataflöden för många olika syften. Följande scenarier innehåller några exempel på vanliga användningsfall för dataflöden.

Datamigrering från äldre system

I det här scenariot har en organisation tagit beslutet att använda Power Apps för den nya användargränssnittsupplevelsen i stället för det äldre lokala systemet. Power Apps, Power Automate och AI Builder använder alla Dataverse som primärt datalagringssystem. Aktuella data i det befintliga lokala systemet kan migreras till Dataverse med hjälp av ett dataflöde, och sedan kan dessa produkter använda dessa data.

Använda dataflöden för att skapa ett informationslager

Du kan använda dataflöden som ersättning för andra verktyg för extrahering, transformering, inläsning (ETL) för att skapa ett informationslager. I det här scenariot bestämmer sig ett företags datatekniker för att använda dataflöden för att skapa ett star-schemautformat informationslager, inklusive fakta- och dimensionstabeller i – Data Lake Storage. Sedan Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Skapa ett informationslager med hjälp av dataflöden.

Använda dataflöden för att skapa en dimensionsmodell

Du kan använda dataflöden som ersättning för andra ETL-verktyg för att skapa en dimensionsmodell. Datatekniker på ett företag bestämmer sig till exempel för att använda dataflöden för att skapa den star-schema-utformade dimensionsmodellen, inklusive fakta- och dimensionstabeller i Azure Data Lake Storage Gen2. Sedan Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Skapa en dimensionsmodell med hjälp av dataflöden.

Centralisera förberedelse och återanvändning av datamängder i flera Power BI lösningar

Om flera Power BI lösningar använder samma transformerade version av en tabell upprepas processen för att skapa tabellen flera gånger. Detta ökar belastningen på källsystemet, förbrukar mer resurser och skapar duplicerade data med flera felpunkter. I stället kan ett enda dataflöde skapas för att beräkna data för alla lösningar. Power BI sedan återanvända resultatet av omvandlingen i alla lösningar. Dataflödet, om det används på ett sådant sätt, kan ingå i en robust Power BI-implementeringsarkitektur som undviker Power Query-koddubbletter och minskar underhållskostnaderna för dataintegreringslagret.

Användning av tabeller över flera lösningar.

Nästa steg

Följande artiklar innehåller ytterligare studiematerial för dataflöden.