Analysera data i Azure Data Lake Storage Gen2 med hjälp av Power BI

I den här artikeln får du lära dig hur du använder Power BI Desktop för att analysera och visualisera data som lagras i ett lagringskonto som har en hierarkisk namnrymd (Azure Data Lake Storage Gen2).

Förutsättningar

Innan du påbörjar den här självstudien måste du ha följande förutsättningar:

  • En Azure-prenumeration. Se Hämta en kostnadsfri utvärderingsversion av Azure.
  • Ett lagringskonto som har en hierarkisk namnrymd. Följ de här anvisningarna för att skapa en. Den här artikeln förutsätter att du har skapat ett lagringskonto med namnet myadlsg2 .
  • Du beviljas någon av följande roller för lagringskontot: Blob Data Reader, Blob Data Contributor eller Blob Data Owner .
  • En exempeldatafil med namnet Drivers.txt som finns i ditt lagringskonto. Du kan ladda ned det här exemplet från Azure Data Lake Git-lagringsplatsenoch sedan ladda upp filen till ditt lagringskonto.
  • Power BI Desktop. Du kan ladda ned det från Microsoft Download Center.

Skapa en rapport i Power BI Desktop

  1. Starta Power BI Desktop på datorn.

  2. På fliken Start i menyfliksområdet väljer du Hämta data och sedan Mer.

  3. I dialogrutan Hämta data väljer du Azure > Azure Data Lake Store Gen2 och väljer sedan Anslut.

    Sidan Hämta data.

  4. I dialogrutan Azure Data Lake Storage Gen2 kan du ange URL:en till ditt Azure Data Lake Storage Gen2-konto, filsystem eller undermapp med hjälp av containerslutpunktsformatet. URL:er för Data Lake Storage Gen2 har följande mönster:

    https://<accountname>.dfs.core.windows.net/<filesystemname>/<subfolder>

    Du kan också välja om du vill använda filsystemvyn eller Common Data Model mappvyn.

    Klicka på OK för att fortsätta.

    URL.

  5. Om det är första gången du använder den här URL-adressen uppmanas du att välja autentiseringsmetod.

    Om du väljer metod för organisationskonto väljer du Logga in för att logga in på ditt lagringskonto. Du omdirigeras till din organisations inloggningssida. Följ anvisningarna för att logga in på kontot. När du har loggat in väljer du Anslut.

    Om du väljer metoden Kontonyckel anger du din kontonyckel och väljer sedan Anslut.

    Inloggningssidan.

  6. I nästa dialogruta visas alla filer under den URL som du angav i steg 4 ovan, inklusive filen som du laddade upp till ditt lagringskonto. Kontrollera informationen och välj sedan Läs in.

    Filsystem.

  7. När data har lästs in Power BI visas följande fält på fliken Fält.

    Fliken Fält.

    Men för att visualisera och analysera data kanske du föredrar att data är tillgängliga med hjälp av följande fält.

    Fält.

    I nästa steg uppdaterar du frågan för att konvertera importerade data till önskat format.

  8. På fliken Start i menyfliksområdet väljer du Redigera frågor.

    Välj Redigera frågor.

  9. I frågeredigeraren går du till kolumnen Innehåll och väljer Binär. Filen identifieras automatiskt som CSV och du bör se utdata enligt nedan. Dina data är nu tillgängliga i ett format som du kan använda för att skapa visualiseringar.

    Produktionen.

  10. På fliken Start i menyfliksområdet väljer du Stäng & Tillämpa.

    Stäng och tillämpa.

  11. När frågan har uppdaterats visar fliken Fält de nya fält som är tillgängliga för visualisering.

    Nya fält.

  12. Nu kan du skapa ett cirkeldiagram som representerar drivrutinerna i varje stad för ett visst land. Det gör du genom att göra följande val.

    På fliken Visualiseringar väljer du symbolen för ett cirkeldiagram.

    Välj cirkeldiagramssymbolen i Visualiseringar.

    I det här exemplet är de kolumner som du ska använda Kolumn 4 (namnet på staden) och Kolumn 7 (namnet på landet). Dra dessa kolumner från fliken Fält till fliken Visualiseringar enligt nedan.

    Dra fält.

    Cirkeldiagrammet bör nu likna det som visas nedan.

    Cirkeldiagram.

  13. Genom att välja ett visst land från sidnivåfiltren kan du nu se antalet drivrutiner i varje stad i det valda landet. Under fliken Visualiseringar går du till exempel till Sidnivåfilter och väljer Brasilien.

    Sidfilter.

  14. Cirkeldiagrammet uppdateras automatiskt för att visa drivrutinerna i Brasilien.

    Brasilien.

  15. arkivmenyn väljer du Spara för att spara visualiseringen som en Power BI Desktop fil.

Publicera rapport till Power BI tjänsten

När du har skapat visualiseringarna i Power BI Desktop kan du dela den med andra genom att publicera den på Power BI tjänsten. Anvisningar om hur du gör det finns i Publicera från Power BI Desktop.

Felsökning

I Power Query Online stöder Azure Data Lake Storage Gen2-anslutningsappen för närvarande endast sökvägar med container och inte undermappar eller filer. Till exempel https:// <accountname> .dfs.core.windows.net/ <container> fungerar, https:// <accountname> .dfs.core.windows.net/ <container> / <filename> eller https:// <accountname> .dfs.core.windows.net/ <container> / <subfolder> kommer att misslyckas.

Microsoft stöder inte dataflödes- eller datauppsättningsuppdatering med OAuth2-autentisering när Azure Data Lake Storage Gen 2-kontot (ADLS) finns i en annan klientorganisation. Den här begränsningen gäller endast för ADLS när autentiseringsmetoden är OAuth2, det vill säga när du försöker ansluta till en ADLS mellan klientorganisationen med ett Azure AD-konto. I det här fallet rekommenderar vi att du använder en annan autentiseringsmetod som inte är OAuth2/AAD, till exempel autentiseringsmetoden Nyckel.