Ansluta Power BI till Azure Databricks

Microsoft Power BI är en tjänst för affärsanalys som tillhandahåller interaktiva visualiseringar med business intelligence-funktioner med självbetjäning, vilket gör det möjligt för slutanvändare att skapa rapporter och instrumentpaneler själva utan att behöva vara beroende av it-personal eller databasadministratörer.

När du använder Azure Databricks som datakälla med Power BI kan du ge fördelarna med Prestanda och teknik för Azure Databricks utöver dataexperter och datatekniker för alla företagsanvändare.

Du kan ansluta Power BI Desktop till dina Azure Databricks-kluster och Databricks SQL-lager. Du kan också publicera Power BI-rapporter till Power BI-tjänst och göra det möjligt för användare att komma åt underliggande Azure Databricks-data med enkel inloggning (SSO) och skicka samma Microsoft Entra-ID (tidigare Azure Active Directory) autentiseringsuppgifter som de använder för att komma åt rapporten.

Behov

  • Power BI Desktop 2.85.681.0 eller senare. Ladda ned den senaste versionen. Om du vill använda data som hanteras av Unity Catalog med Power BI måste du använda Power BI Desktop 2.98.683.0 eller senare (oktober 2021).

    Kommentar

    Power BI Desktop kräver Windows. Ett alternativ för andra operativsystem är att köra Power BI Desktop på en fysisk värd eller en Windows-baserad virtuell dator och sedan ansluta till den från operativsystemet.

    Om du använder en version av Power BI Desktop under 2.85.681.0 måste du också installera Databricks ODBC-drivrutinen i samma miljö som Power BI Desktop.

  • En personlig åtkomsttoken för Azure Databricks eller dina autentiseringsuppgifter för Ditt Microsoft Entra-ID-konto.

    Kommentar

    Som bästa säkerhet när du autentiserar med personliga åtkomsttoken rekommenderar Databricks att du använder personliga åtkomsttoken som tillhör tjänstens huvudnamn i stället för användare av arbetsytan. Information om hur du skapar token för tjänstens huvudnamn finns i Hantera token för tjänstens huvudnamn.

  • Ett Azure Databricks-kluster eller Databricks SQL-lager.

Anslut Power BI Desktop till Azure Databricks med partner Anslut

Du kan använda Partner Anslut för att ansluta till ett kluster eller SQL-lager från Power BI Desktop med bara några få klick.

  1. Kontrollera att ditt Azure Databricks-konto, din arbetsyta och den inloggade användaren uppfyller kraven för Partner Anslut.

  2. I sidofältet klickar du på Partner Connect buttonPartner Anslut.

  3. Klicka på Power BI-panelen.

  4. I dialogrutan Anslut till partner väljer du namnet på den Azure Databricks-beräkningsresurs som du vill ansluta till för Compute.

  5. Välj Ladda ned anslutningsfil.

  6. Öppna den nedladdade anslutningsfilen, som startar Power BI Desktop.

  7. I Power BI Desktop anger du dina autentiseringsuppgifter:

    • Personlig åtkomsttoken: Ange din personliga åtkomsttoken för Azure Databricks.
    • Microsoft Entra-ID: Klicka på Logga in och följ sedan anvisningarna på skärmen.
    • Användarnamn/lösenord: Ej tillämpligt.
  8. Klicka på Anslut.

  9. Välj de Azure Databricks-data som du vill köra frågor mot från Power BI Navigator.

    Power BI Navigator

Anslut Power BI Desktop till Azure Databricks manuellt

Följ dessa instruktioner, beroende på din valda autentiseringsmetod, för att ansluta till ett kluster eller SQL-lager med Power BI Desktop. Databricks SQL-lager rekommenderas när du använder Power BI i DirectQuery-läge .

Kommentar

Om du vill ansluta snabbare med Power BI Desktop använder du Partner Connect.

  1. Hämta servervärdnamnet och HTTP-sökvägen.

  2. Starta Power BI Desktop.

  3. Klicka på Hämta data eller Hämta > data.

  4. Klicka på Hämta data för att komma igång.

  5. Sök efter Databricks och klicka sedan på anslutningsappen:

    • Azure Databricks
  6. Klicka på Anslut.

  7. Ange servervärdnamnet och HTTP-sökvägen.

  8. Välj ditt läge för data Anslut ivitet. Information om skillnaden mellan Import och DirectQuery finns i Använda DirectQuery i Power BI Desktop.

  9. Klicka på OK.

  10. Klicka på din autentiseringsmetod:

    • Personlig åtkomsttoken: Ange din personliga åtkomsttoken för Azure Databricks.
    • Microsoft Entra-ID: Klicka på Logga in och följ sedan anvisningarna på skärmen.
    • Användarnamn/lösenord: Ej tillämpligt.
  11. Klicka på Anslut.

  12. Välj de Azure Databricks-data som du vill köra frågor mot från Power BI Navigator. Om Unity Catalog är aktiverat för din arbetsyta väljer du en katalog innan du väljer ett schema och en tabell.

    Power BI Navigator

Använda en anpassad SQL-fråga

Databricks-anslutningsappen tillhandahåller datakällan Databricks.Query som gör att en användare kan tillhandahålla en anpassad SQL-fråga.

  1. Följ stegen som beskrivs i Anslut med Power BI Desktop för att skapa en anslutning med import som dataanslutningsläge.

  2. I Navigatör högerklickar du på det översta objektet som innehåller det valda värdnamnet och HTTP-sökvägen och klickar på Transformera data för att öppna Power Query-redigeraren.

    Click Transform Data in the Navigator

  3. I funktionsfältet ersätter du funktionsnamnet Databricks.Catalogs med Databricks.Query och tillämpar ändringen. Detta skapar en Power Query-funktion som tar en SQL-fråga som parameter.

  4. Ange önskad SQL-fråga i parameterfältet och klicka på Anropa. Detta kör frågan och en ny tabell skapas med frågeresultatet som innehåll.

Få åtkomst till Azure Databricks-datakällan med hjälp av Power BI-tjänst

När du publicerar en rapport till Power BI-tjänst ansluter du till Azure Databricks med en personlig åtkomsttoken. I Power BI-tjänst kan du även aktivera enkel inloggning (SSO) så att användarna kan komma åt rapporter som skapats med DirectQuery-lagringsläge genom att skicka sina Microsoft Entra-ID-autentiseringsuppgifter till Azure Databricks.

  1. Publicera din Power BI-rapport från Power BI Desktop till Power BI-tjänst.

  2. Aktivera enkel inloggning (SSO) åtkomst till rapporten och den underliggande datakällan.

    1. Gå till den underliggande Azure Databricks-datauppsättningen för rapporten i Power BI-tjänst, expandera autentiseringsuppgifterna för datakällan och klicka på Redigera autentiseringsuppgifter.
    2. I konfigurationsdialogrutan väljer du Rapportvisningsprogram kan bara komma åt den här datakällan med sina egna Power BI-identiteter med direct query och klickar på Logga in.

    Enable SSO for Databricks data access

    Med det här alternativet valt hanteras åtkomsten till datakällan med DirectQuery och hanteras med hjälp av Microsoft Entra-ID-identiteten för den användare som har åtkomst till rapporten. Om du inte väljer det här alternativet är det bara du som användare som publicerade rapporten som har åtkomst till Azure Databricks-datakällan.

Automatisk HTTP-proxyidentifiering

Power BI Desktop version 2.104.941.0 och senare (version maj 2022) har inbyggt stöd för att identifiera HTTP-proxykonfiguration i hela Windows. Ladda ned den senaste versionen.

Power BI Desktop kan automatiskt identifiera och använda din Windows-systemomfattande HTTP-proxykonfiguration.

Om proxyservern inte tillhandahåller någon CRL-distributionsplats (CDP) kan Power BI visa följande felmeddelande:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Utför följande steg för att åtgärda det här felet:

  1. Skapa filen C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini om den inte finns.

  2. Lägg till följande konfiguration i microsoft.sparkodbc.ini filen:

    [Driver]
    CheckCertRevocation=0
    

Anslutningsapp för Power BI Delta-delning

Med Anslutningsappen för Power BI-deltadelning kan användarna identifiera, analysera och visualisera datauppsättningar som delas med dem via öppna protokollet Deltadelning . Protokollet möjliggör säkert utbyte av datamängder mellan produkter och plattformar genom att använda REST och molnlagring.

Anslutningsinstruktioner finns i Power BI: Läsa delade data.

Begränsningar

  • Azure Databricks-anslutningsappen stöder webbproxy. Automatiska proxyinställningar som definierats i .pac-filer stöds dock inte.
  • I Azure Databricks-anslutningsappen Databricks.Query stöds inte datakällan i kombination med DirectQuery-läge.
  • De data som deltadelningsanslutningsappen läser in måste passa in i datorns minne. För att säkerställa detta begränsar anslutningsappen antalet importerade rader till den radgräns som angavs tidigare.

Ytterligare resurser

Support