Ansluta till och hantera Google BigQuery-projekt i Microsoft Purview (förhandsversion)

Den här artikeln beskriver hur du registrerar Google BigQuery-projekt och hur du autentiserar och interagerar med Google BigQuery i Microsoft Purview. Mer information om Microsoft Purview finns i den inledande artikeln.

Viktigt

Den här funktionen är för närvarande i förhandsversion. Juridiska villkor för Azure-funktioner i betaversion, förhandsversion eller som av någon annan anledning inte har gjorts allmänt tillgängliga ännu finns i Kompletterande användningsvillkor för Microsoft Azure-förhandsversioner.

Funktioner som stöds

Extrahering av metadata Fullständig genomsökning Inkrementell genomsökning Omfångsskanning Klassificering Åtkomstprincip Ursprung Datadelning
Ja Ja No Ja Inga Inga Ja No

Vid genomsökning av Google BigQuery-källa stöder Microsoft Purview:

  • Extrahera tekniska metadata, inklusive:

    • Projekt
    • Datauppsättningar
    • Tabeller inklusive kolumnerna
    • Vyer inklusive kolumnerna
  • Hämtar statisk härkomst för tillgångars relationer mellan tabeller och vyer.

När du konfigurerar genomsökningen kan du välja att skanna ett helt Google BigQuery-projekt eller begränsa genomsökningen till en delmängd av datauppsättningar som matchar förnamnen eller namnmönstren.

Anteckning

För närvarande stöder Microsoft Purview endast genomsökning av Google BigQuery-datamängder på flera regioner i USA. Om den angivna datauppsättningen finns på en annan plats, t.ex. us-east1 eller EU, ser du att genomsökningen har slutförts men inga tillgångar visas i Microsoft Purview.

Förutsättningar

Registrera dig

I det här avsnittet beskrivs hur du registrerar ett Google BigQuery-projekt i Microsoft Purview med hjälp av Microsoft Purview-styrningsportalen.

Steg för att registrera

  1. Gå till ditt Microsoft Purview-konto.

  2. Välj Datakarta i det vänstra navigeringsfönstret.

  3. Välj Registrera.

  4. På Registrera källor väljer du Google BigQuery . Välj Fortsätt.

    registrera BigQuery-källa

Gör följande på skärmen Registrera källor (Google BigQuery):

  1. Ange ett namn som datakällan ska visas i katalogen.

  2. Ange ProjectID. Detta bör vara ett fullständigt kvalificerat projekt-ID. Till exempel mydomain.com:myProject

  3. Välj en samling eller skapa en ny (valfritt)

  4. Välj Register (Registrera).

    konfigurera BigQuery-källa

Genomsöka

Följ stegen nedan för att skanna ett Google BigQuery-projekt för att automatiskt identifiera tillgångar. Mer information om genomsökning i allmänhet finns i vår introduktion till genomsökningar och inmatning.

Skapa och köra genomsökning

  1. I Hanteringscenter väljer du Integreringskörningar. Kontrollera att en lokalt installerad integrationskörning har konfigurerats. Om den inte har konfigurerats använder du stegen som beskrivs här.

  2. Gå till Källor.

  3. Välj det registrerade BigQuery-projektet .

  4. Välj + Ny genomsökning.

  5. Ange informationen nedan:

    1. Namn: Namnet på genomsökningen

    2. Anslut via Integration Runtime: Välj den konfigurerade lokalt installerade integrationskörningen

    3. Autentiseringsuppgifter: När du konfigurerar BigQuery-autentiseringsuppgifter ska du se till att:

      • Välj Grundläggande autentisering som autentiseringsmetod
      • Ange e-post-ID för tjänstkontot i fältet Användarnamn. Till exempel xyz\@developer.gserviceaccount.com
      • Följ stegen nedan för att generera den privata nyckeln, kopiera hela JSON-nyckelfilen och lagra den sedan som värdet för en Key Vault hemlighet.

      Så här skapar du en ny privat nyckel från Googles molnplattform:

      1. I navigeringsmenyn väljer du IAM & Admin –> Tjänstkonton –> Välj ett projekt –>
      2. Välj e-postadressen för det tjänstkonto som du vill skapa en nyckel för.
      3. Välj fliken Nycklar .
      4. Välj den nedrullningsbara menyn Lägg till nyckel och välj sedan Skapa ny nyckel.
      5. Välj JSON-format.

      Anteckning

      Innehållet i den privata nyckeln sparas i en temporär fil på den virtuella datorn när genomsökningsprocesser körs. Den här temporära filen tas bort när genomsökningarna har slutförts. I händelse av ett genomsökningsfel fortsätter systemet att försöka igen tills det lyckas. Kontrollera att åtkomsten är korrekt begränsad på den virtuella dator där SHIR körs.

      Mer information om autentiseringsuppgifter finns på länken här.

    4. Drivrutinsplats: Ange sökvägen till JDBC-drivrutinsplatsen på datorn där integrationskörningen med självvärd körs, t.ex. D:\Drivers\GoogleBigQuery. Det är sökvägen till en giltig JAR-mappplats. Se till att drivrutinen är tillgänglig via den lokalt installerade integrationskörningen. Läs mer i avsnittet om förhandskrav.

    5. Datauppsättning: Ange en lista över BigQuery-datauppsättningar som ska importeras. Till exempel datauppsättning1; datauppsättning2. När listan är tom importeras alla tillgängliga datauppsättningar. Godkända namnmönster för datauppsättningar med SQL LIKE-uttryckssyntaxen inkluderar användning av %.

      Exempel: A%; %B; %C%; D

      • Börja med A eller
      • slutar med B eller
      • innehåller C eller
      • lika med D

      Användning av NOT och specialtecken är inte acceptabelt.

    6. Maximalt tillgängligt minne: Maximalt minne (i GB) tillgängligt på den virtuella datorn som ska användas av genomsökningsprocesser. Detta beror på storleken på Google BigQuery-projektet som ska genomsökas.

      skanna BigQuery-källa

  6. Välj Testa anslutning.

  7. Välj Fortsätt.

  8. Välj din genomsökningsutlösare. Du kan konfigurera ett schema eller köra genomsökningen en gång.

  9. Granska genomsökningen och välj Spara och kör.

Visa dina genomsökningar och genomsökningskörningar

Om du vill visa befintliga genomsökningar gör du följande:

  1. Gå till Microsoft Purview-styrningsportalen. Välj fliken Datakarta i det vänstra fönstret.

  2. Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar eller kan visa alla genomsökningar under fliken Genomsökningar .

  3. Välj den genomsökning som innehåller resultat som du vill visa.

  4. På den här sidan visas alla tidigare genomsökningskörningar tillsammans med status och mått för varje genomsökningskörning. Den visar också om genomsökningen har schemalagts eller manuellt, hur många tillgångar som har tillämpats, hur många totala tillgångar som har identifierats, start- och sluttiden för genomsökningen och den totala genomsökningens varaktighet.

Hantera dina genomsökningar – redigera, ta bort eller avbryta

Om du vill hantera eller ta bort en genomsökning gör du följande:

  1. Gå till Microsoft Purview-styrningsportalen. Välj fliken Datakarta i det vänstra fönstret.

  2. Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar eller kan visa alla genomsökningar under fliken Genomsökningar .

  3. Välj den genomsökning som du vill hantera. Du kan redigera genomsökningen genom att välja Redigera genomsökning.

  4. Du kan avbryta en pågående genomsökning genom att välja Avbryt genomsökningskörning.

  5. Du kan ta bort genomsökningen genom att välja Ta bort genomsökning.

Anteckning

  • Om du tar bort genomsökningen tas inte katalogtillgångar som skapats från tidigare genomsökningar bort.
  • Tillgången uppdateras inte längre med schemaändringar om källtabellen har ändrats och du söker igenom källtabellen igen när du har redigerat beskrivningen på schemafliken i Microsoft Purview.

Ursprung

När du har skannat Din Google BigQuery-källa kan du bläddra i datakatalogen eller sök i datakatalogen för att visa tillgångsinformationen.

Gå till fliken tillgång –> ursprung. Du kan se tillgångsrelationen när det är tillämpligt. Läs avsnittet om funktioner som stöds i google bigquery-ursprungsscenarier som stöds. Mer information om ursprung i allmänhet finns i användarhandboken för data härkomst och ursprung.

Google BigQuery ursprungsvy

Nästa steg

Nu när du har registrerat din källa följer du guiderna nedan för att lära dig mer om Microsoft Purview och dina data.