Anslut till och hantera Google BigQuery-projekt i Azure Purview (förhandsversion)

Den här artikeln beskriver hur du registrerar Google BigQuery-projekt och hur du autentiserar och interagerar med Google BigQuery i Azure Purview. Mer information om Azure Purview finns i introduktionsartikeln.

Viktigt

Google BigQuery som källa finns för närvarande i FÖRHANDSVERSION. Juridiska villkor för Azure-funktioner i betaversion, förhandsversion eller som av någon annan anledning inte har gjorts allmänt tillgängliga ännu finns i Kompletterande användningsvillkor för Microsoft Azure-förhandsversioner.

Funktioner som stöds

Extrahering av metadata Fullständig genomsökning Inkrementell sökning Begränsad genomsökning Klassificering Åtkomstprincip Ursprung
Ja Ja Nej Nej Nej Nej Ja

Viktigt

Den Version av Google BigQuery som stöds är 11.0.0.

Förutsättningar

Registrera dig

I det här avsnittet beskrivs hur du registrerar ett Google BigQuery-projekt i Azure Purview med hjälp av Purview Studio.

Steg för att registrera

  1. Gå till ditt Purview-konto.

  2. Välj Data Map i det vänstra navigeringsfönstret.

  3. Välj Registrera.

  4. På Registrera källor väljer du Google BigQuery . Välj Fortsätt.

    registrera BigQuery-källa

På skärmen Registrera källor (Google BigQuery) gör du följande:

  1. Ange ett Namn som datakällan ska visas i katalogen.

  2. Ange ProjectID. Detta bör vara ett fullständigt kvalificerat projekt-ID. Till exempel mydomain.com:myProject

  3. Välj en samling eller skapa en ny (valfritt)

  4. Välj Register (Registrera).

    konfigurera BigQuery-källa

Genomsöka

Följ stegen nedan för att skanna ett Google BigQuery-projekt för att automatiskt identifiera tillgångar och klassificera dina data. Mer information om genomsökning i allmänhet finns i vår introduktion till genomsökningar och inmatning.

Skapa och köra genomsökning

  1. I Hanteringscenter väljer du Integreringskörningar. Kontrollera att en integrationskörning med egen värd har ställts in. Om den inte har ställts in använder du stegen som anges här.

  2. Gå till Sources ( Källor).

  3. Välj det registrerade BigQuery-projektet.

  4. Välj + Ny genomsökning.

  5. Ange informationen nedan:

    1. Namn: Namnet på genomsökningen

    2. Anslut via Integration Runtime: Välj den konfigurerade integrationskörningen med egen värd

    3. Autentiseringsuppgifter: När du konfigurerar BigQuery-autentiseringsuppgifter ser du till att:

      • Välj Grundläggande autentisering som autentiseringsmetod
      • Ange e-post-ID för tjänstkontot i fältet Användarnamn. Till exempel xyz\@developer.gserviceaccount.com
      • Följ stegen nedan för att generera den privata nyckeln, kopiera JSON och lagra den sedan som värdet för en Key Vault hemlighet.

      Så här skapar du en ny privat nyckel från Googles molnplattform:

      1. I navigeringsmenyn väljer du IAM & Admin – > Tjänstkonton – > Välj ett projekt –>
      2. Välj e-postadressen för det tjänstkonto som du vill skapa en nyckel för.
      3. Välj fliken Nycklar.
      4. Välj den nedrullningsna menyn Lägg till nyckel och välj sedan Skapa ny nyckel.
      5. Välj JSON-format.

      Anteckning

      Innehållet i den privata nyckeln sparas i en temporär fil på den virtuella datorn när genomsökningsprocesser körs. Den här temporära filen tas bort när genomsökningarna har slutförts. I händelse av ett genomsökningsfel fortsätter systemet att försöka igen tills det lyckas. Kontrollera att åtkomsten är korrekt begränsad på den virtuella dator där SHIR körs.

      Mer information om autentiseringsuppgifter finns på länken här.

    4. Drivrutinsplats: Ange sökvägen till JDBC-drivrutinsplatsen på den virtuella dator där integration runtime med egen värd körs. Detta bör vara sökvägen till en giltig JAR-mappplats.

      Anteckning

      Drivrutinen ska vara tillgänglig för alla konton på den virtuella datorn. Installera inte i ett användarkonto.

    5. Datauppsättning: Ange en lista över BigQuery-datauppsättningar som ska importeras. Till exempel dataset1; dataset2. När listan är tom importeras alla tillgängliga datauppsättningar. Godkända namnmönster för datauppsättningar med hjälp SQL SYNTAX för LIKE-uttryck inkluderar användning av %.

      Exempel: A%; %B; %C%; D

      • Börja med A eller
      • avsluta med B eller
      • innehålla C eller
      • lika med D

      Användning av NOT och specialtecken är inte godtagbara.

    6. Maximalt tillgängligt minne: Maximalt minne (i GB) som är tillgängligt på den virtuella datorn som ska användas av genomsökningsprocesser. Detta beror på storleken på Google BigQuery-projektet som ska genomsökas.

      genomsöka BigQuery-källa

  6. Välj Testa anslutning.

  7. Välj Fortsätt.

  8. Välj genomsökningsutlösaren. Du kan konfigurera ett schema eller genomsöka en gång.

  9. Granska genomsökningen och välj Spara och kör.

Visa dina genomsökningar och genomsökningskörningar

Om du vill visa befintliga genomsökningar gör du följande:

  1. Gå till Purview Studio. Välj Data Map under den vänstra rutan.

  2. Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.

  3. Välj den genomsökning som har resultat som du vill visa.

  4. Den här sidan visar alla tidigare genomsökningskörningar tillsammans med status och mått för varje genomsökningskörning. Den visar också om genomsökningen har schemalagts eller manuellt, hur många tillgångar som hade tillämpade klassificeringar, hur många totala tillgångar som identifierades, start- och sluttiden för genomsökningen samt den totala genomsökningstiden.

Hantera genomsökningar – redigera, ta bort eller avbryta

Om du vill hantera eller ta bort en genomsökning gör du följande:

  1. Gå till Purview Studio. Välj Data Map under den vänstra rutan.

  2. Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.

  3. Välj den genomsökning som du vill hantera. Du kan redigera genomsökningen genom att välja Redigera genomsökning.

  4. Du kan avbryta en pågående genomsökning genom att välja Avbryt genomsökningskörning.

  5. Du kan ta bort genomsökningen genom att välja Ta bort genomsökning.

Anteckning

  • Om du tar bort genomsökningen tas inte katalogtillgångar som skapats från tidigare genomsökningar bort.
  • Tillgången uppdateras inte längre med schemaändringar om källtabellen har ändrats och du genomsöker källtabellen på nya sätt när du har redigerat beskrivningen på schemafliken i Purview.

Nästa steg

Nu när du har registrerat din källa följer du guiderna nedan för att lära dig mer om Purview och dina data.