Anslut till och hantera Google BigQuery-projekt i Azure Purview (förhandsversion)
Den här artikeln beskriver hur du registrerar Google BigQuery-projekt och hur du autentiserar och interagerar med Google BigQuery i Azure Purview. Mer information om Azure Purview finns i introduktionsartikeln.
Viktigt
Google BigQuery som källa finns för närvarande i FÖRHANDSVERSION. Juridiska villkor för Azure-funktioner i betaversion, förhandsversion eller som av någon annan anledning inte har gjorts allmänt tillgängliga ännu finns i Kompletterande användningsvillkor för Microsoft Azure-förhandsversioner.
Funktioner som stöds
| Extrahering av metadata | Fullständig genomsökning | Inkrementell sökning | Begränsad genomsökning | Klassificering | Åtkomstprincip | Ursprung |
|---|---|---|---|---|---|---|
| Ja | Ja | Nej | Nej | Nej | Nej | Ja |
Viktigt
Den Version av Google BigQuery som stöds är 11.0.0.
Förutsättningar
Ett Azure-konto med en aktiv prenumeration. Skapa ett konto utan kostnad.
En aktiv Purview-resurs.
Du måste vara datakällsadministratör och dataläsare för att registrera en källa och hantera den i Purview Studio. Mer information finns på sidan Behörigheter för Azure Purview.
Konfigurera den senaste integrationskörningen med egen värd. Mer information finns i guiden skapa och konfigurera en integrationskörningmed egen värd.
Kontrollera att JDK 11 är installerat på den virtuella datorn där integration runtime med egen värd är installerad.
Se till att Visual C++ Redistributable Visual Studio 2012 Uppdatering 4 är installerat på den lokala integrationskörningsdatorn. Om du inte har installerat den här uppdateringen kan du hämta den här.
Ladda ned och installera BigQuerys JDBC-drivrutin på den dator där din lokala Integration Runtime körs. Du hittar drivrutinen här.
Anteckning
Drivrutinen ska vara tillgänglig för alla konton på den virtuella datorn. Installera den inte på ett användarkonto.
Registrera dig
I det här avsnittet beskrivs hur du registrerar ett Google BigQuery-projekt i Azure Purview med hjälp av Purview Studio.
Steg för att registrera
Gå till ditt Purview-konto.
Välj Data Map i det vänstra navigeringsfönstret.
Välj Registrera.
På Registrera källor väljer du Google BigQuery . Välj Fortsätt.
På skärmen Registrera källor (Google BigQuery) gör du följande:
Ange ett Namn som datakällan ska visas i katalogen.
Ange ProjectID. Detta bör vara ett fullständigt kvalificerat projekt-ID. Till exempel mydomain.com:myProject
Välj en samling eller skapa en ny (valfritt)
Välj Register (Registrera).
Genomsöka
Följ stegen nedan för att skanna ett Google BigQuery-projekt för att automatiskt identifiera tillgångar och klassificera dina data. Mer information om genomsökning i allmänhet finns i vår introduktion till genomsökningar och inmatning.
Skapa och köra genomsökning
I Hanteringscenter väljer du Integreringskörningar. Kontrollera att en integrationskörning med egen värd har ställts in. Om den inte har ställts in använder du stegen som anges här.
Gå till Sources ( Källor).
Välj det registrerade BigQuery-projektet.
Välj + Ny genomsökning.
Ange informationen nedan:
Namn: Namnet på genomsökningen
Anslut via Integration Runtime: Välj den konfigurerade integrationskörningen med egen värd
Autentiseringsuppgifter: När du konfigurerar BigQuery-autentiseringsuppgifter ser du till att:
- Välj Grundläggande autentisering som autentiseringsmetod
- Ange e-post-ID för tjänstkontot i fältet Användarnamn. Till exempel
xyz\@developer.gserviceaccount.com - Följ stegen nedan för att generera den privata nyckeln, kopiera JSON och lagra den sedan som värdet för en Key Vault hemlighet.
Så här skapar du en ny privat nyckel från Googles molnplattform:
- I navigeringsmenyn väljer du IAM & Admin – > Tjänstkonton – > Välj ett projekt –>
- Välj e-postadressen för det tjänstkonto som du vill skapa en nyckel för.
- Välj fliken Nycklar.
- Välj den nedrullningsna menyn Lägg till nyckel och välj sedan Skapa ny nyckel.
- Välj JSON-format.
Anteckning
Innehållet i den privata nyckeln sparas i en temporär fil på den virtuella datorn när genomsökningsprocesser körs. Den här temporära filen tas bort när genomsökningarna har slutförts. I händelse av ett genomsökningsfel fortsätter systemet att försöka igen tills det lyckas. Kontrollera att åtkomsten är korrekt begränsad på den virtuella dator där SHIR körs.
Mer information om autentiseringsuppgifter finns på länken här.
Drivrutinsplats: Ange sökvägen till JDBC-drivrutinsplatsen på den virtuella dator där integration runtime med egen värd körs. Detta bör vara sökvägen till en giltig JAR-mappplats.
Anteckning
Drivrutinen ska vara tillgänglig för alla konton på den virtuella datorn. Installera inte i ett användarkonto.
Datauppsättning: Ange en lista över BigQuery-datauppsättningar som ska importeras. Till exempel dataset1; dataset2. När listan är tom importeras alla tillgängliga datauppsättningar. Godkända namnmönster för datauppsättningar med hjälp SQL SYNTAX för LIKE-uttryck inkluderar användning av %.
Exempel: A%; %B; %C%; D
- Börja med A eller
- avsluta med B eller
- innehålla C eller
- lika med D
Användning av NOT och specialtecken är inte godtagbara.
Maximalt tillgängligt minne: Maximalt minne (i GB) som är tillgängligt på den virtuella datorn som ska användas av genomsökningsprocesser. Detta beror på storleken på Google BigQuery-projektet som ska genomsökas.
Välj Testa anslutning.
Välj Fortsätt.
Välj genomsökningsutlösaren. Du kan konfigurera ett schema eller genomsöka en gång.
Granska genomsökningen och välj Spara och kör.
Visa dina genomsökningar och genomsökningskörningar
Om du vill visa befintliga genomsökningar gör du följande:
Gå till Purview Studio. Välj Data Map under den vänstra rutan.
Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.
Välj den genomsökning som har resultat som du vill visa.
Den här sidan visar alla tidigare genomsökningskörningar tillsammans med status och mått för varje genomsökningskörning. Den visar också om genomsökningen har schemalagts eller manuellt, hur många tillgångar som hade tillämpade klassificeringar, hur många totala tillgångar som identifierades, start- och sluttiden för genomsökningen samt den totala genomsökningstiden.
Hantera genomsökningar – redigera, ta bort eller avbryta
Om du vill hantera eller ta bort en genomsökning gör du följande:
Gå till Purview Studio. Välj Data Map under den vänstra rutan.
Välj önskad datakälla. Du ser en lista över befintliga genomsökningar på datakällan under Senaste genomsökningar, eller så kan du visa alla genomsökningar på fliken Genomsökningar.
Välj den genomsökning som du vill hantera. Du kan redigera genomsökningen genom att välja Redigera genomsökning.
Du kan avbryta en pågående genomsökning genom att välja Avbryt genomsökningskörning.
Du kan ta bort genomsökningen genom att välja Ta bort genomsökning.
Anteckning
- Om du tar bort genomsökningen tas inte katalogtillgångar som skapats från tidigare genomsökningar bort.
- Tillgången uppdateras inte längre med schemaändringar om källtabellen har ändrats och du genomsöker källtabellen på nya sätt när du har redigerat beskrivningen på schemafliken i Purview.
Nästa steg
Nu när du har registrerat din källa följer du guiderna nedan för att lära dig mer om Purview och dina data.