Verbinding maken google BigQuery-projecten beheren in Azure Purview (preview)
In dit artikel wordt beschreven hoe u Google BigQuery-projecten registreert en hoe u Google BigQuery verifieert en gebruikt in Azure Purview. Lees het inleidende artikel voor meer informatie overAzure Purview.
Belangrijk
Google BigQuery als bron is momenteel beschikbaar als preview-versie. De Aanvullende voorwaarden voor gebruik van Microsoft Azure-previews omvatten aanvullende juridische voorwaarden die van toepassing zijn op Azure-functies die in bèta of preview zijn of die anders nog niet algemeen beschikbaar zijn.
Ondersteunde mogelijkheden
| Extractie van metagegevens | Volledige scan | Incrementele scan | Scannen met bereik | Classificatie | Toegangsbeleid | Herkomst |
|---|---|---|---|---|---|---|
| Ja | Ja | Nee | Nee | Nee | Nee | Ja |
Belangrijk
Ondersteunde Google BigQuery-versie is 11.0.0.
Vereisten
Een Azure-account met een actief abonnement. Gratis een account maken
Een actieve Purview-resource.
U moet een gegevensbronbeheerder en gegevenslezer zijn om een bron te registreren en te beheren in Purview Studio. Zie onze pagina Machtigingen voor Azure Purview voor meer informatie.
Stel de meest recente zelf-hostende Integration Runtime in. Zie de handleiding Een zelf-hostende Integration Runtime maken en configureren voor meer informatie.
Zorg ervoor dat JDK 11 is geïnstalleerd op de virtuele machine waarop de zelf-hostende Integration Runtime is geïnstalleerd.
Zorg ervoor dat Visual C++ Redistributable Visual Studio 2012 Update 4 is geïnstalleerd op de zelf-hostende Integration Runtime-computer. Als u deze update niet hebt geïnstalleerd, kunt u deze hier downloaden.
Download en installeer het JDBC-stuurprogramma van BigQuery op de computer waarop uw zelf-hostende Integration Runtime wordt uitgevoerd. U vindt het stuurprogramma hier.
Notitie
Het stuurprogramma moet toegankelijk zijn voor alle accounts in de VM. Installeer deze niet in een gebruikersaccount.
Registreren
In deze sectie wordt beschreven hoe u een Google BigQuery-project registreert in Azure Purview met behulp van Purview Studio.
Stappen om te registreren
Navigeer naar uw Purview-account.
Selecteer Gegevenstoewijzing in het linkernavigatievenster.
Selecteer Registreren.
Selecteer Google BigQuery bij Bronnen registreren. Selecteer Doorgaan.
Ga op het scherm Bronnen registreren (Google BigQuery) als volgt te werk:
Voer een naam in voor de gegevensbron in de catalogus.
Voer de ProjectID in. Dit moet een volledig gekwalificeerde project-id zijn. Bijvoorbeeld: mydomain.com:myProject
Selecteer een verzameling of maak een nieuwe (optioneel)
Selecteer Registreren.
Scannen
Volg de onderstaande stappen om een Google BigQuery-project te scannen om automatisch assets te identificeren en uw gegevens te classificeren. Zie onze inleiding tot scans en opname voor meer informatie over scannen in het algemeen.
Een scan maken en uitvoeren
Selecteer integratieruntimes in het beheercentrum. Zorg ervoor dat een zelf-hostende Integration Runtime is ingesteld. Als deze niet is ingesteld, gebruikt u de stappen die hier worden vermeld.
Navigeer naar Bronnen.
Selecteer het geregistreerde BigQuery-project.
Selecteer + Nieuwe scan.
Geef de onderstaande details op:
Naam: de naam van de scan
Verbinding maken via Integration Runtime: selecteer de geconfigureerde zelf-hostende Integration Runtime
Referentie: zorg ervoor dat u tijdens het configureren van de BigQuery-referentie het volgende moet doen:
- Selecteer Basisverificatie als verificatiemethode
- Geef de e-mail-id van het serviceaccount op in het veld Gebruikersnaam. Bijvoorbeeld:
xyz\@developer.gserviceaccount.com - Volg de onderstaande stappen om de persoonlijke sleutel te genereren, kopieer de JSON en sla deze op als de waarde van een Key Vault geheim.
Een nieuwe persoonlijke sleutel maken op basis van het cloudplatform van Google:
- Selecteer in het navigatiemenu IAM & Admin - > Service Accounts - Select a project > ->
- Selecteer het e-mailadres van het serviceaccount waar u een sleutel voor wilt maken.
- Selecteer het tabblad Sleutels.
- Selecteer de vervolgkeuzelijst Sleutel toevoegen en selecteer vervolgens Nieuwe sleutel maken.
- Kies JSON-indeling.
Notitie
De inhoud van de persoonlijke sleutel wordt opgeslagen in een tijdelijk bestand op de VM wanneer scanprocessen worden uitgevoerd. Dit tijdelijke bestand wordt verwijderd nadat de scans zijn voltooid. In het geval van een scanfout blijft het systeem het opnieuw proberen totdat de scan is geslaagd. Zorg ervoor dat de toegang op de juiste wijze wordt beperkt tot de VM waarop SHIR wordt uitgevoerd.
Raadpleeg de koppeling hier voor meer informatie over referenties.
Locatie van stuurprogramma: geef het pad op naar de locatie van het JDBC-stuurprogramma op de VM waarop de selfhost Integration Runtime wordt uitgevoerd. Dit moet het pad naar de geldige locatie van de JAR-map zijn.
Notitie
Het stuurprogramma moet toegankelijk zijn voor alle accounts in de VM. Installeer het niet in een gebruikersaccount.
Gegevensset: geef een lijst op met BigQuery-gegevenssets die moeten worden geïmporteerd. Bijvoorbeeld gegevensset1; dataset2. Wanneer de lijst leeg is, worden alle beschikbare gegevenssets geïmporteerd. Acceptabele naampatronen van gegevenssets met SQL syntaxis van LIKE-expressies omvatten het gebruik van %.
Voorbeeld: A%; %B; %C%; D
- Beginnen met A of
- eindig met B of
- bevat C of
- gelijk aan D
Het gebruik van NOT en speciale tekens is niet toegestaan.
Maximaal beschikbaar geheugen: maximaal geheugen (in GB) dat beschikbaar is op uw VM om te worden gebruikt door processen te scannen. Dit is afhankelijk van de grootte van het Google BigQuery-project dat moet worden gescand.
Selecteer Verbinding testen.
Selecteer Doorgaan.
Kies de scantrigger. U kunt een schema instellen of de scan eenmalig uitvoeren.
Controleer uw scan en selecteer Opslaan en uitvoeren.
Uw scans en scan-runs weergeven
Ga als volgt te werk om bestaande scans te bekijken:
Ga naar Purview Studio. Selecteer het Gegevenstoewijzing in het linkerdeelvenster.
Selecteer de gewenste gegevensbron. U ziet een lijst met bestaande scans op die gegevensbron onder Recente scans of u kunt alle scans bekijken op het tabblad Scans.
Selecteer de scan met resultaten die u wilt weergeven.
Op deze pagina ziet u alle eerdere scanruns, samen met de status en metrische gegevens voor elke scan. Ook wordt weergegeven of uw scan gepland of handmatig is uitgevoerd, op hoeveel assets classificaties waren toegepast, hoeveel assets zijn ontdekt, de begin- en eindtijd van de scan en de totale duur van de scan.
Uw scans beheren - bewerken, verwijderen of annuleren
Doe het volgende om een scan te beheren of te verwijderen:
Ga naar Purview Studio. Selecteer het Gegevenstoewijzing in het linkerdeelvenster.
Selecteer de gewenste gegevensbron. U ziet een lijst met bestaande scans op die gegevensbron onder Recente scans of u kunt alle scans bekijken op het tabblad Scans.
Selecteer de share die u wilt beheren. U kunt de scan bewerken door Scan bewerken te selecteren.
U kunt een scan die wordt uitgevoerd annuleren door Scan uitvoeren annuleren te selecteren.
U kunt uw scan verwijderen door Scan verwijderen te selecteren.
Notitie
- Als u de scan verwijdert, worden catalogusactiva die zijn gemaakt op eerdere scans, niet verwijderd.
- De asset wordt niet meer bijgewerkt met schemawijzigingen als uw brontabel is gewijzigd en u scant de brontabel opnieuw na het bewerken van de beschrijving op het schematabblad van Purview.
Volgende stappen
Nu u uw bron hebt geregistreerd, volgt u de onderstaande handleidingen voor meer informatie over Purview en uw gegevens.