Verbinding maken google BigQuery-projecten beheren in Azure Purview (preview)

In dit artikel wordt beschreven hoe u Google BigQuery-projecten registreert en hoe u Google BigQuery verifieert en gebruikt in Azure Purview. Lees het inleidende artikel voor meer informatie overAzure Purview.

Belangrijk

Google BigQuery als bron is momenteel beschikbaar als preview-versie. De Aanvullende voorwaarden voor gebruik van Microsoft Azure-previews omvatten aanvullende juridische voorwaarden die van toepassing zijn op Azure-functies die in bèta of preview zijn of die anders nog niet algemeen beschikbaar zijn.

Ondersteunde mogelijkheden

Extractie van metagegevens Volledige scan Incrementele scan Scannen met bereik Classificatie Toegangsbeleid Herkomst
Ja Ja Nee Nee Nee Nee Ja

Belangrijk

Ondersteunde Google BigQuery-versie is 11.0.0.

Vereisten

Registreren

In deze sectie wordt beschreven hoe u een Google BigQuery-project registreert in Azure Purview met behulp van Purview Studio.

Stappen om te registreren

  1. Navigeer naar uw Purview-account.

  2. Selecteer Gegevenstoewijzing in het linkernavigatievenster.

  3. Selecteer Registreren.

  4. Selecteer Google BigQuery bij Bronnen registreren. Selecteer Doorgaan.

    BigQuery-bron registreren

Ga op het scherm Bronnen registreren (Google BigQuery) als volgt te werk:

  1. Voer een naam in voor de gegevensbron in de catalogus.

  2. Voer de ProjectID in. Dit moet een volledig gekwalificeerde project-id zijn. Bijvoorbeeld: mydomain.com:myProject

  3. Selecteer een verzameling of maak een nieuwe (optioneel)

  4. Selecteer Registreren.

    BigQuery-bron configureren

Scannen

Volg de onderstaande stappen om een Google BigQuery-project te scannen om automatisch assets te identificeren en uw gegevens te classificeren. Zie onze inleiding tot scans en opname voor meer informatie over scannen in het algemeen.

Een scan maken en uitvoeren

  1. Selecteer integratieruntimes in het beheercentrum. Zorg ervoor dat een zelf-hostende Integration Runtime is ingesteld. Als deze niet is ingesteld, gebruikt u de stappen die hier worden vermeld.

  2. Navigeer naar Bronnen.

  3. Selecteer het geregistreerde BigQuery-project.

  4. Selecteer + Nieuwe scan.

  5. Geef de onderstaande details op:

    1. Naam: de naam van de scan

    2. Verbinding maken via Integration Runtime: selecteer de geconfigureerde zelf-hostende Integration Runtime

    3. Referentie: zorg ervoor dat u tijdens het configureren van de BigQuery-referentie het volgende moet doen:

      • Selecteer Basisverificatie als verificatiemethode
      • Geef de e-mail-id van het serviceaccount op in het veld Gebruikersnaam. Bijvoorbeeld: xyz\@developer.gserviceaccount.com
      • Volg de onderstaande stappen om de persoonlijke sleutel te genereren, kopieer de JSON en sla deze op als de waarde van een Key Vault geheim.

      Een nieuwe persoonlijke sleutel maken op basis van het cloudplatform van Google:

      1. Selecteer in het navigatiemenu IAM & Admin - > Service Accounts - Select a project > ->
      2. Selecteer het e-mailadres van het serviceaccount waar u een sleutel voor wilt maken.
      3. Selecteer het tabblad Sleutels.
      4. Selecteer de vervolgkeuzelijst Sleutel toevoegen en selecteer vervolgens Nieuwe sleutel maken.
      5. Kies JSON-indeling.

      Notitie

      De inhoud van de persoonlijke sleutel wordt opgeslagen in een tijdelijk bestand op de VM wanneer scanprocessen worden uitgevoerd. Dit tijdelijke bestand wordt verwijderd nadat de scans zijn voltooid. In het geval van een scanfout blijft het systeem het opnieuw proberen totdat de scan is geslaagd. Zorg ervoor dat de toegang op de juiste wijze wordt beperkt tot de VM waarop SHIR wordt uitgevoerd.

      Raadpleeg de koppeling hier voor meer informatie over referenties.

    4. Locatie van stuurprogramma: geef het pad op naar de locatie van het JDBC-stuurprogramma op de VM waarop de selfhost Integration Runtime wordt uitgevoerd. Dit moet het pad naar de geldige locatie van de JAR-map zijn.

      Notitie

      Het stuurprogramma moet toegankelijk zijn voor alle accounts in de VM. Installeer het niet in een gebruikersaccount.

    5. Gegevensset: geef een lijst op met BigQuery-gegevenssets die moeten worden geïmporteerd. Bijvoorbeeld gegevensset1; dataset2. Wanneer de lijst leeg is, worden alle beschikbare gegevenssets geïmporteerd. Acceptabele naampatronen van gegevenssets met SQL syntaxis van LIKE-expressies omvatten het gebruik van %.

      Voorbeeld: A%; %B; %C%; D

      • Beginnen met A of
      • eindig met B of
      • bevat C of
      • gelijk aan D

      Het gebruik van NOT en speciale tekens is niet toegestaan.

    6. Maximaal beschikbaar geheugen: maximaal geheugen (in GB) dat beschikbaar is op uw VM om te worden gebruikt door processen te scannen. Dit is afhankelijk van de grootte van het Google BigQuery-project dat moet worden gescand.

      BigQuery-bron scannen

  6. Selecteer Verbinding testen.

  7. Selecteer Doorgaan.

  8. Kies de scantrigger. U kunt een schema instellen of de scan eenmalig uitvoeren.

  9. Controleer uw scan en selecteer Opslaan en uitvoeren.

Uw scans en scan-runs weergeven

Ga als volgt te werk om bestaande scans te bekijken:

  1. Ga naar Purview Studio. Selecteer het Gegevenstoewijzing in het linkerdeelvenster.

  2. Selecteer de gewenste gegevensbron. U ziet een lijst met bestaande scans op die gegevensbron onder Recente scans of u kunt alle scans bekijken op het tabblad Scans.

  3. Selecteer de scan met resultaten die u wilt weergeven.

  4. Op deze pagina ziet u alle eerdere scanruns, samen met de status en metrische gegevens voor elke scan. Ook wordt weergegeven of uw scan gepland of handmatig is uitgevoerd, op hoeveel assets classificaties waren toegepast, hoeveel assets zijn ontdekt, de begin- en eindtijd van de scan en de totale duur van de scan.

Uw scans beheren - bewerken, verwijderen of annuleren

Doe het volgende om een scan te beheren of te verwijderen:

  1. Ga naar Purview Studio. Selecteer het Gegevenstoewijzing in het linkerdeelvenster.

  2. Selecteer de gewenste gegevensbron. U ziet een lijst met bestaande scans op die gegevensbron onder Recente scans of u kunt alle scans bekijken op het tabblad Scans.

  3. Selecteer de share die u wilt beheren. U kunt de scan bewerken door Scan bewerken te selecteren.

  4. U kunt een scan die wordt uitgevoerd annuleren door Scan uitvoeren annuleren te selecteren.

  5. U kunt uw scan verwijderen door Scan verwijderen te selecteren.

Notitie

  • Als u de scan verwijdert, worden catalogusactiva die zijn gemaakt op eerdere scans, niet verwijderd.
  • De asset wordt niet meer bijgewerkt met schemawijzigingen als uw brontabel is gewijzigd en u scant de brontabel opnieuw na het bewerken van de beschrijving op het schematabblad van Purview.

Volgende stappen

Nu u uw bron hebt geregistreerd, volgt u de onderstaande handleidingen voor meer informatie over Purview en uw gegevens.