Connettersi ai progetti Google BigQuery e gestirli in Microsoft Purview

Questo articolo illustra come registrare i progetti Google BigQuery e come eseguire l'autenticazione e interagire con Google BigQuery in Microsoft Purview. Per altre informazioni su Microsoft Purview, vedere l'articolo introduttivo.

Funzionalità supportate

Estrazione dei metadati Analisi completa Analisi incrementale Analisi con ambito Classificazione Applicazione di etichette Criteri di accesso Lignaggio Condivisione dei dati Visualizzazione dinamica
No No No No No No

Durante l'analisi dell'origine Google BigQuery, Microsoft Purview supporta:

  • Estrazione di metadati tecnici, tra cui:

    • Progetti
    • Set di dati
    • Tabelle che includono le colonne
    • Viste incluse le colonne
  • Recupero della derivazione statica sulle relazioni tra gli asset tra tabelle e viste.

Quando si configura l'analisi, è possibile scegliere di analizzare un intero progetto Google BigQuery o di definire l'ambito dell'analisi in un subset di set di dati corrispondenti ai nomi o ai criteri di nome specificati.

Limitazioni note

  • Attualmente, Microsoft Purview supporta solo l'analisi dei set di dati di Google BigQuery nella posizione multiarea degli Stati Uniti. Se il set di dati specificato si trova in un'altra posizione, ad esempio us-east1 o EU, si noterà che l'analisi viene completata ma non vengono visualizzati asset in Microsoft Purview.
  • Quando l'oggetto viene eliminato dall'origine dati, attualmente l'analisi successiva non rimuove automaticamente l'asset corrispondente in Microsoft Purview.

Prerequisiti

Registrazione

Questa sezione descrive come registrare un progetto Google BigQuery in Microsoft Purview usando il portale di governance di Microsoft Purview.

Passaggi per la registrazione

  1. Aprire il portale di governance di Microsoft Purview:

  2. Selezionare Mappa dati nel riquadro di spostamento a sinistra.

  3. Selezionare Registra.

  4. In Registra origini selezionare Google BigQuery . Selezionare Continua.

    registrare l'origine BigQuery

Nella schermata Registra origini (Google BigQuery) eseguire le operazioni seguenti:

  1. Immettere un nome in cui l'origine dati verrà elencata all'interno del catalogo.

  2. Immettere projectID. Deve trattarsi di un ID progetto completo. Ad esempio, mydomain.com:myProject

  3. Selezionare una raccolta o crearne una nuova (facoltativa)

  4. Selezionare Registra.

    configurare l'origine BigQuery

Analisi

Seguire la procedura seguente per analizzare un progetto Google BigQuery per identificare automaticamente gli asset. Per altre informazioni sull'analisi in generale, vedere l'introduzione alle analisi e all'inserimento.

Creare ed eseguire l'analisi

  1. Nel Centro gestione selezionare Runtime di integrazione. Assicurarsi che sia configurato un runtime di integrazione self-hosted. Se non è configurato, seguire questa procedura.

  2. Passare a Origini.

  3. Selezionare il progetto BigQuery registrato.

  4. Selezionare + Nuova analisi.

  5. Specificare i dettagli seguenti:

    1. Nome: nome dell'analisi

    2. Connettersi tramite il runtime di integrazione: selezionare il runtime di integrazione self-hosted configurato

    3. Credenziali: durante la configurazione delle credenziali di BigQuery, assicurarsi di:

      • Selezionare Autenticazione di base come metodo di autenticazione
      • Specificare l'ID di posta elettronica dell'account del servizio nel campo Nome utente. Ad esempio, xyz\@developer.gserviceaccount.com
      • Seguire la procedura seguente per generare la chiave privata, copiare l'intero file di chiave JSON e archiviarlo come valore di un segreto Key Vault.

      Per creare una nuova chiave privata dalla piattaforma cloud di Google:

      1. Nel menu di spostamento selezionare IAM & Amministrazione -> Account del servizio -> Selezionare un progetto ->
      2. Selezionare l'indirizzo di posta elettronica dell'account del servizio per cui si vuole creare una chiave.
      3. Selezionare la scheda Chiavi .
      4. Selezionare il menu a discesa Aggiungi chiave e quindi selezionare Crea nuova chiave.
      5. Scegliere il formato JSON.

      Nota

      Il contenuto della chiave privata viene salvato in un file temporaneo nella macchina virtuale durante l'esecuzione dei processi di analisi. Questo file temporaneo viene eliminato dopo il completamento delle analisi. In caso di errore di analisi, il sistema continuerà a riprovare fino all'esito positivo. Assicurarsi che l'accesso sia limitato in modo appropriato nella macchina virtuale in cui è in esecuzione SHIR.

      Per altre informazioni sulle credenziali, vedere il collegamento qui.

    4. Percorso driver: specificare il percorso del driver JDBC nel computer in cui è in esecuzione il runtime di integrazione self-host, ad esempio D:\Drivers\GoogleBigQuery. Si tratta del percorso della cartella JAR valida. Assicurarsi che il driver sia accessibile dal runtime di integrazione self-hosted. Altre informazioni sono disponibili nella sezione prerequisiti.

    5. Set di dati: specificare un elenco di set di dati BigQuery da importare. Ad esempio, dataset1; set di dati2. Quando l'elenco è vuoto, vengono importati tutti i set di dati disponibili. I modelli di nome del set di dati accettabili che usano la sintassi delle espressioni SQL LIKE includono l'uso di %.

      Esempio: A%; %B; %C%; D

      • Iniziare con A o
      • fine con B o
      • contengono C o
      • uguale a D

      L'utilizzo di NOT e caratteri speciali non è accettabile.

    6. Memoria massima disponibile: memoria massima (in GB) disponibile nella macchina virtuale da usare per l'analisi dei processi. Dipende dalle dimensioni del progetto Google BigQuery da analizzare.

      analisi dell'origine BigQuery

  6. Selezionare Test connessione.

  7. Selezionare Continua.

  8. Scegliere il trigger di analisi. È possibile configurare una pianificazione o eseguire l'analisi una sola volta.

  9. Esaminare l'analisi e selezionare Salva ed esegui.

Visualizzare le analisi e le esecuzioni di analisi

Per visualizzare le analisi esistenti:

  1. Passare al portale di governance di Microsoft Purview. Nel riquadro sinistro selezionare Mappa dati.
  2. Selezionare l'origine dati. È possibile visualizzare un elenco di analisi esistenti nell'origine dati in Analisi recenti oppure è possibile visualizzare tutte le analisi nella scheda Analisi .
  3. Selezionare l'analisi con i risultati che si desidera visualizzare. Il riquadro mostra tutte le esecuzioni di analisi precedenti, insieme allo stato e alle metriche per ogni esecuzione dell'analisi.
  4. Selezionare l'ID di esecuzione per controllare i dettagli dell'esecuzione dell'analisi.

Gestire le analisi

Per modificare, annullare o eliminare un'analisi:

  1. Passare al portale di governance di Microsoft Purview. Nel riquadro sinistro selezionare Mappa dati.

  2. Selezionare l'origine dati. È possibile visualizzare un elenco di analisi esistenti nell'origine dati in Analisi recenti oppure è possibile visualizzare tutte le analisi nella scheda Analisi .

  3. Selezionare l'analisi da gestire. È quindi possibile eseguire automaticamente le seguenti azioni:

    • Modificare l'analisi selezionando Modifica analisi.
    • Annullare un'analisi in corso selezionando Annulla esecuzione analisi.
    • Eliminare l'analisi selezionando Elimina analisi.

Nota

  • L'eliminazione dell'analisi non elimina gli asset del catalogo creati dalle analisi precedenti.
  • L'asset non verrà più aggiornato con le modifiche dello schema se la tabella di origine è stata modificata e la tabella di origine viene analizzata di nuovo dopo aver modificato la descrizione nella scheda Schema di Microsoft Purview.

Lignaggio

Dopo aver eseguito l'analisi dell'origine Google BigQuery, è possibile esplorare il catalogo dati o cercare il catalogo dati per visualizzare i dettagli dell'asset.

Passare alla scheda asset -> derivazione. Se applicabile, è possibile visualizzare la relazione tra asset. Fare riferimento alla sezione relativa alle funzionalità supportate negli scenari di derivazione di Google BigQuery supportati. Per altre informazioni sulla derivazione in generale, vedere la guida dell'utente alla derivazione e alla derivazione dei dati.

Visualizzazione derivazione di Google BigQuery

Passaggi successivi

Dopo aver registrato l'origine, seguire le guide seguenti per altre informazioni su Microsoft Purview e i dati.