Připojení a správu projektů Google BigQuery v Azure Purview (Preview)

Tento článek popisuje registraci projektů Google BigQuery a ověřování a interakci s Google BigQuery v Azure Purview. Další informace o Azure Purview najdete v úvodním článku.

Důležité

Google BigQuery jako zdroj je aktuálně ve verzi PREVIEW. Dodatečné podmínky použití pro Microsoft Azure ve verzi Preview obsahují dodatečné právní podmínky platné pro funkce Azure, které jsou v beta verzi, verzi Preview nebo zatím nejsou veřejně dostupné.

Podporované funkce

Extrakce metadat Úplná kontrola Přírůstkové prohledávání Kontrola s vymezenou oborem Classification Zásady přístupu Lineage
Ano Ano No No No No Ano

Důležité

Podporovaná verze Google BigQuery je 11.0.0.

Požadavky

Registrovat

Tato část popisuje, jak zaregistrovat projekt Google BigQuery v Azure Purview pomocí nástroje Purview Studio.

Postup registrace

  1. Přejděte ke svému účtu Purview.

  2. V Mapování dat navigaci vyberte Další.

  3. Vyberte Zaregistrovat.

  4. V okně Registrovat zdroje vyberte Google BigQuery. Vyberte Pokračovat.

    registrace zdroje BigQuery

Na obrazovce Registrovat zdroje (Google BigQuery) proveďte následující:

  1. Zadejte Název, který bude zdroj dat uveden v katalogu.

  2. Zadejte Id projektu. Mělo by to být plně kvalifikované ID projektu. Příklad: mydomain.com:myProject

  3. Vyberte kolekci nebo vytvořte novou (volitelné).

  4. Vyberte Zaregistrovat.

    konfigurace zdroje BigQuery

Prohledávání

Pomocí následujících kroků naskenujte projekt Google BigQuery a automaticky identifikujte prostředky a klasifikujte data. Další informace o obecné kontrole najdete v našem úvodu do skenování a příjmu dat.

Vytvoření a spuštění kontroly

  1. V Centru pro správu vyberte Prostředí Integration Runtime. Ujistěte se, že je nastavené prostředí Integration Runtime v vlastním prostředí. Pokud není nastavená, postupujte podle kroků uvedených tady.

  2. Přejděte na Zdroje.

  3. Vyberte registrovaný projekt BigQuery.

  4. Vyberte + Nová kontrola.

  5. Zadejte následující podrobnosti:

    1. Název: Název kontroly.

    2. Připojení prostřednictvím prostředí Integration Runtime: Vyberte nakonfigurované prostředí Integration Runtime v vlastním prostředí.

    3. Přihlašovací údaje: Při konfiguraci přihlašovacích údajů BigQuery nezapomeňte:

      • Jako metodu ověřování vyberte Základní ověřování.
      • Do pole Uživatelské jméno zadejte ID e-mailu účtu služby. Například xyz\@developer.gserviceaccount.com.
      • Pomocí následujících kroků vygenerujte privátní klíč, zkopírujte JSON a uložte ho jako hodnotu tajného Key Vault klíče.

      Vytvoření nového privátního klíče z cloudové platformy Googlu:

      1. V navigační nabídce vyberte IAM & Admin - > Service Accounts - Select a project > ->
      2. Vyberte e-mailovou adresu účtu služby, pro který chcete vytvořit klíč.
      3. Vyberte kartu Klíče.
      4. Vyberte rozevírací nabídku Přidat klíč a pak vyberte Vytvořit nový klíč.
      5. Zvolte Formát JSON.

      Poznámka

      Obsah privátního klíče se při spuštění procesů kontroly uloží do dočasného souboru na virtuálním počítači. Po úspěšném dokončení kontrol se tento dočasný soubor odstraní. V případě selhání kontroly bude systém pokračovat v opakování až do úspěšného dokončení. Ujistěte se, že je přístup na virtuálním počítači, na kterém běží SHIR, odpovídajícím způsobem omezený.

      Další informace o přihlašovacích údajůch najdete na odkazu tady.

    4. Umístění ovladače: Zadejte cestu k umístění ovladače JDBC na virtuálním počítači, na kterém je spuštěný modul runtime integrace vlastního hostitele. Mělo by to být cesta k platnému umístění složky JAR.

      Poznámka

      Ovladač by měl být přístupný všem účtům ve virtuálním počítače. Neinstalujte ho do uživatelského účtu.

    5. Datová sada: Zadejte seznam datových sad BigQuery, které se mají importovat. Například dataset1; dataset2. Pokud je seznam prázdný, importuje se všechny dostupné datové sady. Přijatelné vzory názvů datových sad SQL syntaxe like zahrnují použití %.

      Příklad: A%; %B; %C%; D

      • Začněte s A nebo
      • končí na B nebo
      • obsahují C nebo
      • equal D

      Použití NOT a speciálních znaků není přijatelné.

    6. Maximální dostupná paměť: Maximální velikost paměti (v GB) dostupná na vašem virtuálním počítači, kterou budou používat procesy prohledávání. To závisí na velikosti projektu Google BigQuery, který se má prohledovat.

      prohledávání zdroje BigQuery

  6. Vyberte Test připojení.

  7. Vyberte Pokračovat.

  8. Zvolte trigger prohledávání. Můžete nastavit plán nebo spustit kontrolu jednou.

  9. Zkontrolujte kontrolu a vyberte Uložit a spustit.

Zobrazení kontrol a spuštění kontroly

Pokud chcete zobrazit existující kontroly, proveďte následující:

  1. Přejděte do purview studia. Vyberte kartu Mapování dat v levém podokně.

  2. Vyberte požadovaný zdroj dat. V části Poslední kontroly se zobrazí seznam existujících kontrol v tomto zdroji dat nebo můžete zobrazit všechny kontroly na kartě Kontroly.

  3. Vyberte kontrolu s výsledky, které chcete zobrazit.

  4. Na této stránce se zobrazí všechna předchozí spuštění kontroly spolu se stavem a metrikami jednotlivých spuštění kontroly. Zobrazí se také to, jestli byla kontrola naplánovaná nebo ruční, kolik aktiv bylo použito klasifikace, kolik celkového počtu zjištěných prostředků bylo zjištěno, počáteční a koncový čas kontroly a celková doba trvání kontroly.

Správa kontrol – úprava, odstranění nebo zrušení

Kontrolu můžete spravovat nebo odstraňovat takto:

  1. Přejděte do purview studia. Vyberte kartu Mapování dat v levém podokně.

  2. Vyberte požadovaný zdroj dat. V části Poslední kontroly se zobrazí seznam existujících kontrol v tomto zdroji dat nebo můžete zobrazit všechny kontroly na kartě Kontroly.

  3. Vyberte kontrolu, kterou chcete spravovat. Kontrolu můžete upravit tak, že vyberete Upravit kontrolu.

  4. Probíhající kontrolu můžete zrušit výběrem možnosti Zrušit spuštění kontroly.

  5. Kontrolu můžete odstranit výběrem možnosti Odstranit kontrolu.

Poznámka

  • Odstraněním kontroly se neodstraní prostředky katalogu vytvořené z předchozích kontrol.
  • Pokud se zdrojová tabulka změnila a po úpravě popisu na kartě schématu v Purview znovu prohledáte zdrojovou tabulku, prostředek se už nebude aktualizovat se změnami schématu.

Další kroky

Teď, když jste si zaregistrovali zdroj, postupujte podle následujících průvodců a získejte další informace o Purview a vašich datech.