Připojení a správu projektů Google BigQuery v Azure Purview (Preview)
Tento článek popisuje registraci projektů Google BigQuery a ověřování a interakci s Google BigQuery v Azure Purview. Další informace o Azure Purview najdete v úvodním článku.
Důležité
Google BigQuery jako zdroj je aktuálně ve verzi PREVIEW. Dodatečné podmínky použití pro Microsoft Azure ve verzi Preview obsahují dodatečné právní podmínky platné pro funkce Azure, které jsou v beta verzi, verzi Preview nebo zatím nejsou veřejně dostupné.
Podporované funkce
| Extrakce metadat | Úplná kontrola | Přírůstkové prohledávání | Kontrola s vymezenou oborem | Classification | Zásady přístupu | Lineage |
|---|---|---|---|---|---|---|
| Ano | Ano | No | No | No | No | Ano |
Důležité
Podporovaná verze Google BigQuery je 11.0.0.
Požadavky
Účet Azure s aktivním předplatným. Vytvořte si účet zdarma.
Aktivní prostředek Purview.
Pokud chcete zaregistrovat zdroj a spravovat ho v aplikaci Purview Studio, musíte být správcem zdroje dat a čtenářem dat. Podrobnosti najdete na naší stránce Oprávnění Azure Purview.
Nastavte nejnovější verzi prostředí Integration Runtime v vlastním prostředí. Další informace najdete v průvodci vytvořením a konfigurací prostředí Integration Runtime v vlastním prostředí.
Ujistěte se, že je na virtuálním počítači, na kterém je nainstalovaný modul runtime integrace v samostatném prostředí, nainstalovaná JDK 11.
Ujistěte Distribuovatelné součásti Visual C++ pro Visual Studio 2012 Update 4 na počítači s prostředím Integration Runtime v samostatném prostředí. Pokud tuto aktualizaci nemáte nainstalovanou, můžete si ji stáhnout tady.
Stáhněte a nainstalujte ovladač JDBC BigQuery na počítači, na kterém je spuštěný váš modul runtime integrace v samostatném prostředí. Ovladač najdete tady.
Poznámka
Ovladač by měl být přístupný všem účtům ve virtuálním počítače. Neinstalujte ho do uživatelského účtu.
Registrovat
Tato část popisuje, jak zaregistrovat projekt Google BigQuery v Azure Purview pomocí nástroje Purview Studio.
Postup registrace
Přejděte ke svému účtu Purview.
V Mapování dat navigaci vyberte Další.
Vyberte Zaregistrovat.
V okně Registrovat zdroje vyberte Google BigQuery. Vyberte Pokračovat.
Na obrazovce Registrovat zdroje (Google BigQuery) proveďte následující:
Zadejte Název, který bude zdroj dat uveden v katalogu.
Zadejte Id projektu. Mělo by to být plně kvalifikované ID projektu. Příklad: mydomain.com:myProject
Vyberte kolekci nebo vytvořte novou (volitelné).
Vyberte Zaregistrovat.
Prohledávání
Pomocí následujících kroků naskenujte projekt Google BigQuery a automaticky identifikujte prostředky a klasifikujte data. Další informace o obecné kontrole najdete v našem úvodu do skenování a příjmu dat.
Vytvoření a spuštění kontroly
V Centru pro správu vyberte Prostředí Integration Runtime. Ujistěte se, že je nastavené prostředí Integration Runtime v vlastním prostředí. Pokud není nastavená, postupujte podle kroků uvedených tady.
Přejděte na Zdroje.
Vyberte registrovaný projekt BigQuery.
Vyberte + Nová kontrola.
Zadejte následující podrobnosti:
Název: Název kontroly.
Připojení prostřednictvím prostředí Integration Runtime: Vyberte nakonfigurované prostředí Integration Runtime v vlastním prostředí.
Přihlašovací údaje: Při konfiguraci přihlašovacích údajů BigQuery nezapomeňte:
- Jako metodu ověřování vyberte Základní ověřování.
- Do pole Uživatelské jméno zadejte ID e-mailu účtu služby. Například
xyz\@developer.gserviceaccount.com. - Pomocí následujících kroků vygenerujte privátní klíč, zkopírujte JSON a uložte ho jako hodnotu tajného Key Vault klíče.
Vytvoření nového privátního klíče z cloudové platformy Googlu:
- V navigační nabídce vyberte IAM & Admin - > Service Accounts - Select a project > ->
- Vyberte e-mailovou adresu účtu služby, pro který chcete vytvořit klíč.
- Vyberte kartu Klíče.
- Vyberte rozevírací nabídku Přidat klíč a pak vyberte Vytvořit nový klíč.
- Zvolte Formát JSON.
Poznámka
Obsah privátního klíče se při spuštění procesů kontroly uloží do dočasného souboru na virtuálním počítači. Po úspěšném dokončení kontrol se tento dočasný soubor odstraní. V případě selhání kontroly bude systém pokračovat v opakování až do úspěšného dokončení. Ujistěte se, že je přístup na virtuálním počítači, na kterém běží SHIR, odpovídajícím způsobem omezený.
Další informace o přihlašovacích údajůch najdete na odkazu tady.
Umístění ovladače: Zadejte cestu k umístění ovladače JDBC na virtuálním počítači, na kterém je spuštěný modul runtime integrace vlastního hostitele. Mělo by to být cesta k platnému umístění složky JAR.
Poznámka
Ovladač by měl být přístupný všem účtům ve virtuálním počítače. Neinstalujte ho do uživatelského účtu.
Datová sada: Zadejte seznam datových sad BigQuery, které se mají importovat. Například dataset1; dataset2. Pokud je seznam prázdný, importuje se všechny dostupné datové sady. Přijatelné vzory názvů datových sad SQL syntaxe like zahrnují použití %.
Příklad: A%; %B; %C%; D
- Začněte s A nebo
- končí na B nebo
- obsahují C nebo
- equal D
Použití NOT a speciálních znaků není přijatelné.
Maximální dostupná paměť: Maximální velikost paměti (v GB) dostupná na vašem virtuálním počítači, kterou budou používat procesy prohledávání. To závisí na velikosti projektu Google BigQuery, který se má prohledovat.
Vyberte Test připojení.
Vyberte Pokračovat.
Zvolte trigger prohledávání. Můžete nastavit plán nebo spustit kontrolu jednou.
Zkontrolujte kontrolu a vyberte Uložit a spustit.
Zobrazení kontrol a spuštění kontroly
Pokud chcete zobrazit existující kontroly, proveďte následující:
Přejděte do purview studia. Vyberte kartu Mapování dat v levém podokně.
Vyberte požadovaný zdroj dat. V části Poslední kontroly se zobrazí seznam existujících kontrol v tomto zdroji dat nebo můžete zobrazit všechny kontroly na kartě Kontroly.
Vyberte kontrolu s výsledky, které chcete zobrazit.
Na této stránce se zobrazí všechna předchozí spuštění kontroly spolu se stavem a metrikami jednotlivých spuštění kontroly. Zobrazí se také to, jestli byla kontrola naplánovaná nebo ruční, kolik aktiv bylo použito klasifikace, kolik celkového počtu zjištěných prostředků bylo zjištěno, počáteční a koncový čas kontroly a celková doba trvání kontroly.
Správa kontrol – úprava, odstranění nebo zrušení
Kontrolu můžete spravovat nebo odstraňovat takto:
Přejděte do purview studia. Vyberte kartu Mapování dat v levém podokně.
Vyberte požadovaný zdroj dat. V části Poslední kontroly se zobrazí seznam existujících kontrol v tomto zdroji dat nebo můžete zobrazit všechny kontroly na kartě Kontroly.
Vyberte kontrolu, kterou chcete spravovat. Kontrolu můžete upravit tak, že vyberete Upravit kontrolu.
Probíhající kontrolu můžete zrušit výběrem možnosti Zrušit spuštění kontroly.
Kontrolu můžete odstranit výběrem možnosti Odstranit kontrolu.
Poznámka
- Odstraněním kontroly se neodstraní prostředky katalogu vytvořené z předchozích kontrol.
- Pokud se zdrojová tabulka změnila a po úpravě popisu na kartě schématu v Purview znovu prohledáte zdrojovou tabulku, prostředek se už nebude aktualizovat se změnami schématu.
Další kroky
Teď, když jste si zaregistrovali zdroj, postupujte podle následujících průvodců a získejte další informace o Purview a vašich datech.