Vytvoření Azure Synapse Link for Dataverse s Azure Synapse Workspace

Použijte Azure Synapse Link k připojení vašich dat Microsoft Dataverse k Azure Synapse Analytics za účelem prozkoumání vašich dat a urychlení času na získání statistik. Tento článek popisuje, jak provést následující úlohy:

  1. Připojte svá data Dataverse do vašeho pracovního prostoru Azure Synapse Analytics pomocí služby Azure Synapse Link.
  2. Spravujte tabulky Dataverse obsažené v propojení Azure Synapse Link.
  3. Sledujte propojení Azure Synapse Link.
  4. Odpojte Azure Synapse Link.
  5. Znovu připojte soubor Azure Synapse Link.
  6. Zobrazte svá data v Azure Synapse Analytics.

Poznámka

Azure Synapse Link for Microsoft Dataverse byl dříve známý jako Export do datového jezera. Služba byla s účinností od května 2021 přejmenována a bude i nadále exportovat data do Azure Data Lake a také do Azure Synapse Analytics.

Předpoklady

  • Azure Data Lake Storage Gen2: Musíte mít Účet Azure Data Lake Storage Gen2 a přístup role Vlastník a Přispěvatel dat objektu blob úložiště. Váš účet úložiště musí mít povolen hierarchický obor názvů a doporučuje se nastavit replikaci na geo-redundantní úložiště pro čtení (RA-GRS).

  • Pracovní prostor Synapse: Musíte mít pracovní prostor Synapse a přístup k rolím Správce synapse v Synapse Studio. Pracovní prostor Synapse musí být ve stejné oblasti jako váš Účet Azure Data Lake Storage Gen2. Účet úložiště musí být přidán jako propojená služba v rámci Synapse Studio. Chcete-li vytvořit pracovní prostor Synapse, přejděte na Vytvoření pracovního prostoru Synapse.

Poznámka

  • Účet úložiště a pracovní prostor Synapse musejí být vytvořeny ve stejném klientovi Azure Active Directory (Azure AD) jako váš klient Power Apps.
  • Účet úložiště a Synapse workspace musejí být vytvořeny ve stejné oblasti jako prostředí Power Apps, ve kterém budete funkci používat, a ve stejné skupině zdrojů.
  • Musíte mít roli Čtenář pro přístup do skupiny prostředků pomocí účtu úložiště a pracovního prostoru Synapse.
  • K propojení prostředí s Azure Data Lake Storage Gen2 musíte mít roli zabezpečení správce systému Dataverse.
  • Exportovat lze pouze tabulky, které mají povoleno sledování změn.
  • Když do pracovního prostoru synapse přidáte více uživatelů, musí mít Správce Synapse přístup k rolím v rámci Synapse Studio a roli Přispěvatel dat objektu blob úložiště pro účet Azure Data Lake Storage Gen2.

Připojení Dataverse do pracovního prostoru Synapse

  1. Přihlaste se k Power Apps a vyberte preferované prostředí.

  2. V levém navigačním podokně vyberte Data, vyberte Azure Synapse Link a poté na panelu příkazů vyberte + Nový odkaz na datové jezero.

    Navigujte na Power Apps.

  3. Vyberte volbu Připojit k pracovnímu prostoru Azure Synapse (Preview).

  4. Vyberte Předplatné, Skupina zdrojů, Název pracovního prostoru, a Účet úložiště. Zajistěte, aby pracovní prostor a účet úložiště Synapse splňovaly požadavky uvedené v části Předpoklady. Vyberte Další.

    Připojení k pracovnímu prostoru.

    Poznámka

    V rámci propojení prostředí k datovému jezeru udělíte službě Azure Synapse Link přístup k vašemu účtu úložiště. Vždy postupujte podle předpokladů pro vytvoření a konfiguraci účtu úložiště Azure Data Lake Storage a udělení sami sobě role vlastníka účtu úložiště. Navíc udělujete svému účtu úložiště přístup ke službě datových toků Power Platform. Další informace: Samoobslužná příprava dat s datovými toky.

  5. Přidejte tabulky, které chcete exportovat, a poté vyberte Uložit. Exportovat lze pouze tabulky, které mají povoleno sledování změn. Další informace: Povolení sledování změn.

    Přidání tabulek.

Chcete-li vytvořit odkaz z jednoho prostředí do více pracovních prostorů Azure Synapse Analytics a datových jezer Azure ve vašem předplatném Azure, přidejte podle následujících kroků datové jezero Azure jako propojenou službu do pracovního prostoru Synapse. Obdobně můžete vytvořit odkaz z více prostředí do stejného pracovního prostoru Azure Synapse Analytics a datového jezera Azure, vše v rámci jednoho klienta.

Poznámka

Data exportovaná uživatelem služby Azure Synapse Link je šifrována v klidu v Azure Data Lake Storage Gen2. Kromě toho jsou přechodná data v úložišti objektů blob také v klidu šifrována. Šifrování v Azure Data Lake Storage Gen2 vám pomáhá chránit vaše data, implementovat zásady zabezpečení podniku a splňovat požadavky na dodržování předpisů. Více informací: Šifrování dat Azure Encryption-at-Rest

V současné době nemůžete poskytnout veřejné IP adresy pro službu Azure Synapse Link for Dataverse, kterou lze použít v Nastavení brány firewall Azure Data Lake. Pravidla veřejné sítě IP nemají žádný vliv na požadavky pocházející ze stejného regionu Azure jako účet úložiště. Služby nasazené ve stejném regionu jako účet úložiště používají pro komunikaci soukromé adresy IP Azure. Proto nemůžete omezit přístup ke konkrétním službám Azure na základě jejich veřejného odchozího rozsahu IP adres. Více informací: Konfigurace bran firewall a virtuálních sítí Azure Storage

Správa dat tabulky v pracovním prostoru Synapse

Poté, co jste nastavili Azure Synapse Link, můžete tabulky, které se exportují, spravovat dvěma způsoby:

  • Na portálu tvůrce Power Apps v oblasti Azure Synapse Link vyberte Spravovat tabulky na panelu příkazů pro přidání nebo odebrání jedné nebo více propojených tabulek.

  • V portál tvůrce Power Apps v oblasti Tabulky vyberte vedle tabulky a poté vyberte propojené datové jezero, do kterého chcete exportovat data tabulky.

    Výběr tabulky pro export.

Poté, co jste nastavili propojení Azure Synapse Link, můžete Azure Synapse Link sledovat na kartě Tabulky.

Sledování Azure Synapse Link

  • Zobrazí se seznam tabulek, které jsou součástí vybraného propojení Azure Synapse Link.
  • Stav synchronizace bude procházet různými fázemi. Nespuštěno označuje, že tabulka čeká na synchronizaci. Jakmile bude počáteční synchronizace tabulky Dokončena, proběhne fáze následného zpracování, kde nebudou probíhat přírůstkové aktualizace. V závislosti na velikosti dat to může trvat i několik hodin. Jakmile začnou probíhat přírůstkové aktualizace, bude datum poslední synchronizace pravidelně aktualizováno.
  • Sloupec Počet ukazuje počet zapsaných řádků. Když je vlastnost Jen připojit nastavena na Ne, jde o celkový počet záznamů. Když je vlastnost Jen připojit nastavena na Ano, jde o celkový počet změn.
  • Sloupce Pouze připojit a Strategie dělení ukazují využití různých pokročilých konfigurací.
  1. Vyberte požadované propojení Azure Synapse Link, které chcete odpojit.

  2. Vyberte příkaz Odpojit datové jezero z panelu příkazů.

  3. Chcete-li odstranit souborový systém datového jezera i databázi Synapse, vyberte Odstranit souborový systém datového jezera.

  4. Vyberte Ano a počkejte několik minut, než bude vše odpojeno a odstraněno.

Pokud jste při odpojování odstranili systém souborů, připojte stejný pracovní prostor Synapse a datové jezero znovu podle výše uvedených kroků. Pokud jste při odpojování neodstranili systém souborů, musíte data vymazat a znovu je propojit:

  1. Přejděte do Azure Synapse Analytics.

  2. Vyberte položku ... pro nepropojenou databázi a poté Nový notebook > Prázdný notebook.

  3. Připojte notebook k fondu Apache Spark výběrem fondu z rozevírací nabídky. Pokud nemáte fond Apache Spark, vyberte Spravovat fondy k jeho vytvoření.

  4. Zadejte následující skript, ve kterém část <DATABASE_NAME> nahraďte názvem databáze, kterou chcete odpojit, a spusťte notebook.

    %%sqls
    DROP DATABASE <DATABASE_NAME> CASCADE
  1. Po spuštění notebooku obnovte seznam databází v levém panelu. Pokud databáze stále existuje, zkuste na ni kliknout pravým tlačítkem a vybrat příkaz Odstranit.

  2. Přejděte do Power Apps a znovu propojte pracovní prostor Synapse a datové jezero.

Přístup k datům téměř v reálném čase a k datům snímků pouze pro čtení (náhled)

[Toto téma představuje předběžnou dokumentaci a může se změnit.]

Po vytvoření Azure Synapse Link budou ve výchozím nastavení synchronizovány dvě verze dat tabulky Azure Synapse Analytics a/nebo Azure Data Lake Storage Gen2 ve vašem předplatném Azure, abyste zajistili, že můžete kdykoli spolehlivě využívat aktualizovaná data v jezeře:

  • Data téměř v reálném čase: Poskytuje kopii dat synchronizovaných z Dataverse přes Synapse Link účinným způsobem detekcí, jaká data se změnila od doby, kdy byla původně extrahována nebo naposledy synchronizována.
  • Data snímku: Poskytuje kopii dat téměř v reálném čase pouze pro čtení, která se aktualizuje v pravidelných intervalech (v tomto případě každou hodinu). 

Poznámka

Toto je funkce Preview.

Pro prázdná data tabulky se vytvářejí pouze data téměř v reálném čase.

  1. Vyberte požadované propojení Azure Synapse Link a v horním panelu vyberte možnost  Přejít do pracovního prostoru Azure Synapse Analytics .
  2. Rozbalte  Databáze jezera v levém panelu, vyberte dataverse-environmentName-organizationUniqueName a rozbalte  Tabulky.

Všechny Tabulky dat téměř v reálném čase jsou uvedeny a dostupné pro analýzu s konvencí pojmenování DataverseTableName.Všechny Tabulky dat snímku jsou uvedeny a dostupné pro analýzu s konvencí pojmenování DataverseTableName _partitioned.

Tabulka téměř v reálném čase a snímek

Co dál?

Po úspěšném použití služby Azure Synapse Link for Dataverse zjistěte, jak můžete analyzovat a spotřebovávat svá data v Centru zjišťování. Pro přístup do centra zjišťování jděte na Power Apps > Azure Synapse Link. Vyberte svou propojenou službu a poté vyberte záložku Centrum analýz. Zde najdete doporučené nástroje a připravenou dokumentaci, které vám pomohou získat maximum z vašich dat. Centrum analýz.

Viz také

Konfigurace Azure Synapse Link for Dataverse s Azure Data Lake

Rozšířená konfigurace Azure Synapse Link for Dataverse

Azure Synapse Link - nejčastější dotazy

Blog: Oznámení Azure Synapse Link for Dataverse

Poznámka

Můžete nám sdělit, jaké máte jazykové preference pro dokumentaci? Zúčastněte se krátkého průzkumu. (upozorňujeme, že tento průzkum je v angličtině)

Průzkum bude trvat asi sedm minut. Nejsou shromažďovány žádné osobní údaje (prohlášení o zásadách ochrany osobních údajů).