Nejčastější dotazy k řešení Azure Synapse Link for Dataverse

Tento článek poskytuje informace o nejčastějších dotazech týkajících se exportu dat tabulky Microsoft Dataverse do Azure Synapse Analytics a Azure Data Lake.

Ovlivňuje přidání více tabulek Microsoft Dataverse současně výkon jezera?

Přidání více tabulek do profilu Azure Synapse Link ovlivní výkon v následujícím scénáři:

  • Delta synchronizace: Po dokončení počáteční synchronizace tabulek se jakékoli změna v Dataverse pro vybrané tabulky přidá do společné fronty v Azure Synapse Link. Fronta je zpracována s pevnou sadou paralelních naslouchacích procesů. Pokud do fronty přidáte více tabulek, Azure Synapse Link zpracuje zprávy, ale pokud je počet zpráv vyšší, přidá latenci pro synchronizaci dat na synapse a / nebo datové jezero.

Jak se dostanu ke vztahům tabulky?

U vztahů N:N bude vztah k dispozici jako tabulka, kterou lze vybrat na stránce Přidat tabulky pro nový odkaz nebo na stránce Spravovat tabulky pro již existující odkaz.

Co se stane, když přidám sloupec?

Když přidáte nový sloupec do tabulky ve zdroji, přidá se také na konec souboru v cíli v příslušném oddílu souboru. I když řádky, které existovaly před přidáním sloupce, nový sloupec nezobrazí, nové nebo aktualizované řádky zobrazí nově přidaný sloupec.

Co se stane, když odstraním sloupec?

Když odstraníte sloupec z tabulky ve zdroji, sloupec nebude zrušen z cíle. Místo toho se řádky již neaktualizují a při zachování předchozích řádků jsou označeny jako null.

Co se stane, když změním datový typ sloupce?

Změna datového typu sloupce je zásadní změnou a budete ji muset odpojit a znovu propojit.

Co se stane, když odstraním řádek?

Odstranění řádku je zpracováno odlišně podle toho, které možnosti zápisu dat zvolíte:

  • Místní aktualizace: Toto je výchozí režim a při odstranění řádku tabulky v tomto režimu se řádek odstraní také z odpovídajícího datového oddílu v Azure Data Lake. Jinými slovy, data jsou z cíle pevně odstraněna.
  • Pouze připojit: V tomto režimu, když je odstraněn řádek tabulky Dataverse, není z cíle pevně odstraněn. Místo toho se přidá řádek a nastaví se jako isDeleted = True na soubor v odpovídajícím datovém oddílu v Azure Data Lake.

Co se stane, když přidám novou tabulku pro synchronizaci do datového jezera?

Je důležité si to uvědomit, že Azure Synapse Link for Dataverse současně zpracovává pevnou sadu tabulek pro počáteční synchronizaci v daném okamžiku. Když je do profilu přidána nová tabulka, pozastaví se přírůstková nebo delta synchronizace pro existující tabulky. Zatímco delta zprávy pro existující tabulky pokračují ve frontě, Azure Synapse Link nebude zpracovávat žádné zprávy z fronty delta, dokud nebude dokončena počáteční synchronizace pro nově přidanou tabulku. To platí, ať už vytvoříte nové propojené jezero, nový profil nebo přidáte tabulku k existujícímu profilu. U nových nebo stávajících profilů doporučujeme přidat k datovému jezeru ne více než 5 tabulek najednou. Přidání dalších tabulek proces synchronizace nezrychlí. Zatímco počáteční synchronizace pro nově přidané tabulky probíhá, budou všechny rozdílové změny v těchto tabulkách zařazeny do jedné fronty. Azure Synapse Link for Dataverse nezpracuje tyto změny delty, dokud nebude dokončena počáteční synchronizace pro všechny dříve přidané tabulky.

Jaké formáty data a času lze očekávat v exportovaných tabulkách Dataverse?

Existují tři formáty data a času, které lze očekávat v exportovaných tabulkách Dataverse.

Název sloupce Formát Příklad
SinkCreatedOn a SinkModifiedOn M/d/rrrr H:mm:ss tt 6/28/2021 4:34:35
CreatedOn rrrr-MM-dd'T'HH:mm:ss.sssssssXXX 2018-05-25T16:21:09.0000000+00:00
Všechny ostatní sloupce rrrr-MM-dd'T'HH:mm:ss'Z' 2021-06-25T16:21:12Z

Kdy mám použít roční nebo měsíční strategii rozdělení oddílů?

Pro tabulky Dataverse, kde je objem dat do jednoho roku vysoký, doporučujeme používat měsíční oddíly. Výsledkem budou menší soubory a lepší výkon. Navíc, pokud se řádky v tabulkách Dataverse často aktualizují, rozdělení na několik menších souborů pomáhá zlepšit výkon v případě scénářů aktualizace na místě.

Kdy mohu použít režim Pouze připojit pro historické zobrazení změn?

Možnost Pouze připojit je doporučená pro zápis dat tabulky Dataverse do jezera, zvláště když jsou objemy dat vysoké v oddílu s často se měnícími daty. Jedná se opět o běžně používanou a vysoce doporučenou možnost pro podnikové zákazníky. Dále se můžete rozhodnout použít tento režim pro scénáře, kde je záměrem postupně kontrolovat změny z Dataverse a zpracovat změny pro scénáře ETL, AI a ML. Režim Pouze připojit poskytuje historii změn namísto nejnovější změny nebo místní aktualizace a umožňuje několik časových řad ze scénářů AI, například predikce nebo prognózování analytiky na základě historických hodnot.

Které tabulky Dataverse nejsou podporovány pro export?

Žádná tabulka, která nemá povoleno sledování změn, nebude podporována kromě následujících systémových tabulek:

  • Attachment
  • Poznámka
  • Mapování řetězce
  • Kalendář

Které tabulky Dataverse ve výchozím nastavení používají Pouze připojit?

Všechny tabulky, které nemají pole createdOn, budou ve výchozím nastavení synchronizovány pomocí režimu Pouze připojit. To zahrnuje tabulky vztahů i tabulku ActivityParty.

Pro zajištění vysokého výkonu a nízké latence kromě zabránění výstupním poplatkům vyžaduje Synapse Link, aby byly všechny zdroje umístěny ve stejné oblasti. Pokud máte scénář napříč regiony, můžete:

  • Přesunout prostředky Azure do stejné oblasti jako prostředí.
  • Přesunout prostředí do stejné oblasti jako prostředky Azure kontaktováním zákaznické podpory společnosti Microsoft.
  • Umožnit Přístup ke čtení – Geo Redundant Storage (RA-GRS) v úložišti Azure Data Lake k replikaci dat Azure do blízké oblasti. Více informací: Přístup ke čtení dat v sekundární oblasti
  • Použít kanály Azure Synapse nebo Azure Data Factory ke kopírování dat z prostředků Azure v jedné oblasti do prostředků Azure v jiné.

Proč se mi zobrazuje chybová zpráva – nelze hromadně načíst, protože soubor je neúplný nebo jej nelze přečíst?

Data Dataverse se mohou průběžně měnit vytvářením, aktualizací a mazáním transakcí. Tato chyba je způsobena změnou základního souboru, když z něj čtete data. U tabulek s průběžnými změnami byste tedy měli změnit kanál spotřeby tak, aby ke spotřebě používal data snímku (rozdělené tabulky). Více informací: Vytvoření Azure Synapse Link for Dataverse s Azure Synapse Workspace