Možnosti dodatne konfiguracije v Azure Synapse Link
Azure Synapse Link ponuja več načinov za pisanje in branje podatkov, ki ustrezajo različnim analitičnim scenarijem.
Opomba
Azure Synapse Link for Dataverse se je v preteklosti imenoval Izvoz v jezero podatkov. Storitev je bila preimenovana maja 2021 in bo še naprej izvažala podatke v Azure Data Lake in Azure Synapse Analytics.
Ta članek govori o naslednjih temah:
- Posodobitve na mestu v primerjavi z zapisovanjem samo za dodajanje.
- Uporabniško določeno particioniranje podatkov.
Posodobitve »Na mestu« v primerjavi s zapisovanjem »Samo priloži«
Med pisanjem podatkov tabele Dataverse v jezero podatkov Azure, ki temelji na vrednosti createdOn, ki je datum in čas, ko je bil zapis ustvarjen, lahko izbirate med dvema različnima nastavitvama. Te sta Posodobitev na mestu in Samo priloži.
Privzeta nastavitev (za tabele, kjer je createdOn na voljo) je posodobitev na mestu ali upsert (posodobitev ali vstavljanje) postopnih podatkov na cilju. Če je sprememba nova in ustrezna vrstica v jezeru ne obstaja, se v primeru ustvarjanja pregledajo ciljne datoteke in spremembe se vstavijo v ustrezno particijo datotek v jezeru. Če je sprememba posodobitev in v jezeru obstaja vrstica, se ustrezna datoteka v jezeru posodobi – in ne vstavi – s postopnimi podatki. Z drugimi besedami, privzeta nastavitev za vse spremembe CUD v tabelah Dataverse, kjer je na voljo createdOn, je opravljanje posodobitve na mestu v cilju, v jezeru podatkov Azure.
Privzeto vedenje posodobitve na mestu lahko preklopite z neobvezno nastavitvijo, imenovano Samo priloži. Namesto posodobitve na mestu v načinu Samo priloži so postopni podatki iz tabel Dataverse priloženi ustrezni datotečni particiji v jezeru. To je nastavitev na tabelo in je na voljo kot potrditveno polje pod možnostjo Napredno > Pokaži dodatne nastavitve konfiguracije. Za tabele Dataverse z vklopljeno možnostjo Samo priloži se vse spremembe CUD postopoma dodajo ustreznim ciljnim datotekam v jezeru. Ko izberete to možnost, je strategija particije privzeta Leto in ko so podatki zapisani v podatkovno jezero, so razdeljeni po letni osnovi. Samo dodaj je tudi privzeta nastavitev za Dataverse mize, ki jih nimajocreatedOn vrednost.
Spodnja tabela opisuje, kako se v jezeru ravna z vrsticami glede na dogodke CUD za vsako od možnosti zapisovanja podatkov.
| Dogodek | Posodobitev na mestu | Samo priloži |
|---|---|---|
| Ustvari | Vrstica je vstavljena v datoteko particije in temelji na vrednosti createdOn v vrstici. |
Vrstica se doda na konec particijske datoteke in temelji na vrednosti createdOn zapisa. |
| Posodabljanje | Če vrstica obstaja v datoteki particije, je zamenjana ali posodobljena s posodobljenimi podatki. Če ne obstaja, se vstavi v datoteko. | Vrstica je skupaj s posodobljeno različico dodana na konec datoteke particije. |
| Delete | Če vrstica obstaja v datoteki particije, je odstranjena iz datoteke. | Vrstica je dodana na konec datoteke particije s isDeleted column = True. |
Opomba
Za tabele Dataverse, kjer je omogočeno Samo priloži, brisanje vrstice v viru ne bo izbrisalo ali odstranilo vrstice v jezeru. Namesto tega je izbrisana vrstica priložena kot nova vrstica v jezeru in je stolpec isDeleted nastavljen na True.
Tukaj je nekaj več podrobnosti o tem, kdaj uporabiti katero koli od možnosti.
- Posodobitev na mestu : Ta možnost je privzeta nastavitev in je priporočljiva samo, če se želite povezati neposredno s podatki v jezeru in potrebujete trenutno stanje (ne zgodovine ali postopnih sprememb). Datoteka vsebuje celoten nabor podatkov in jo lahko uporabite prek storitve Power BI ali s kopiranjem celotnega nabora podatkov za prodajne lijake ETL (izvoz, prenos, nalaganje).
- Samo priloži: izberite to možnost, če se ne povezujete neposredno s podatki v jezeru in želite postopno kopirati podatke na drug cilj s pomočjo prodajnih lijakov ETL. Ta možnost vsebuje zgodovino sprememb, ki omogočajo scenarije UI in ML.
Izberete lahko možnost Pokaži dodatne nastavitve konfiguracije pod možnostjo Napredno v storitvi Azure Synapse Link for Dataverse, če želite prilagoditi strategijo particije podatkov in izbrati možnosti za zapisovanje v jezero podatkov Azure.

Particioniranje podatkov
Ko pišeš Dataverse tabelnih podatkov v shranjevanje podatkovnega jezera Azure Azure Synapse Link, so tabele razdeljene (namesto ene datoteke) v jezeru na podlagicreatedOn vrednost v vsaki vrstici v viru. Privzeta strategija particij je po mesecih, podatki pa se v podatkovnem jezeru Azure razdelijo mesečno.
Temelji na Dataverse obseg tabele in porazdelitev podatkov, lahko se odločite, da boste svoje podatke razdelili po letih. S to možnostjo, kdaj Dataverse podatki tabele so zapisani v podatkovno jezero Azure, bodo razdeljeni na letni ravni na podlagicreatedOn vrednost v vsaki vrstici v viru. Za mize brezcreatedOn stolpcu, se vrstice podatkov razdelijo v novo datoteko vsakih pet milijonov zapisov. To je nastavitev na tabelo in je na voljo kot potrditveno polje pod možnostjo Napredno > Pokaži dodatne nastavitve konfiguracije.
Več podrobnosti s primeri, kako se podatki ravnajo v jezeru z letno ali mesečno strategijo particije:

Glejte tudi
Azure Synapse Link for Dataverse
Opomba
Ali nam lahko poveste, kateri je vaš prednostni jezik za dokumentacijo? Izpolnite kratko anketo. (upoštevajte, da je v angleščini)
Z anketo boste porabili približno sedem minut. Ne zbiramo nobenih osebnih podatkov (izjava o zasebnosti).
Povratne informacije
Pošlji in prikaži povratne informacije za