Azure Synapse Link for Dataverse – Najčešća pitanja

Ovaj članak pruža informacije o najčešćim pitanjima o izvozu podataka Microsoft Dataverse tabele u Azure Synapse Analytics i Azure Data Lake.

Da li mogu ručno da izvršavam zadatke kao što su kreiranje, ažuriranje, brisanje ili postavljanje smernica za automatskodeljivanje datoteka sa podacima u povezanom Azure skladištu?

Datoteke sa podacima ne bi trebalo da menja klijent, a nijedna datoteka korisnika ne bi trebalo da bude smeštena u fascikle sa podacima.

Napomena

Da biste ispustili bajate i stagnirajuće podatke u jezeru sa podacima Azure Synapse Link bez razbijanja, razmislite o korišćenju funkcije Query i analizi postepenih ispravki

Kako mogu da pristupim relacijama između tabela?

Da biste pristupili odnosi "više-prema-više", relacija je dostupna kao tabela da biste izabrali sa stranice "Dodavanje tabela" za novu vezu i iz tabela "Upravljanje " za postojeću vezu.

Napomena

Sve odnosi podataka su podrazumevano u režimu samo za predjela kada su napisani u CSV formatu.

Azure Synapse Link je besplatna funkcija sa Dataverse. Korišćenje ne Azure Synapse Link for Dataverse naplaćuje dodatne troškove Dataverse. Međutim, razmotrite potencijalne troškove za Azure uslugu:

Šta se dešava kada dodam kolonu?

Kada dodate novu kolonu u tabelu u izvoru, ona se dodaje i na kraju datoteke na odredištu na odgovarajućoj particiji datoteka. Iako redovi koji su postojali pre dodavanja kolone nisu prikazani u novoj koloni, novi ili ažurirani redovi prikazuju novododate kolonu.

Šta se dešava kada izbrišem kolonu?

Kada izbrišete kolonu iz tabele u izvoru, kolona neće biti izbačena sa odredišta. Umesto toga, redovi se više ne ažuriraju i označavaju se kao nula uz očuvanje prethodnih redova.

Šta se dešava ako promenim tip podataka kolone?

Promena tipa podataka kolone je prelomna promena i potrebno je da raskinete vezu i ponovo povežete.

Šta se dešava kada izbrišem red?

Brisanje reda obrađuje se različito na osnovu izabranih opcija upisivanja podataka:

  • Ažuriranje na mestu sa CSV formatom: Ovo je podrazumevani režim. Kada izbrišete red tabele u ovom režimu, red se briše i sa odgovarajuće particije sa podacima u Azure jezeru sa podacima. Drugim rečima, podaci se teško brišu sa odredišta.
  • Dodaj samo sa CSV formatom i postepenom ispravkom fascikle: u ovom režimu, Dataverse kada se izbriše red tabele, on se ne briše sa odredišta. Umesto toga, red se dodaje i postavlja kao datoteka isDeleted=True na odgovarajućoj particiji sa podacima u Azure Data Lake.
  • Izvoz u Delta lake format: Azure Synapse Link izvršava meko brisanje podataka tokom sledećeg ciklusa sinhronizacije delte, nakon čega sledi tvrdo brisanje nakon 30 dana.

Zašto ne vidim zaglavlje kolone u izvezenoj datoteci?

Azure Synapse Link prati Model zajedničkih podataka da bi omogućio podatke i znači da se dele u aplikacijama i poslovnim procesima kao što Microsoft Power Apps su,, Power BI Dynamics 365 i Azure". U svakoj CDM fascikli, metapodaci poput zaglavlja kolone skladište se u model.json datoteke. Više informacija: Uobičajeni model podataka i Azure Data Lake Storage Gen2 | Microsoft Learn

Zašto se Model.json datoteke povećava ili menja za tipove podataka i ne čuva ono što je definisano Dataverse?

Model.json zadržava dužinu baze podataka za veličinu kolone. Dataverse ima koncept dužine baze podataka za svaku kolonu. Ako kreirate kolonu veličine 200, a kasnije je smanjite na 100, Dataverse i dalje ćete moći da budete prisutni u postojećim podacima Dataverse. To radi tako što drži DBLength do 200 i MaxLength 100. Ono što vidite Model.json je i DBLength ako to koristite za nizvodne procese nikada nećete obezbediti manji prostor za svoje kolone Dataverse .

Napomena

Polja tipa "Memo" su definisana varchar(max) kao podrazumevana maksimalna dužina od 9999.

Koji formati datuma i vremena mogu da se očekuju u izvezenim Dataverse tabelama?

Postoje tri formata datuma i vremena koje možete da očekujete u izvezenim Dataverse tabelama.

Naziv kolone Oblikovanje Tip podataka Primer
SinkCreatedOn i SinkModifiedOn M/d/yyyy H:mm:ss tt datetime 6/28/2021 4:34:35 PM
CreatedOn yyyy-MM-dd'T'HH:mm:ss.sssssssXXX datetimeOffset 2018-05-25T16:21:09.0000000+00:00
Sve ostale kolone yyyy-MM-dd'T'HH:mm:ss'Z' datetime 2021-06-25T16:21:12Z

Napomena

Tip podataka CreatedOn promenjen iz datetime datetimeOffset 07.29.2022. Otpustite i pročitajte tabelu da biste uredili format tipa podataka za tabelu kreiranu pre promene.

Možete odabrati različita ponašanja kolona za kolonu "Datum i vreme" Dataverse u kojoj se ažurira format tipa podataka. Još informacija: Ponašanje i formatiranje kolona Datum i vreme

Zašto vidim imena datoteka 1.csv 1_001.csv običnog datuma podeljenih imena datoteka za neke tabele Dataverse ?

Ovo ponašanje se očekuje kada odaberete režim izvoza samo za amort i imate tabele bez važeće kolone CreatedOn . Grudvice su organizovane u datoteke kao što 1.csv, 2.csv (koriste prilagođeno kreiranje particija zbog odsustva važećeg datuma kreiranja). Kada se bilo koja particija približi 95% MaxBlockPerBlobLimit-a, sistem automatski generiše novu datoteku – ilustrovanu ovde kao 1_001.csv.

Kada bi trebalo da koristim godišnju ili mesečnu strategiju podele?

Za Dataverse tabele u kojima je obim podataka velik u roku od godinu dana, preporučujemo vam upotrebu mesečnih particija. To rezultira manjim datotekama i boljim performansama. Pored toga, ako se redovi u tabelama Dataverse često ažuriraju, deljenje na više manjih datoteka pomaže da se poboljšaju performanse u slučaju scenarija ažuriranja na određenom mestu. Delta Lake je dostupan samo sa godišnjom particijom zbog svojih superiornih performansi u poređenju sa CSV formatom.

Šta je samo režim za amort i koja je razlika između režima ažuriranja samo za dodaj i na mestu?

Samo u režimu amortizovanja, postepeni podaci Dataverse iz tabela se pridodaju odgovarajućoj particiji datoteke u jezeru. Za više informacija:Napredne opcije konfiguracije u Azure Synapse Link

Kada da koristim režim samo za dodavanje za istorijski prikaz promena?

Režim „Samo dodaj“ je preporučena opcija za pisanje podataka Dataverse tabele u jezero, posebno kada je količina podataka velika u particiji sa podacima koji se često menjaju. Opet, ovo je često korišćena i toplo preporučena opcija za poslovne korisnike. Pored toga, ovaj režim možete da koristite za scenarije u kojima je namera postepeni pregled promena Dataverse i obraditi promene za ETL, AI i ML scenarije. Režim „Samo dodaj“ pruža istoriju promena, umesto najnovije promene ili ažuriranja na mestu, i omogućava nekoliko vremenskih serija iz AI scenarija, poput predviđanja ili analitike prognoziranja zasnovanu na istorijskim vrednostima.

Kako da preuzmem najautetniji red svakog zapisa i isključim izbrisane redove kada izvozim podatke samo u režimu za amort.

U režimu "Dodaj samo" trebalo bi da identifikujete najnoviju verziju zapisa sa istim ID-om koristeći, VersionNumber a zatim SinkModifiedOn da primenite isDeleted=0 najnoviju verziju.

Zašto vidim duplirane brojeve verzija kada izvozim podatke samo pomoću režima "Dodaj"?

Samo za dodaj režim, Azure Synapse Link for Dataverse ako ne dobije potvrdu iz Azure jezera podataka da su podaci počinjeni iz bilo kog razloga kao što su kašnjenja u mreži, ponovo Azure Synapse Link će pokušati u tim scenarijima i ponovo izvršiti podatke. Potrošnja nizvodno treba da bude otporna na ovaj scenario filtriranjem podataka pomoću SinkModifiedOn.

Zašto vidim razlike u kolumnama Sinkmodifiedon i Modifiedon?

To je očekivano. Modifiedon je datum kada se zapis menja Dataverse u; Sinkmodifiedon je datum i vreme koje zapis menja u jezeru sa podacima.

Koje Dataverse tabele nisu podržane za izvoz?

Pored sledećih sistemskih tabela, nije podržana nijedna tabela koja nema omogućeno praćenje promena:

  • Prilog
  • Kalendar
  • Calendarrule

Napomena

Tabelu nadzora možete dodati za izvoz pomoću Azure Synapse Link for Dataverse. Međutim, izvoz revizorske tabele podržan je samo profilima Delta Lejka.

Koristim izvoz u delta lake funkciju, mogu li da zaustavim posao ili Apache Spark promenim vreme izvršenja?

Posao konverzije Delta jezera se pokreće kada je došlo do promene podataka u konfigurisanom vremenskom intervalu. Ne postoji opcija zaustavljanja ili pauziranja Apache Spark bazena. Međutim, vremenski interval možete izmeniti nakon kreiranja veze u okviru stavke Upravljanje tabelama > "Više opcija vremena".

Kolone za pronalaženje se satiju od ID-a i vrednosti. Vrednosti za pronalaženje se menjaju samo u osnovnoj tabeli. Da biste bolje odražavali vrednost kolone za pronalaženje, preporučujemo da se udružite sa originalnom osnovnom tabelom da biste dobili najnoviju vrednost.

U Dataverse kolonama izračunate kolone čuvaju samo informacije o formuli, a prava vrednost zavisi od kolone osnovne tabele. Tako da su izračunate kolone podržane samo kada se sve kolone nalaze u istoj izvezenoj tabeli.

Koje Dataverse tabele podrazumevano koriste samo režim "Dodaj samo"?

Sve tabele koje nemaju kreiranoOn polje se podrazumevano sinhronizuju samo pomoću režima dodavanja. To uključuje tabele relacija i tabelu "ActivityParty".

Zašto vidim poruku o grešci - Sadržaj direktorijuma na putanji ne može biti naveden?

  • Dataverse podaci se skladište u povezanom kontejneru za skladištenje. Potrebna vam je uloga "Storage Blob Data saradnik" u povezanom nalogu skladišta da biste izvršavali operacije čitanja i upita preko sinapse radnog prostora.
  • Ako odaberete da izvezete podatke sa Delta Lake formatom, vaša CSV datoteka se čisti nakon konverzije Delta jezera. Potrebno je da izvršite upit nad podacima non_partitioned tabele kroz sinapsu radnog prostora.

Zašto vidim poruku o grešci - nije moguće učitati masovnu učitavanje zato što je datoteka nepotpuna ili nije mogla biti pročitana (samo CSV datoteka)?

Dataverse podaci se mogu neprestano menjati kroz kreiranje, ažuriranje i brisanje transakcija. Do ove greške dolazi usled promene osnovne datoteke prilikom čitanja podataka iz nje. Dakle, za tabele sa neprekidnim promenama promenite protrošakni cevovod da biste koristili podatke snimka (podeljene tabele) za korišćenje. Više informacija:Rešavanje problema sa SQL bazenom bez servera

Azure Synapse Link for Dataverse je dizajniran u analitičke svrhe. Preporučujemo klijentima da koriste dugoročno zadržavanje u svrhe arhiviranja. Više informacija:pregled Dataverse dugoročnog zadržavanja podataka

Zašto ne vidim promene podataka u jezeru sa podacima kada su zapisi izbrisani Dataverse?

Da bi bilo koji direktan SQL poziv uklonio zapis Azure Synapse Link for Dataverse , usluga se ne pokreće zato što BPO. Brisanje se ne poziva. Za probnu funkciju idite na " Kako očistiti nasleđeni pristup".