Ustvarjanje povezave Azure Synapse Link for Dataverse s storitvijo Azure Data Lake

Azure Synapse Link lahko uporabite za povezavo vaših podatkov Microsoft Dataverse z Azure Data Lake Storage Gen2, da omogočite različne scenarije analitike. V tem članku lahko preberete, kako se izvajajo naslednja opravila:

  1. Povežite svoje podatke Dataverse z vašim računom Azure Data Lake Storage Gen2 s storitvijo Azure Synapse Link.
  2. Upravljajte tabele Dataverse, vključene v Azure Synapse Link.
  3. Spremljajte svojo povezavo Azure Synapse Link.
  4. Prekinite povezavo s svojim Azure Synapse Link.
  5. Ponovno povežite svojo povezavo Azure Synapse Link.
  6. Oglejte si svoje podatke v storitvi Azure Data Lake in se seznanite z datotečno strukturo.

Opomba

Azure Synapse Link for Dataverse se je v preteklosti imenoval Izvoz v jezero podatkov. Storitev je bila preimenovana maja 2021 in bo še naprej izvažala podatke v Azure Data Lake in Azure Synapse Analytics.

Zahteve

  • Azure Data Lake Storage Gen2: imeti morate račun Azure Data Lake Storage Gen2 in vlogo dostopa Lastnik in Sodelujoči v shrambi zbirke dvojiških podatkov. Vaš račun za shranjevanje mora omogočiti Hierarhični imenski prostor, zato priporočamo, da je podvajanje nastavljeno na lastnosti **hrambe na dveh geografskih lokacijah z dostopom za branje (RA-GRS)**«)

Opomba

  • Račun za shrambo morate ustvariti pri istem najemniku Azure Active Directory (Azure AD), kot je vaš najemnik za Power Apps.
  • Račun za shrambo je treba ustvariti v isti regiji kot je okolje Power Apps, v katerem boste funkcijo uporabljali.
  • Imeti morate dostop do vloge Uporabnik z dovoljenjem za branje do skupine virov z računom za shranjevanje.
  • Za povezavo okolja z Azure Data Lake Storage Gen2, morate imeti Dataverse sistemski skrbnik varnostna vloga.
  • Izvoziti je mogoče samo tabele, ki imajo omogočeno sledenje spremembam.

Povezava okolja Dataverse s storitvijo Azure Data Lake Storage Gen2

  1. Prijavite se v Power Apps in izberite želeno okolje.

  2. V levem podoknu za krmarjenje izberite Podatki, Azure Synapse Link in nato v ukazni vrstici izberite + Nova povezava do jezera podatkov.

    Pomik v Power Apps.

  3. Izberite možnosti Naročnina, Skupina virov in Račun za shranjevanje. Prepričajte se, da račun za shranjevanje izpolnjuje zahteve, navedene v razdelku Predpogoji. Izberite Naprej.

    Opomba

    Kot del povezovanja okolja s podatkovnim jezerom odobrite Azure Synapse Link dostop do storitve do vašega računa za shranjevanje. Prepričajte se, da ste upoštevali zahteve za ustvarjanje in konfiguriranje računa za Azure Data Lake Storage ter dodelitev vloge lastnika v računu shrambe samemu sebi. Poleg tega podelite storitvi podatkovnih tokov Power Platform dostop do svojega računa shrambe. Več informacij: Samopostrežno pripravljanje podatkov s podatkovnimi toki

  4. Dodajte tabele, ki jih želite izvoziti, in nato izberite Shrani. Izvoziti je mogoče samo tabele, ki imajo omogočeno sledenje spremembam. Več informacij: Omogočanje sledenja spremembam.

    Izbira tabel za izvoz.

Sledite zgornjim korakom, da ustvarite povezavo iz enega okolja do več podatkovnih jezer Azure v svoji naročnini na Azure. Podobno lahko ustvarite povezavo iz več okolij do istega Azure Data Lake, vse znotraj istega najemnika.

Opomba

Podatki, izvoženi prek storitve Azure Synapse Link, so šifrirani v Azure Data Lake Storage Gen2. Poleg tega so tudi začasni podatki v shrambi zbirke dvojiških podatkov šifrirani, ko niso aktivni. Šifriranje v Azure Data Lake Storage Gen2 vam pomaga varovati vaše podatke, uveljaviti varnostne pravilnike v podjetju in izpolnjevati zahteve za skladnost s predpisi. Več informacij: Šifriranje neaktivnih podatkov Azure

Trenutno ne morete zagotoviti javnih IP-jev za storitev Azure Synapse Link for Dataverse, ki se lahko uporabljajo v nastavitvah požarnega zidu Azure Data Lake. Pravila javnega omrežja IP nimajo vpliva na zahteve, ki izvirajo iz iste regije Azure kot račun za shrambo. Storitve, razporejene v isti regiji kot račun za shrambo, uporabljajo zasebne naslove IP Azure za komunikacijo. Zato ne morete omejiti dostopa do določenih storitev Azure na podlagi njihovega obsega izhodnih javnih naslovov IP. Več informacij: Konfiguracija požarnih zidov Azure Storage in virtualnih omrežij

Upravljanje podatkov tabel v podatkovnem jezeru

Ko ste nastavili Azure Synapse Link, lahko izvožene tabele upravljate na enega od teh dveh načinov:

  • V območju Azure Synapse Link portala za izdelovalce Power Apps izberite Upravljanje tabel v ukazni vrstici, če želite dodati ali odstraniti eno ali več povezanih tabel.

  • V območju Tabele na portalu za ustvarjalce Power Apps izberite ... ob tabeli in nato izberite povezano podatkovno jezero, kamor želite izvoziti podatke tabele.

    Izbira tabele za izvoz.

Ko nastavite storitev Azure Synapse Link, lahko spremljate Azure Synapse Link pod zavihkom Tabele.

Azure Synapse Link spremljanje

  • Prikazal se bo seznam tabel, ki so del izbranih povezav Azure Synapse Link.
  • Stanje sinhronizacije bo prešlo skozi različne stopnje. NotStarted označuje, da tabela čaka na sinhronizacijo. Ko je začetna sinhronizacija tabele Dokončana, se bo pričela faza naknadne obdelave, kjer ne bo prišlo do postopnega posodabljanja. To lahko traja nekaj ur, odvisno od velikosti vaših podatkov. Ko se bodo začele postopne posodobitve, se bo datum zadnje sinhronizacije redno posodabljal.
  • The štetje stolpec prikazuje zapisane številske vrstice. Kdaj Samo dodaj je nastavljeno na št, to je skupno število zapisov. Kdaj Samo dodaj je nastavljeno na da, to je skupno število sprememb.
  • The Samo dodaj in Strategija razdelitve stolpci prikazujejo uporabo različnih naprednih konfiguracij.
  1. Izberite želeno povezavo Azure Synapse Link, da prekinete povezavo.

  2. Izberite Prekini povezavo podatkovnega jezera v ukazni vrstici.

  3. Če želite izbrisati oba datotečna sistema podatkovnega jezera, izberite Izbriši datotečni sistem podatkovnega jezera.

  4. Izberite Da in počakajte nekaj minut, da se vse povezave prekinejo in izbrišejo.

Če ste pri prekinitvi povezave izbrisali datotečni sistem, sledite zgornjim korakom, da znova povežete isto podatkovno jezero. Če pri prekinitvi povezave niste izbrisali datotečnega sistema, morate počistiti podatke za ponovno povezavo:

  1. Pojdite v storitev Azure Data Lake.

  2. Izbrišite vsebnik Dataverse.

  3. Pojdite v storitev Power Apps in ponovno povežite podatkovno jezero.

Prikaz podatkov v Azure Data Lake Storage Gen2

  1. Izberite želeno storitev Azure Synapse Link in izberite Pojdi v podatkovno jezero Azure na zgornji plošči.

  2. Razširite Datotečni sistemi, nato pa izberite dataverse-environmentName-organizationUniqueName.

Datoteka model.json vsebuje ime in različico ter seznam tabel, ki so bile izvožene v podatkovno jezero. Datoteka model.json vključuje tudi začetno stanje sinhronizacije in čas za dokončanje sinhronizacije.

Mapa, ki vključuje posnetke datotek, ločenih z vejico (oblika zapisa CSV), se prikaže za vsako tabelo, ki je izvožena v podatkovno jezero. Podatki tabele v podatkovnem jezeru.

Stalne posodobitve posnetkov

Podatki storitve Microsoft Dataverse se lahko stalno spreminjajo z ustvarjanjem zapisov, posodabljanjem in brisanjem. Posnetki zagotavljajo kopijo podatkov samo za branje, ki se posodablja v rednih intervalih, v tem primeru vsako uro. To zagotavlja, da lahko potrošnik analize podatkov kadar koli zanesljivo porabi podatke v jezeru.

Stalne posodobitve posnetkov.

Ko so tabele dodane pri začetnem izvozu, se podatki tabele zapišejo v datoteke table.csv v ustreznih mapah v podatkovnem jezeru. To je interval T1, kjer je ustvarjen posnetek datoteke samo za branje, poimenovane tabela‑T1.csv, na primer Račun-T1.csv ali Stik-T1.csv. Poleg tega je datoteka model.json posodobljena, da kaže na te datoteke posnetkov. Če odprete datoteko model.json, si lahko ogledate podrobnosti posnetka.

To je primer razdeljene datoteke Account.csv in mape posnetka v Data Lake.

Posnetek tabele računov.

Spremembe v storitvi Dataverse se nenehno potiskajo v ustrezne datoteke .csv z mehanizmom postopnega objavljanja. To je interval T2, kjer je posnet še en posnetek. tabela-T2.csv – na primer Računi-T2.csv ali Stiki-T2.csv (ob predpostavki, da so v tabeli spremembe) – in model.json sta posodobljeni na nova posnetka datotek. Vsaka nova oseba, ki si ogleda podatke posnetka od T2 naprej, je usmerjena v novejše datoteke posnetkov. Tako lahko oseba, ki si je ogledala izvirni posnetek, še naprej dela na starejših datotekah posnetka T1, osebe, ki si ogledajo novejše posnetke, pa lahko preberejo najnovejše posodobitve. To je uporabno pri scenarijih z daljšimi procesi izvajanja navzdol.

To je primer datoteke model.json, ki vedno kaže na najnovejšo datoteko posnetka računa s časovnim žigom.

Vzorčni posnetek datoteke model.json.

Kaj sledi?

Po uspešni uporabi storitve Azure Synapse Link for Dataverse si oglejte, kako lahko analizirate in uporabljate svoje podatke prek Središča za odkrivanje. Če želite dostopati do Središča za odkrivanje, odprite Power Apps > Azure Synapse Link. Izberite povezano storitev in nato izberite zavihek Središče za odkrivanje. Tukaj lahko najdete priporočena orodja in kurirano dokumentacijo, kar vam je v pomoč, da pridobite največ iz svojih podatkov. Središče za odkrivanje.

Glejte tudi

Analiza podatkov Dataverse v jezeru podatkov s Power BI

Uvoz podatkov Dataverse v jezero podatkov prek Azure Data Factory

Napredna konfiguracija Azure Synapse Link for Dataverse

Pogosta vprašanja o Azure Synapse Link

Opomba

Ali nam lahko poveste, kateri je vaš prednostni jezik za dokumentacijo? Izpolnite kratko anketo. (upoštevajte, da je v angleščini)

Z anketo boste porabili približno sedem minut. Ne zbiramo nobenih osebnih podatkov (izjava o zasebnosti).