Uvažanje izvoženih podatkov storitve Dataverse s storitvijo Azure Data Factory

Po izvozu podatkov iz Microsoft Dataverse v Azure Data Lake Storage Gen2 z uporabo Azure Synapse Link for Dataverse lahko uporabite Azure Data Factory za ustvarjanje podatkovnih tokov, preoblikovanja podatkov in izvajanje analiz.

Opomba

Azure Synapse Link for Dataverse se je v preteklosti imenoval Izvoz v jezero podatkov. Storitev je bila preimenovana maja 2021 in bo še naprej izvažala podatke v Azure Data Lake in Azure Synapse Analytics.

V tem članku lahko preberete, kako se izvajajo naslednja opravila:

  1. Nastavitev računa za shrambo Data Lake Storage Gen2 s podatki storitve Dataverse kot vir v podatkovnem toku Data Factory.

  2. Pretvorite podatke Dataverse v storitvi Data Factory s podatkovnim tokom.

  3. Nastavitev računa za shrambo storitve Data Lake Storage Gen2 s podatki storitve Dataverse kot odtok v podatkovnem toku Data Factory.

  4. Zagon podatkovnih tokov z ustvarjanjem prodajnega lijaka.

Zahteve

V tem razdelku so opisane zahteve za uvoz izvoženih podatkov storitve Dataverse s storitvijo Data Factory.

  • Vloge v storitvi Azure. Uporabniški račun, ki se uporablja za prijavo v storitev Azure, mora imeti vlogo sodelavca ali lastnika oz. biti skrbnik naročnine na storitev Azure. Če si želite ogledati dovoljenja, ki jih imate v naročnini, pojdite na portal Azure, v zgornjem desnem kotu izberite svoje uporabniško ime ter ... in nato izberite Moja dovoljenja. Če imate dostop do več naročnin, izberite ustrezno. Za ustvarjanje in upravljanje podrejenih virov za storitev Data Factory na portalu Azure—vključno z nabori podatkov, povezanimi storitvami, prodajnimi lijaki, sprožilci in izvajanji integracij—morate imeti vlogo sodelavca v storitvi Data Factory na ravni skupine virov ali več.

  • Azure Synapse Link for Dataverse. Ta vodnik predvideva, da ste že izvozili podatke Dataverse prek Azure Synapse Link for Dataverse. V tem primeru se podatki tabele računov izvozijo v jezero podatkov.

  • Azure Data Factory. Ta vodnik predvideva, da ste že ustvarili tovarno podatkov v okviru iste naročnine in skupine virov kot račun za shranjevanje, ki vsebuje izvožene podatke Dataverse.

Nastavljanje računa za shrambo storitve Data Lake Storage Gen2 kot vir

  1. Odprite Azure Data Factory in izberite tovarno podatkov v okviru iste naročnine in skupine virov kot račun za shranjevanje, ki vsebuje vaše izvožene podatke Dataverse. Nato na domači strani izberite Ustvari podatkovni tok.

  2. Vklopite način Odpravljanje napak podatkovnega toka in izberite želeni čas za objavo. To lahko traja do 10 minut, vendar lahko nadaljujete z naslednjimi koraki.

    Način odpravljanja napak v podatkovnem toku.

  3. Izberite Dodaj vir.

    Dodajanje vira.

  4. V možnosti Nastavitve vira naredite naslednje:

    • Ime izhodnega toka: vnesite želeno ime.
    • Vrsta vira : Izberite V vrsti.
    • Vrsta nabora podatkov v vrstici : Izberite Skupni podatkovni model.
    • Povezana storitev: v spustnem meniju izberite račun za shrambo in nato povežite novo storitev tako, da navedete podrobnosti o naročnini in pustite vse privzete konfiguracije.
    • Vzorčenje: če želite uporabiti vse svoje podatke, izberite možnost Onemogoči.
  5. V možnosti Možnosti vira naredite naslednje:

    • Oblika metapodatkov: izberite Model.json.

    • Korenska lokacija: v prvo polje vnesite ime vsebnika (Vsebnik) ali Prebrskaj za ime vsebnika in izberite V redu.

    • Entiteta: vnesite ime tabele oz. kliknite Prebrskaj, da poiščete tabelo.

      Možnosti virov.

  6. Poglejte zavihek Predvidevanje, da preverite, ali je bila vaša shema uspešno uvožena. Če ne vidite nobenega stolpca, izberite Možnosti sheme in označite možnost Izpelji pomik vrste stolpcev. Konfigurirajte možnosti oblikovanja tako, da se ujemajo z naborom podatkov, nato izberite Uporabi.

  7. Podatke si lahko ogledate v zavihku Predogled podatkov, da zagotovite popolno in natančno ustvarjanje vira.

Pretvorba podatkov Dataverse

Po nastavitvi izvoženih podatkov Dataverse v račun Azure Data Lake Storage Gen2 na vir v podatkovnem toku Data Factory lahko podatke pretvorite na številne načine. Več informacij: Azure Data Factory

Sledite tem navodilom, da ustvarite uvrstitev za vsako vrstico po polju prihodek v tabeli računov.

  1. Izberite + v spodnjem desnem kotu prejšnje pretvorbe, nato pa poiščite in izberite Uvrstitev.

  2. Na zavihku Nastavitve uvrstitve naredite naslednje:

    • Ime izhodnega toka: vnesite želeno ime, na primer Rank1.

    • Dohodni tok: izberite želeno ime vira. V tem primeru se prikaže ime vira iz prejšnjega koraka.

    • Možnosti: možnosti pustite neoznačene.

    • Stolpec z uvrstitvami: vnesite ime ustvarjenega stolpca z uvrstitvami.

    • Pogoji za razvrščanje: izberite stolpec prihodki in razvrstite po Padajočem vrstnem redu.

      Konfiguriranje zavihka z nastavitvami razvrstitve

  3. Podatke si lahko ogledate v zavihku predogled podatkov, kjer boste našli novi stolpec revenueRank na skrajni desni.

Nastavitev računa za shranjevanje Data Lake Storage Gen2 kot odtoka

Na koncu morate nastaviti odtok za podatkovne podatke. Sledite tem navodilom, če želite pretvorjene podatke vstaviti v Data Lake kot ločeno besedilo.

  1. Izberite + v spodnjem desnem kotu prejšnje pretvorbe, nato pa poiščite in izberite Odtok.

  2. V zavihku Odtok naredite naslednje:

    • Ime izhodnega toka: vnesite želeno ime, npr. Odtok1.

    • Dohodni tok: izberite želeno ime vira. V tem primeru se prikaže ime vira iz prejšnjega koraka.

    • Vrsta odtoka: izberite DelimitedText.

    • Povezana storitev: izberite vsebnik za shrambo podatkov Data Lake Storage Gen2, ki vsebuje podatke, ki ste jih izvozili s pomočjo storitve Azure Synapse Link for Dataverse.

      Konfiguriranje zavihka »Odtok«

  3. V zavihku Nastavitve naredite naslednje:

    • Pot mape: v prvo polje vnesite ime vsebnika (Datotečni sistem) ali Prebrskaj za ime vsebnika in izberite V redu.

    • Možnost imena datoteke: izberite izhod v eno datoteko.

    • Izhod v eno datoteko: vnesite ime datoteke, na primer ADFOutput

    • Vse ostale privzete nastavitve pustite nespremenjene.

      Konfiguriranje zavihka z nastavitvami odtoka

  4. V zavihku Optimiziraj nastavite Možnost particije na Ena particija.

  5. Podatke si lahko ogledate v zavihku Predogled podatkov.

Zagon podatkovnih tokov

  1. V levem podoknu pod Tovarniški viri izberite + in nato Prodajni lijak.

    Ustvarjanje novega prodajnega lijaka.

  2. V razdelku Dejavnosti izberite Premakni in preoblikuj in nato povlecite Podatkovni tok v delovni prostor.

  3. Izberite Uporabite obstoječi podatkovni tok in izberite podatkovni tok, ki ste ga ustvarili v prejšnjih korakih.

  4. V ukazni vrstici izberite Iskanje napak.

  5. Naj podatkovni tok poteka, dokler se v spodnjem pogledu ne prikaže, da je zaključen. To lahko traja nekaj minut.

  6. Pojdite v končni ciljni vsebnik za shranjevanje in poiščite preoblikovano podatkovno datoteko tabele.

Glejte tudi

Konfigurirajte Azure Synapse Link for Dataverse z Azure Data Lake

Analiziranje podatkov storitve Dataverse v storitvi Azure Data Lake Storage Gen2 z aplikacijo Power BI

Opomba

Ali nam lahko poveste, kateri je vaš prednostni jezik za dokumentacijo? Izpolnite kratko anketo. (upoštevajte, da je v angleščini)

Z anketo boste porabili približno sedem minut. Ne zbiramo nobenih osebnih podatkov (izjava o zasebnosti).