Incorporar dades del Dataverse amb l’Azure Data Factory
Nota
Vigent a partir del novembre de 2020:
- S’ha canviat el nom del Common Data Service per Microsoft Dataverse. Més informació
- S’han actualitzat alguns termes del Microsoft Dataverse. Per exemple, ara entitat s’anomena taula, i el camp ha passat a anomenar-se columna. Més informació
Aquest article s’actualitzarà pròximament per reflectir la terminologia més recent.
Després d'exportar les dades del Microsoft Dataverse a l'Azure Data Lake Storage Gen2 amb l'Azure Synapse Link for Dataverse, podeu utilitzar l'Azure Data Factory per crear fluxos de dades, transformar les vostres dades i executar anàlisis.
Nota
L'Azure Synapse Link for Dataverse era conegut anteriorment com a Exportació al Data Lake. El servei va canviar de nom al maig del 2021 i continuarà exportant dades a l'Azure Data Lake, així com a l'Azure Synapse Analytics.
Aquest article mostra com realitzar les següents tasques:
Definir el compte d'emmagatzematge del Data Lake Storage Gen2 amb les dades del Dataverse com a origen en un flux de dades del Data Factory.
Transformar les dades del Dataverse a Data Factory amb un flux de dades.
Definir el compte d'emmagatzematge del Data Lake Storage Gen2 amb les dades del Dataverse com a recepció en un flux de dades del Data Factory.
Executar el vostre flux de dades creant un pipeline.
Requisits previs
En aquesta secció es descriuen els requisits previs necessaris per ingerir dades exportades del Dataverse amb el Data Factory.
Funcions de l'Azure. El compte d'usuari que s'utilitza per iniciar la sessió a l'Azure ha de ser un membre de la funció col·laborador o propietari o un administrador de la subscripció de l'Azure. Per visualitzar els permisos que teniu a la subscripció, aneu al Portal de l'Azure, seleccioneu el nom d'usuari a la cantonada superior dreta, seleccioneu ... i, a continuació, seleccioneu Els meus permisos. Si teniu accés a diverses subscripcions, seleccioneu-ne l'adequada. Per crear i administrar els recursos secundaris per al Data Factory al portal de l'Azure, incloent-hi conjunts de dades, serveis enllaçats, pipelines, activadors i temps d'execució d'integració, heu de pertànyer a la funció Col·laborador del Data Factory al nivell de grup de recursos o superior.
Azure Synapse Link for Dataverse. Aquesta guia assumeix que ja heu exportat les dades del Dataverse utilitzant l'Azure Synapse Link for Dataverse. En aquest exemple, les dades de la taula de comptes s'exporten al Data Lake.
Azure Data Factory. En aquesta guia se suposa que ja heu creat una fàbrica de dades sota el mateix grup de subscripció i recursos que el compte d'emmagatzematge que conté les dades del Dataverse exportades.
Definir el compte d'emmagatzematge del Data Lake Storage Gen2 com a origen
Obriu la Fàbrica de dades de l'Azure i seleccioneu la fàbrica de dades que hi ha al mateix grup de subscripció i recursos que el compte d'emmagatzematge que conté les dades del Dataverse exportades. A continuació, seleccioneu Crea un flux de dades a la pàgina inicial.
Activeu el mode Depuració de flux de dades i seleccioneu l'hora preferida per activar-la. Això pot tardar fins a 10 minuts, però podeu continuar en els passos següents.

Seleccioneu Afegeix una font.

A Configuració de la font, feu el següent:
- Nom del flux de sortida: introduïu el nom que vulgueu.
- Tipus de font: seleccioneu Common Data Model.
- Servei enllaçat: seleccioneu el compte d'emmagatzematge al menú desplegable i, a continuació, enllaceu un servei nou proporcionant els detalls de la subscripció i deixeu totes les configuracions per defecte.
- Mostra: si voleu utilitzar totes les dades, seleccioneu Inhabilita.
A Opcions de la font, feu el següent:
Format de metadades: seleccioneu Model.json.
Ubicació arrel: introduïu el nom del contenidor al primer quadre (Contenidor) o feu una Cerca del nom del contenidor i seleccioneu D'acord.
Entitat: introduïu el nom de la taula o Navegueu a la taula.

Consulteu la pestanya Previsió per assegurar-vos que el vostre esquema s'hagi importat correctament. Si no veieu cap columna, seleccioneu Opcions d'esquema i comproveu que l'opció Infereix tipus de columnes difuminades. Configureu les opcions de format per fer coincidir el conjunt de dades i seleccioneu Aplica.
Podeu visualitzar les dades a la pestanya Visualització prèvia de dades per assegurar-vos que la creació de Font s'ha completat i és exacta.
Transformar les dades del Dataverse
Després d'establir les dades del Dataverse exportades al compte de l'Azure Data Lake Storage Gen2 com a font en el flux de dades del Data Factory, hi ha moltes possibilitats per transformar les vostres dades. Més informació: Azure Data Factory
Seguiu aquestes instruccions per crear una classificació per a cada fila pel camp ingressos de la taula del compte.
Seleccioneu + a la part inferior dreta de la transformació anterior i, a continuació, cerqueu i seleccioneu Classificació.
A la pestanya Configuració de classificació, feu el següent:
Nom de la seqüència de sortida: introduïu el nom que vulgueu, com ara Classificació1.
Flux d'entrada: seleccioneu el nom de la font que vulgueu. En aquest cas, el nom d'origen del pas anterior.
Opcions : deixeu les opcions desmarcades.
Columna de classificació: introduïu el nom de la columna de classificació generada.
Condicions d'ordenació: seleccioneu la columna ingressos i ordeneu per ordre Descendent.
Podeu visualitzar les dades a la pestanya de visualització prèvia de dades on trobareu la nova columna revenueRank a la posició més cap a la dreta.
Definir el compte d'emmagatzematge de l'Emmagatzematge de dades de Data Lake Gen2 com a enfonsat
En última instància, heu de definir una recepció per al vostre flux de dades. Seguiu aquestes instruccions per col·locar les dades transformades com a fitxer de text delimitat al Data Lake.
Seleccioneu + a la part inferior dreta de la transformació anterior i, a continuació, cerqueu i seleccioneu Enfonsa.
A la pestanya Recepció, feu el següent:
Nom del flux de sortida: introduïu el nom que vulgueu, com ara Recepció1.
Flux d'entrada: seleccioneu el nom de la font que vulgueu. En aquest cas, el nom d'origen del pas anterior.
Tipus d'enfonsament: seleccioneu Text delimitat.
Servei enllaçat: seleccioneu el vostre contenidor d'emmagatzematge del Data Lake Storage Gen2 que té les dades que heu exportat utilitzant el servei de l'Azure Synapse Link for Dataverse.
A la pestanya Configuració, feu el següent:
Camí de la carpeta: introduïu el nom del contenidor al primer quadre (Sistema de fitxers) o feu una Cerca del nom del contenidor i seleccioneu D'acord.
Opció de nom de fitxer: seleccioneu sortida en un fitxer.
Sortida en un únic fitxer: introduïu un nom de fitxer, com ara ADFOutput.
Deixeu la resta de configuracions per defecte.
A la pestanya Optimitza, definiu Opció de partició en Una sola partició.
Podeu veure les vostres dades a la pestanya Visualització prèvia de les dades.
Executar el flux de dades
A la subfinestra esquerra, a Recursos de fàbrica, seleccioneu + i, a continuació, feu clic a Pipeline.

A Activitats, seleccioneu Desplaça i transforma i, a continuació, arrossegueu Flux de dades a l'àrea de treball.
Seleccioneu Utilitza un flux de dades existent i seleccioneu el flux de dades que heu creat en els passos anteriors.
A la barra d'ordres, seleccioneu Depura.
Deixeu que s'executi el flux de dades fins que la visualització inferior mostri que s'ha completat. Això pot tardar uns minuts.
Aneu al contenidor d'emmagatzematge de destinació final i cerqueu el fitxer de dades de la taula transformada.
Consulteu també
Configurar l'Azure Synapse Link for Dataverse amb l'Azure Data Lake
Analitzar les dades del Dataverse a l'Azure Data Lake Storage Gen2 amb el Power BI