Transforma les dades Azure Synapse Link for Dataverse amb Apache Spark

Nota

Vigent a partir del novembre de 2020:

  • S’ha canviat el nom del Common Data Service per Microsoft Dataverse. Més informació
  • S’han actualitzat alguns termes del Microsoft Dataverse. Per exemple, ara entitat s’anomena taula, i el camp ha passat a anomenar-se columna. Més informació

Aquest article s’actualitzarà pròximament per reflectir la terminologia més recent.

Podeu utilitzar el Azure Synapse Link per connectar les dades Microsoft Dataverse a Azure Synapse Analytics per explorar les vostres dades i accelerar el temps per obtenir informació. En aquest article es mostra com transformar les vostres dades Dataverse mitjançant el motor Apache Spark disponible al vostre espai de treball Synapse.

Nota

Azure Synapse Link for Microsoft Dataverse abans es coneixia com a Export to data lake. El servei va ser reanomenat efectiu el maig de 2021 i continuarà exportant dades a l'Azure Data Lake, així com a Azure Synapse Analytics.

Requisits previs

Aquesta secció descriu els requisits previs necessaris per transformar Dataverse dades amb Apache Spark després d'utilitzar el servei Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Aquesta guia assumeix que ja heu exportat dades de Dataverse mitjançant l'Azure Synapse Link for Dataverse.

  • Accés al compte d'emmagatzematge. Heu de tenir una de les següents funcions per al compte d'emmagatzematge: lector de dades de Blob d'emmagatzematge, col·laborador de dades de Blob d'emmagatzematge o propietari de dades de Blob d'emmagatzematge.

  • Administrador de Synapse. Heu de concedir-vos l'accés de la funció Administrador de Synapse a Synapse Studio.

Transformar les dades amb una llibreta de l'Apache Spark.

  1. Al Power Apps, seleccioneu la Azure Synapse Link desitjada de la llista i, a continuació, seleccioneu Vés a Azure Synapse'espai de treball.

    Anar a l'àrea de treball.

  2. Expandeix les bases de dades, seleccioneu el contenidor Dataverse. Les taules exportades es mostren al directori Taules a la barra lateral esquerra.

    Cercar taules al Synapse.

  3. Feu clic amb el botó dret del ratolí a la taula desitjada i seleccioneu Nova llibreta > Carrega al DataFrame.

    Càrrega al DataFrame

  4. Per adjuntar la llibreta a un conjunt de l'Apache Spark, seleccioneu un conjunt del menú desplegable. Si no teniu cap conjunt de l'Apache Spark, seleccioneu Administra els conjunts per crear-ne un.

    Adjuntar el conjunt de l'Spark.

  5. Afegiu cel·les de codi per transformar les dades. Executeu les cel·les individualment seleccionant el botó de reproducció de l'esquerra a cada cel·la o executant totes les cel·les en ordre seleccionant Executa tots a la barra superior.

    Llibreta de l'Spark

Consulteu també

Blog: Anunci de Azure Synapse Link for Dataverse

Què és Apache Spark a Azure HDInsight