Transformar datos de Azure Synapse Link for Dataverse con Apache Spark

Podes usar o Azure Synapse Link para conectar o teu Microsoft Dataverse datos a Azure Synapse Analytics para explorar os teus datos e acelerar o tempo para obter información. Este artigo móstralle como transformar os seus datos de Dataverse usando o motor Apache Spark dispoñible no seu espazo de traballo de Synapse.

Nota

Azure Synapse Link for Microsoft Dataverse antigamente coñecíase como Exportar a lago de datos. O servizo cambiou o nome a partir de maio de 2021 e seguirá exportando datos a Azure Data Lake Azure Synapse Analytics.

Requisitos previos

Esta sección describe os requisitos previos necesarios para transformar datos de Dataverse con Apache Spark despois de usar o servizo Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Esta guía supón que xa exportou datos de Dataverse empregando Azure Synapse Link for Dataverse.

  • Acceso á conta de almacenamento. Débeselle conceder un dos seguintes roles para a conta de almaenamento: lector de datos do BLOB de almacenamento, colaborador dos datos do BLOB de almacenamento ou propietario dos datos do BLOB de almacenamento.

  • Administrador de Synapse. Ten que ter concedido o acceso de rol de Administrador de Synapse dentro do estudo Synapse.

Transforme os seus datos cun portátil Apache Spark

  1. En Power Apps, seleccione o Azure Synapse Link desexado na lista e logo seleccione Ir a espazo de traballo de Azure Synapse.

    Ir á área de traballo.

  2. Expanda Bases de datos, seleccione o seu contedor de Dataverse. As táboas exportadas móstranse baixo o directorio Táboas na barra lateral esquerda.

    Buscar táboas en Synapse.

  3. Faga clic co botón dereito do rato na táboa desexada e seleccione Novo caderno > Cargar en DataFrame.

    Cargar en DataFrame.

  4. Anexe o caderno a un grupo Apache Spark seleccionando un grupo no menú despregable. Se non ten un grupo Apache Spark, seleccione Xestionar grupos para crear un.

    Engadir grupo de Spark.

  5. Engada celas de código para transformar os seus datos. Execute celas individuais seleccionando o botón de reprodución á esquerda de cada cela ou execute todas as celas sucesivamente seleccionando Executar todo desde a barra superior.

    Caderno de Spark.

Consulte tamén

Blog: Anunciar Azure Synapse Link for Dataverse

Que é Apache Spark en Azure HDInsight

Nota

Pode indicarnos as súas preferencias para o idioma da documentación? Realice unha enquisa breve. (teña en conta que esa enquisa está en inglés)

Esta enquisa durará sete minutos aproximadamente. Non se recompilarán datos persoais (declaración de privacidade).