Trasformare i dati Azure Synapse Link for Dataverse con Apache Spark

Puoi utilizzare Azure Synapse Link per collegare i i dati Microsoft Dataverse ad Azure Synapse Analytics per esplorare i dati e accelerare il tempo per ottenere informazioni dettagliate. Questo articolo descrive come trasformare i dati Dataverse utilizzando il motore Apache Spark disponibile nell'area di lavoro Synapse.

Nota

Azure Synapse Link for Microsoft Dataverse era precedentemente noto come Export to data lake. Il servizio è stato rinominato a partire da maggio 2021 e continuerà a esportare dati in Azure Data Lake nonché in Azure Synapse Analytics.

Prerequisiti

Questa sezione descrive i prerequisiti necessari per trasformare i dati Dataverse con Apache Spark dopo aver usato il servizio Azure Synapse Link for Dataverse.

  • Azure Synapse Link for Dataverse. Questa guida presuppone che tu abbia già esportato i dati da Dataverse usando Azure Synapse Link for Dataverse.

  • Accesso all'account di archiviazione. Devi disporre di uno dei seguenti ruoli per l'account di archiviazione: Lettore dati BLOB di archiviazione, Collaboratore dati BLOB di archiviazione e Proprietario dati BLOB di archiviazione.

  • Amministratore di Synapse. Devi disporre del ruolo Amministratore di Synapse in Synapse Studio.

Trasforma i tuoi dati con un notebook Apache Spark

  1. In Power Apps, seleziona il servizio Azure Synapse Link desiderato dall'elenco, quindi seleziona Vai ad Azure Synapse workspace.

    Accedere all'area di lavoro.

  2. Espandi Database, seleziona il contenitore Dataverse. Le tabelle esportate vengono visualizzate sotto la directory Tabelle nella barra laterale sinistra.

    Trovare tabelle in Synapse.

  3. Fai clic con il pulsante destro del mouse sulla tabella desiderata e seleziona Nuovo notebook > Carica su DataFrame.

    Carica su DataFrame.

  4. Collega il notebook a un pool Apache Spark selezionando un pool dal menu a discesa. Se non disponi di un pool Apache Spark, seleziona Gestisci pool per crearne uno.

    Collegare un pool Spark.

  5. Aggiungi celle di codice per trasformare i tuoi dati. Esegui le singole celle selezionando il pulsante di riproduzione a sinistra di ogni cella o esegui tutte le celle in successione selezionando Esegui tutto dalla barra in alto.

    Notebook Spark.

Vedi anche

Blog: Annuncio di Azure Synapse Link for Dataverse

Cos'è Apache Spark in Azure HDInsight

Nota

Puoi indicarci le tue preferenze di lingua per la documentazione? Partecipa a un breve sondaggio. (il sondaggio è in inglese)

Il sondaggio richiederà circa sette minuti. Non viene raccolto alcun dato personale (Informativa sulla privacy).