Trasformare i dati in data.world (anteprima) usando Azure Data Factory o Synapse Analytics

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi completa per le aziende. Microsoft Fabric copre tutti gli elementi, dallo spostamento dei dati all'analisi scientifica dei dati, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Scopri come avviare gratuitamente una nuova versione di valutazione .

Questo articolo illustra come usare Flusso di dati per trasformare i dati in data.world (anteprima). Per altre informazioni, vedere l'articolo introduttivo per Azure Data Factory o Azure Synapse Analytics.

Importante

Questo connettore è attualmente disponibile in anteprima. È possibile provarlo e inviare commenti e suggerimenti. Se si vuole accettare una dipendenza dai connettori in versione di anteprima nella propria soluzione, contattare il supporto tecnico di Azure.

Funzionalità supportate

Questo connettore data.world è supportato per le funzionalità seguenti:

Funzionalità supportate IR
Flusso di dati di mapping (origine/-)

(1) Runtime di integrazione di Azure (2) Runtime di integrazione self-hosted

Per un elenco degli archivi dati supportati come origini/sink, vedere la tabella Archivi dati supportati.

Creare un servizio collegato data.world usando l'interfaccia utente

Usare la procedura seguente per creare un servizio collegato data.world nell'interfaccia utente di portale di Azure.

  1. Passare alla scheda Gestisci nell'area di lavoro di Azure Data Factory o Synapse e selezionare Servizi collegati, quindi selezionare Nuovo:

  2. Cercare data.world (anteprima) e selezionare il connettore data.world (anteprima).

    Screenshot showing selecting data.world connector.

  3. Configurare i dettagli del servizio, testare la connessione e creare il nuovo servizio collegato.

    Screenshot of configuration for data.world linked service.

Dettagli di configurazione di Connessione or

Le sezioni seguenti forniscono informazioni sulle proprietà usate per definire entità della pipeline di Data Factory e Synapse specifiche per data.world.

Proprietà del servizio collegato

Per il servizio collegato data.world sono supportate le proprietà seguenti:

Proprietà Descrizione Richiesto
Tipo La proprietà type deve essere impostata su Dataworld.
apiToken Specificare un token API per il data.world. Contrassegnare questo campo come SecureString per archiviarlo in modo sicuro. In alternativa, fare riferimento a un segreto archiviato in Azure Key Vault.

Esempio:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Proprietà del flusso di dati per mapping

Quando si trasformano i dati nel flusso di dati di mapping, è possibile leggere le tabelle da data.world. Per altre informazioni, vedere trasformazione dell'origine nei flussi di dati di mapping. È possibile usare un set di dati inline solo come tipo di origine.

Trasformazione origine

Nella tabella seguente sono elencate le proprietà supportate da data.world'origine. È possibile modificare queste proprietà nella scheda Opzioni origine.

Name Descrizione Richiesto Valori consentiti Proprietà script flusso di dati
Nome del set di dati ID del set di dati in data.world. Stringa datasetId
Nome tabella ID della tabella all'interno del set di dati in data.world. No (se query specificato) Stringa tableId
Query Immettere una query SQL per recuperare i dati da data.world. Un esempio è select * from MyTable. No (se tableId specificato) Stringa query
Proprietario Proprietario del set di dati in data.world. Stringa owner

Esempio di script di origine data.world

Quando si usa data.world come tipo di origine, lo script del flusso di dati associato è:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Per un elenco degli archivi dati supportati come origini e sink dall'attività di copia, vedere Archivi dati supportati.