Servizi collegati in Azure Data Factory e Azure Synapse Analytics

Articolo
10/26/2023

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi completa per le aziende. Microsoft Fabric copre tutti gli elementi, dallo spostamento dei dati all'analisi scientifica dei dati, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Scopri come avviare gratuitamente una nuova versione di valutazione .

Questo articolo descrive quali servizi collegati sono, come vengono definiti in formato JSON e come vengono usati in Azure Data Factory e Azure Synapse Analytics.

Per altre informazioni, vedere l'articolo introduttivo per Azure Data Factory o Azure Synapse.

Panoramica

Azure Data Factory e Azure Synapse Analytics possono avere una o più pipeline. Una pipeline è un raggruppamento logico di attività che insieme eseguono un compito. Le attività in una pipeline definiscono le azioni da eseguire sui dati. Ad esempio, è possibile usare un'attività di copia per copiare dati da SQL Server ad Archiviazione BLOB di Azure. Quindi, si può usare un'attività Hive che esegue uno script Hive in un cluster HDInsight di Azure per elaborare i dati dall'archiviazione BLOB per produrre dati di output. Infine, è possibile usare una seconda attività di copia per copiare i dati di output in Azure Synapse Analytics per la compilazione delle soluzioni di report di business intelligence (BI). Per altre informazioni su pipeline e attività, vedere Pipeline e attività.

A questo punto, un set di dati è una visualizzazione denominata dei dati che punta o fa riferimento ai dati da usare nelle attività come input e output.

Prima di creare un set di dati, è necessario creare un servizio collegato per collegare l'archivio dati all'area di lavoro di Data Factory o Synapse. I servizi collegati sono molto simili a stringa di connessione, che definiscono le informazioni di connessione necessarie per la connessione del servizio alle risorse esterne. Si consideri così: il set di dati rappresenta la struttura dei dati all'interno degli archivi dati collegati e il servizio collegato definisce la connessione all'origine dati. Ad esempio, un servizio collegato Archiviazione di Azure collega un account di archiviazione al servizio. Un set di dati BLOB di Azure rappresenta il contenitore BLOB e la cartella all'interno dell'account di Archiviazione di Azure che contiene i BLOB di input da elaborare.

Di seguito è riportato uno scenario di esempio. Per copiare dati dall'archivio BLOB a un database SQL, creare due servizi collegati: Archiviazione di Azure e database SQL di Azure. Quindi, si creano due set di dati: un set di dati BLOB di Azure, che si riferisce al servizio collegato Archiviazione di Azure, e un set di dati della tabella SQL di Azure, che si riferisce al servizio collegato Database SQL di Azure. I servizi collegati Archiviazione di Azure e database SQL di Azure contengono stringa di connessione usati dal servizio in fase di esecuzione per connettersi al Archiviazione di Azure e database SQL di Azure rispettivamente. Il set di dati BLOB di Azure specifica il contenitore e una cartella BLOB che contengono i BLOB di input presenti nell'archiviazione BLOB di Azure. Il set di dati della tabella SQL di Azure specifica la tabella SQL del database SQL in cui verranno copiati i dati.

Il diagramma seguente illustra le relazioni tra pipeline, attività, set di dati e servizio collegato nel servizio:

Relationship between pipeline, activity, dataset, linked services

Servizio collegato con l'interfaccia utente

Azure Data Factory
Synapse Analytics

Per creare un nuovo servizio collegato in Azure Data Factory Studio, selezionare la scheda Gestisci e quindi i servizi collegati, in cui è possibile visualizzare tutti i servizi collegati esistenti definiti. Selezionare Nuovo per creare un nuovo servizio collegato.

Shows the Azure Data Factory studio Manage tab with linked services and the New button highlighted.

Dopo aver selezionato Nuovo per creare un nuovo servizio collegato, sarà possibile scegliere uno dei connettori supportati e configurarne i dettagli di conseguenza. Successivamente, è possibile usare il servizio collegato in qualsiasi pipeline creata.

Shows the new linked service window.

JSON servizio collegato

Un servizio collegato viene definito in formato JSON come segue:

{
    "name": "<Name of the linked service>",
    "properties": {
        "type": "<Type of the linked service>",
        "typeProperties": {
              "<data store or compute-specific type properties>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

La tabella seguente descrive le proprietà nel codice JSON precedente:

Proprietà	Descrizione	Richiesto
name	Nome del servizio collegato. Vedere Regole di denominazione.	Sì
Tipo	Tipo di servizio collegato. Ad esempio: AzureBlob Archiviazione (archivio dati) o AzureBatch (calcolo). Vedere la descrizione di typeProperties.	Sì
typeProperties	Le proprietà del tipo sono diverse per ogni archivio dati o calcolo. Per i tipi di archivio dati supportati e le relative proprietà dei tipi, vedere l'articolo panoramica del connettore. Vedere l'articolo sul connettore dell'archivio dati per informazioni sulle proprietà del tipo specifiche di un archivio dati. Per i tipi di calcolo supportati e le relative proprietà del tipo, vedere Servizi collegati di calcolo.	Sì
connectVia	Il runtime di integrazione da usare per la connessione all'archivio dati. È possibile usare il runtime di integrazione di Azure o il runtime di integrazione self-hosted (se l'archivio dati si trova in una rete privata). Se non specificato, viene usato il runtime di integrazione di Azure predefinito.	No

Esempio di servizio collegato

Il servizio collegato seguente è un servizio collegato di Archiviazione BLOB di Azure. Si noti che il tipo è impostato su Archiviazione BLOB di Azure. Le proprietà del tipo per il servizio collegato Archiviazione BLOB di Azure includono un stringa di connessione. Il servizio usa questo stringa di connessione per connettersi all'archivio dati in fase di esecuzione.

{
    "name": "AzureBlobStorageLinkedService",
    "properties": {
        "type": "AzureBlobStorage",
        "typeProperties": {
            "connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Creare servizi collegati

I servizi collegati possono essere creati nell'esperienza utente di Azure Data Factory tramite l'hub di gestione e qualsiasi attività, set di dati o flussi di dati che vi fanno riferimento.

È possibile creare servizi collegati usando uno di questi strumenti o SDK: API .NET, PowerShell, API REST, modello di Azure Resource Manager e portale di Azure.

Quando si crea un servizio collegato, l'utente deve disporre dell'autorizzazione appropriata per il servizio designato. Se non viene concesso un accesso sufficiente, l'utente non sarà in grado di visualizzare le risorse disponibili e dovrà usare l'opzione di immissione manuale.

Servizi collegati dell'archivio dati

È possibile trovare l'elenco degli archivi dati supportati nell'articolo panoramica del connettore. Fare clic su un archivio dati per informazioni sulle proprietà di connessione supportate.

Servizi collegati di calcolo

Fare riferimento agli ambienti di calcolo supportati per informazioni dettagliate sui diversi ambienti di calcolo a cui è possibile connettersi dal servizio, nonché sulle diverse configurazioni.

Informazioni su come usare le credenziali da un'identità gestita assegnata dall'utente in un servizio collegato.

Vedere le esercitazioni seguenti per istruzioni dettagliate sulla creazione di pipeline e set di dati tramite uno di questi strumenti o SDK.