Kopiera data från Greenplum med Azure Data Factory eller Synapse Analytics

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Den här artikeln beskriver hur du använder kopieringsaktiviteten i en Azure Data Factory eller Synapse Analytics-pipeline för att kopiera data från Greenplum. Den bygger på översiktsartikeln om kopieringsaktivitet som visar en allmän översikt över kopieringsaktiviteten.

Funktioner som stöds

Den här Greenplum-anslutningsappen stöds för följande aktiviteter:

Du kan kopiera data från Greenplum till val annat datalager för mottagare som stöds. En lista över datalager som stöds som källor/mottagare av kopieringsaktiviteten finns i tabellen Datalager som stöds.

Tjänsten tillhandahåller en inbyggd drivrutin för att aktivera anslutning, och därför behöver du inte installera någon drivrutin manuellt med hjälp av den här anslutningen.

Förutsättningar

Om ditt datalager finns i ett lokalt nätverk, ett virtuellt Azure-nätverk eller Amazon Virtual Private Cloud måste du konfigurera en integrationskörning med egen värd för att ansluta till det.

Om ditt datalager är en hanterad molndatatjänst kan du använda Azure Integration Runtime. Om åtkomsten är begränsad till IP-adresser som är godkända i brandväggsreglerna kan du lägga till Azure Integration Runtime IP-adresser i listan över tillåtna ip-adresser.

Du kan också använda integrationskörningsfunktionen för hanterade virtuella nätverk i Azure Data Factory för att få åtkomst till det lokala nätverket utan att installera och konfigurera en integrationskörning med egen värd.

Mer information om de mekanismer och alternativ för nätverkssäkerhet som stöds av Data Factory finns i Dataåtkomststrategier.

Komma igång

Om du vill aktiviteten Kopiera med en pipeline kan du använda något av följande verktyg eller SDK:er:

Skapa en länkad tjänst till Greenplum med hjälp av användargränssnittet

Använd följande steg för att skapa en länkad tjänst till Greenplum i Azure Portal användargränssnitt.

  1. Bläddra till fliken Hantera i arbetsytan Azure Data Factory Synapse och välj Länkade tjänster och klicka sedan på Ny:

  2. Sök efter Greenplum och välj Greenplum-anslutningsappen.

    Skärmbild av Greenplum-anslutningsappen.

  3. Konfigurera tjänstinformationen, testa anslutningen och skapa den nya länkade tjänsten.

    Skärmbild av länkad tjänstkonfiguration för Greenplum.

Information om konfiguration av anslutning

Följande avsnitt innehåller information om egenskaper som används för att definiera Data Factory som är specifika för Greenplum-anslutningsappen.

Egenskaper för länkad tjänst

Följande egenskaper stöds för länkad Greenplum-tjänst:

Egenskap Beskrivning Krävs
typ Egenskapen type måste anges till: Greenplum Yes
Connectionstring En ODBC-anslutningssträng för att ansluta till Greenplum.
Du kan också placera lösenordet i Azure Key Vault hämta konfigurationen pwd från anslutningssträngen. Se följande exempel och Lagra autentiseringsuppgifter i den Azure Key Vault artikeln med mer information.
Yes
connectVia Den Integration Runtime som ska användas för att ansluta till datalagret. Läs mer i avsnittet Förutsättningar. Om inget anges används standardinställningen Azure Integration Runtime. No

Exempel:

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Exempel: lagra lösenord i Azure Key Vault

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Egenskaper för datamängd

En fullständig lista över avsnitt och egenskaper som är tillgängliga för att definiera datauppsättningar finns i artikeln om datauppsättningar. Det här avsnittet innehåller en lista över egenskaper som stöds av Greenplum-datauppsättningen.

Om du vill kopiera data från Greenplum anger du egenskapen type för datauppsättningen till GreenplumTable. Följande egenskaper stöds:

Egenskap Beskrivning Krävs
typ Typegenskapen för datauppsättningen måste anges till: GreenplumTable Yes
schema Namnet på schemat. Nej (om "fråga" i aktivitetskällan har angetts)
tabell Namnet på tabellen. Nej (om "fråga" i aktivitetskällan har angetts)
tableName Namnet på tabellen med schema. Den här egenskapen stöds för bakåtkompatibilitet. Använd schema och för ny table arbetsbelastning. Nej (om "fråga" i aktivitetskällan har angetts)

Exempel

{
    "name": "GreenplumDataset",
    "properties": {
        "type": "GreenplumTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Greenplum linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Kopiera egenskaper för aktivitet

En fullständig lista över avsnitt och egenskaper som är tillgängliga för att definiera aktiviteter finns i artikeln Pipelines. Det här avsnittet innehåller en lista över egenskaper som stöds av Greenplum-källan.

GreenplumSource som källa

Om du vill kopiera data från Greenplum anger du källtypen i kopieringsaktiviteten till GreenplumSource. Följande egenskaper stöds i avsnittet för kopieringsaktivitetskälla:

Egenskap Beskrivning Krävs
typ Typegenskapen för kopieringsaktivitetskällan måste anges till: GreenplumSource Yes
DocumentDB Använd den anpassade SQL för att läsa data. Exempel: "SELECT * FROM MyTable". Nej (om "tableName" i datauppsättningen har angetts)

Exempel:

"activities":[
    {
        "name": "CopyFromGreenplum",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Greenplum input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GreenplumSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Egenskaper för sökningsaktivitet

Mer information om egenskaperna finns i Lookup activity (Sökningsaktivitet).

Nästa steg

En lista över datalager som stöds som källor och mottagare av kopieringsaktiviteten finns i datalager som stöds.