Copiar datos de Greenplum con Azure Data FactoryCopy data from Greenplum using Azure Data Factory

SE APLICA A: Azure Data Factory Azure Synapse Analytics

En este artículo se explica el uso de la actividad de copia de Azure Data Factory para copiar datos de Greenplum.This article outlines how to use the Copy Activity in Azure Data Factory to copy data from Greenplum. El documento se basa en el artículo de introducción a la actividad de copia que describe información general de la actividad de copia.It builds on the copy activity overview article that presents a general overview of copy activity.

Funcionalidades admitidasSupported capabilities

Este conector de Greenplum es compatible con las actividades siguientes:This Greenplum connector is supported for the following activities:

Puede copiar datos de Greenplum en cualquier almacén de datos de receptor admitido.You can copy data from Greenplum to any supported sink data store. Consulte la tabla de almacenes de datos compatibles para ver una lista de almacenes de datos que la actividad de copia admite como orígenes o receptores.For a list of data stores that are supported as sources/sinks by the copy activity, see the Supported data stores table.

Azure Data Factory proporciona un controlador integrado para habilitar la conectividad. Por lo tanto, no es necesario instalar manualmente ningún controlador mediante este conector.Azure Data Factory provides a built-in driver to enable connectivity, therefore you don't need to manually install any driver using this connector.

Requisitos previosPrerequisites

Si el almacén de datos se encuentra en una red local, una red virtual de Azure o una nube privada virtual de Amazon, debe configurar un entorno de ejecución de integración autohospedado para conectarse a él.If your data store is located inside an on-premises network, an Azure virtual network, or Amazon Virtual Private Cloud, you need to configure a self-hosted integration runtime to connect to it.

O bien, si el almacén de datos es un servicio de datos en la nube administrado, puede usar Azure Integration Runtime.Alternatively, if your data store is a managed cloud data service, you can use Azure integration runtime. Si el acceso está restringido a las direcciones IP que están aprobadas en las reglas de firewall, puede agregar direcciones IP de Azure Integration Runtime a la lista de permitidos.If the access is restricted to IPs that are approved in the firewall rules, you can add Azure Integration Runtime IPs into the allow list.

Consulte Estrategias de acceso a datos para más información sobre los mecanismos de seguridad de red y las opciones que admite Data Factory.For more information about the network security mechanisms and options supported by Data Factory, see Data access strategies.

IntroducciónGetting started

Para realizar la actividad de copia con una canalización, puede usar una de los siguientes herramientas o SDK:To perform the Copy activity with a pipeline, you can use one of the following tools or SDKs:

En las secciones siguientes se proporcionan detalles sobre las propiedades que se usan para definir entidades de Data Factory específicas del conector de Greenplum.The following sections provide details about properties that are used to define Data Factory entities specific to Greenplum connector.

Propiedades del servicio vinculadoLinked service properties

Las siguientes propiedades son compatibles con el servicio vinculado de Greenplum:The following properties are supported for Greenplum linked service:

PropiedadProperty DescripciónDescription ObligatorioRequired
typetype La propiedad type debe establecerse en: GreenplumThe type property must be set to: Greenplum Yes
connectionStringconnectionString Cadena de conexión de ODBC para conectarse a Greenplum.An ODBC connection string to connect to Greenplum.
También puede colocar la contraseña en Azure Key Vault y extraer la configuración de pwd de la cadena de conexión.You can also put password in Azure Key Vault and pull the pwd configuration out of the connection string. Consulte los siguientes ejemplos y el artículo Almacenamiento de credenciales en Azure Key Vault con información detallada.Refer to the following samples and Store credentials in Azure Key Vault article with more details.
Yes
connectViaconnectVia El entorno Integration Runtime que se usará para conectarse al almacén de datos.The Integration Runtime to be used to connect to the data store. Obtenga más información en la sección Requisitos previos.Learn more from Prerequisites section. Si no se especifica, se usará Azure Integration Runtime.If not specified, it uses the default Azure Integration Runtime. NoNo

Ejemplo:Example:

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Ejemplo: Almacenamiento de la contraseña en Azure Key VaultExample: store password in Azure Key Vault

{
    "name": "GreenplumLinkedService",
    "properties": {
        "type": "Greenplum",
        "typeProperties": {
            "connectionString": "HOST=<server>;PORT=<port>;DB=<database>;UID=<user name>;",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Propiedades del conjunto de datosDataset properties

Si desea ver una lista completa de las secciones y propiedades disponibles para definir conjuntos de datos, consulte el artículo sobre conjuntos de datos.For a full list of sections and properties available for defining datasets, see the datasets article. En esta sección se proporciona una lista de las propiedades compatibles con el conjunto de datos de Greenplum.This section provides a list of properties supported by Greenplum dataset.

Para copiar datos de Greenplum, establezca la propiedad type del conjunto de datos en GreenplumTable.To copy data from Greenplum, set the type property of the dataset to GreenplumTable. Se admiten las siguientes propiedades:The following properties are supported:

PropiedadProperty DescripciónDescription ObligatorioRequired
typetype La propiedad type del conjunto de datos se debe establecer en GreenplumTable.The type property of the dataset must be set to: GreenplumTable Yes
esquemaschema Nombre del esquema.Name of the schema. No (si se especifica "query" en el origen de la actividad)No (if "query" in activity source is specified)
tabletable Nombre de la tabla.Name of the table. No (si se especifica "query" en el origen de la actividad)No (if "query" in activity source is specified)
tableNametableName Nombre de la tabla con el esquema.Name of the table with schema. Esta propiedad permite la compatibilidad con versiones anteriores.This property is supported for backward compatibility. Use schema y table para la carga de trabajo nueva.Use schema and table for new workload. No (si se especifica "query" en el origen de la actividad)No (if "query" in activity source is specified)

EjemploExample

{
    "name": "GreenplumDataset",
    "properties": {
        "type": "GreenplumTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Greenplum linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Propiedades de la actividad de copiaCopy activity properties

Si desea ver una lista completa de las secciones y propiedades disponibles para definir actividades, consulte el artículo sobre canalizaciones.For a full list of sections and properties available for defining activities, see the Pipelines article. En esta sección se proporciona una lista de las propiedades compatibles con el origen de Greenplum.This section provides a list of properties supported by Greenplum source.

GreenplumSource como origenGreenplumSource as source

Para copiar datos de Greenplum, establezca el tipo de origen de la actividad de copia en GreenplumSource.To copy data from Greenplum, set the source type in the copy activity to GreenplumSource. Se admiten las siguientes propiedades en la sección source de la actividad de copia:The following properties are supported in the copy activity source section:

PropiedadProperty DescripciónDescription ObligatorioRequired
typetype La propiedad type del origen de la actividad de copia debe establecerse en: GreenplumSourceThe type property of the copy activity source must be set to: GreenplumSource Yes
Queryquery Use la consulta SQL personalizada para leer los datos.Use the custom SQL query to read data. Por ejemplo: "SELECT * FROM MyTable".For example: "SELECT * FROM MyTable". No (si se especifica "tableName" en el conjunto de datos)No (if "tableName" in dataset is specified)

Ejemplo:Example:

"activities":[
    {
        "name": "CopyFromGreenplum",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Greenplum input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GreenplumSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Propiedades de la actividad de búsquedaLookup activity properties

Para obtener información detallada sobre las propiedades, consulte Actividad de búsqueda.To learn details about the properties, check Lookup activity.

Pasos siguientesNext steps

Consulte los almacenes de datos compatibles para ver la lista de almacenes de datos que la actividad de copia de Azure Data Factory admite como orígenes y receptores.For a list of data stores supported as sources and sinks by the copy activity in Azure Data Factory, see supported data stores.