Copia o clonación de una factoría de datos en Azure Data Factory

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga más información sobre cómo iniciar una nueva evaluación gratuita.

En este artículo se describe cómo copiar o clonar una factoría de datos en Azure Data Factory.

Casos de uso para la clonación de una factoría de datos

Estas son algunas de las circunstancias en las que podría resultar útil copiar o clonar una factoría de datos:

  • Mover Data Factory a una región nueva. Si quiere mover Data Factory a otra región, la mejor manera de hacerlo es crear una copia en la región de destino y eliminar la existente.

  • Cambiar el nombre de Data Factory. Azure no permite cambiar el nombre de los recursos. Si quiere cambiar el nombre de una factoría de datos, puede clonarla con otro nombre y eliminar la existente.

  • Depurar los cambios cuando las características de depuración no sean suficientes. En la mayoría de los escenarios, puede usar Depurar. En otros, resulta más conveniente probar los cambios en un entorno de espacio aislado clonado. Por ejemplo, cómo se comportarán las canalizaciones de ETL con parámetros cuando un desencadenador se active tras la llegada de archivos frente a la ventana de saltos de tamaño constante, es posible que no se pueda probar fácilmente solo a través de la depuración. En estos casos, puede que quiera clonar un entorno de espacio aislado para experimentación. Como Azure Data Factory cobra principalmente por la cantidad de ejecuciones, una segunda factoría no genera ningún cobro adicional.

Clonación de una factoría de datos

  1. Como requisito previo, primero debe crear la factoría de datos de destino desde Azure Portal.

  2. Si está en modo GIT:

    1. Cada vez que publique desde el portal, la plantilla de Resource Manager de la factoría se guarda en GIT en la rama adf_publish.
    2. Conecte la factoría nueva al mismo repositorio y compile desde la rama adf_publish. Se transportarán recursos como las canalizaciones, los conjuntos de datos y los desencadenadores.
  3. Si está en modo real:

    1. La UI de Data Factory le permite exportar toda la carga de la factoría de datos a un archivo de plantilla de Resource Manager y un archivo de parámetro. Se puede acceder a ellos desde el botón Plantilla de ARM \ Exportación de plantillas de Resource Manager en el portal.
    2. Puede realizar los cambios correspondientes en el archivo de parámetros e intercambiar valores nuevos de la factoría nueva.
    3. A continuación, puede implementarla a través de los métodos de implementación de plantilla de Resource Manager estándar.
  4. Si tiene una instancia de Integration Runtime autohospedada en la factoría de origen, deberá crearla previamente con el mismo nombre en el generador de destino. Si quiere compartir la instancia de Integration Runtime autohospedada entre distintas factorías, puede usar el patrón publicado aquí para compartir la instancia de IR autohospedada.

  5. Por motivos de seguridad, la plantilla de Resource Manager generada no contendrá información secreta, como contraseñas para los servicios vinculados. Por lo tanto, debe proporcionar las credenciales como parámetros de implementación. Si no quiere escribir manualmente las credenciales para la configuración, considere en su lugar la posibilidad de recuperar las cadenas de conexión y las contraseñas de Azure Key Vault. Ver más

Revise la guía para crear una factoría de datos en Azure Portal en Creación de una factoría de datos con la interfaz de usuario de Azure Data Factory.