Inicio rápido: uso de la herramienta Copiar datos en Azure Data Factory Studio para copiar datos

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

En este inicio rápido usará la herramienta Copiar datos para crear una canalización que copia datos de la carpeta de origen de Azure Blob Storage a la carpeta de destino.

Prerrequisitos

Suscripción de Azure

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Preparación de los datos de origen en Azure Blob Storage

Seleccione el botón siguiente para probarlo.

Try your first data factory demo

Se le redirigirá a la página de configuración que se muestra en la imagen siguiente para implementar la plantilla. En este caso, solo tiene que crear un nuevo grupo de recursos. (Puede dejar todos los demás valores con sus valores predeterminados). A continuación, haga clic en Revisar y crear y haga clic en Crear para implementar los recursos.

Nota

El usuario que implementa la plantilla debe asignar un rol a una identidad administrada. Para ello se requieren permisos que se pueden conceder a través de los roles de Propietario, Administrador de acceso de usuario u Operador de identidad administrada.

Se creará una nueva cuenta de almacenamiento de blobs en el nuevo grupo de recursos y el archivo moviesDB2.csv se almacenará en una carpeta denominada input (entrada) en Blob Storage.

A screenshot of the deployment template creation dialog.

Crear una factoría de datos

Puede usar la factoría de datos existente o crear una nueva como se describe en Inicio rápido: Creación de una factoría de datos mediante el Azure Portal.

Uso de la herramienta copiar datos para copiar datos

En los pasos siguientes se explica cómo se pueden copiar sin complicaciones datos con la herramienta de copia de datos de Azure Data Factory.

Paso 1: iniciar la herramienta copiar datos

  1. En la página principal de Azure Data Factory, seleccione el icono Ingest (Ingerir) para iniciar la herramienta Copiar datos.

    Screenshot that shows the Azure Data Factory home page.

  2. En la página Propiedades de la herramienta Copiar datos, elija Tarea de copia integrada en Tipo de tarea y, a continuación, seleccione Siguiente.

    Screenshot that shows the Properties page.

Paso 2: completar la configuración de origen

  1. Haga clic en + Crear nueva conexión para agregar una conexión.

  2. Seleccione el tipo de servicio vinculado que desea crear para la conexión de origen. En este tutorial, se usará Azure Blob Storage. Selecciónelo en la galería y, luego, elija Continuar.

    Screenshot that shows the Select Blob dialog.

  3. En la página New connection (Azure Blob Storage) [Nueva conexión (Azure Blob Storage)], especifique un nombre para el servicio vinculado. Seleccione la suscripción a Azure de la lista Suscripción a Azure y la cuenta de almacenamiento de la lista Nombre de la cuenta de almacenamiento, pruebe la conexión y, a continuación, seleccione Crear.

    Screenshot that shows where to configure the Azure Blob storage account.

  4. Seleccione la conexión recién creada en el bloque Conexión.

  5. En la sección Archivo o carpeta, seleccione Examinar para ir a la carpeta adftutorial/input, seleccione el archivo emp.txt y, finalmente, haga clic en Aceptar.

  6. Seleccione la casilla Binary copy (Copia binaria) para copiar el archivo tal cual está, después, seleccione Siguiente.

    Screenshot that shows the Source data store page.

Paso 3: completar la configuración de destino

  1. Seleccione la conexión AzureBlobStorage que creó en el bloque Conexión.

  2. En la sección Ruta de acceso de carpeta, escriba adftutorial/output para la ruta de acceso de la carpeta.

    Screenshot that shows the Destination data store page.

  3. Deje otras opciones con sus valores predeterminados y, a continuación, seleccione Siguiente.

Paso 4: revisar la configuración y la implementación al completo

  1. En la página Configuración, especifique un nombre para la canalización y su descripción y, a continuación, seleccione Siguiente para usar otras configuraciones predeterminadas.

    Screenshot that shows the settings page.

  2. En la página Resumen, revise todos los valores y seleccione Siguiente.

  3. En la página Deployment complete (Implementación finalizada), haga clic en Monitor (Supervisión) para supervisar la canalización que ha creado.

    Screenshot that shows the Deployment complete page.

Paso 5: supervisar los resultados en ejecución

  1. La aplicación cambia a la pestaña Monitor (Supervisión). En esta pestaña verá el estado de la canalización. Seleccione Refresh (Actualizar) para actualizar la lista. Haga clic en el vínculo en Nombre de canalización para ver los detalles de la ejecución de actividad o volver a ejecutar la canalización.

    Screenshot that shows the refresh pipeline button.

  2. En la página Ejecuciones de actividad, seleccione el vínculo Detalles (icono de gafas) en la columna Nombre de actividad para obtener más detalles sobre la operación de copia. Para más información sobre las propiedades, consulte Introducción a la actividad de copia.

La canalización de este ejemplo copia los datos de una ubicación a otra en una instancia de Azure Blob Storage. Para más información sobre el uso de Data Factory en otros escenarios, consulte los siguientes tutoriales.