Inicio rápido: Uso de la herramienta Copy Data para copiar datos

SE APLICA A: Azure Data Factory Azure Synapse Analytics

En esta guía de inicio rápido, usará Azure Portal para crear una factoría de datos. A continuación, usará la herramienta Copy Data para crear una canalización que copia datos de una carpeta de una instancia de Azure Blob Storage a otra carpeta.

Nota

Si no está familiarizado con Azure Data Factory, consulte Introduction to Azure Data Factory antes de seguir los pasos de esta guía de inicio rápido.

Requisitos previos

Suscripción de Azure

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Roles de Azure

Para crear instancias de Data Factory, la cuenta de usuario que use para iniciar sesión en Azure debe ser un miembro de los roles colaborador o propietario, o de administrador de la suscripción de Azure. Para ver los permisos que tiene en la suscripción, vaya a Azure Portal, seleccione su nombre de usuario en la esquina superior derecha, seleccione el icono " ... " para ver más opciones y, después, seleccione Mis permisos. Si tiene acceso a varias suscripciones, elija la correspondiente.

Para crear y administrar recursos secundarios para Data Factory incluidos los conjuntos de datos, servicios vinculados, canalizaciones, desencadenadores y entornos de ejecución de integración, se aplican los siguientes requisitos:

  • Para crear y administrar recursos secundarios en Azure Portal, debe pertenecer al rol Colaborador de Data Factory en el nivel de grupo de recursos u otro nivel superior.
  • Para crear y administrar recursos secundarios con Powershell o el SDK, el rol de Colaborador en el nivel de recurso u otro nivel superior es suficiente.

Para obtener instrucciones de ejemplo sobre cómo agregar un usuario a un rol, consulte el artículo sobre la adición de roles.

Para más información, consulte los siguientes artículos:

Cuenta de Azure Storage

En esta guía de inicio rápido, use una cuenta de Azure Storage (en concreto Blob Storage) de uso general como almacén de datos de origen y destino. Si no dispone de una cuenta de Azure Storage de uso general, consulte el artículo Creación de una cuenta de almacenamiento, donde se indica cómo crearla.

Obtención del nombre de la cuenta de almacenamiento

En este inicio rápido, necesita el nombre de su cuenta de Azure Storage. El siguiente procedimiento especifica los pasos necesarios para obtener el nombre de una cuenta de almacenamiento:

  1. En un explorador web, vaya a Azure Portal e inicie sesión con su nombre de usuario y contraseña de Azure.
  2. En el menú de Azure Portal, seleccione Todos los servicios y, a continuación, seleccione Almacenamiento > Cuentas de almacenamiento. También puede buscar y seleccionar cuentas de almacenamiento desde cualquier página.
  3. En la página Cuentas de Storage, filtre por su cuenta de almacenamiento (si fuera necesario) y, después, seleccione su cuenta de Storage.

También puede buscar y seleccionar cuentas de almacenamiento desde cualquier página.

Creación de un contenedor de blobs

En esta sección se crea un contenedor de blobs denominado adftutorial en la instancia de Azure Blob Storage.

  1. En la página de la cuenta de almacenamiento, seleccione Información general > Contenedores.

  2. En la barra de herramientas de la página <Account name> - Contenedores, seleccione Contenedor.

  3. En el cuadro de diálogo Nuevo contenedor, escriba adftutorial para el nombre y seleccione Aceptar. La página <Account name> - Contenedores está actualizada para incluir adftutorial en la lista de contenedores.

    Lista de contenedores

Agregar una carpeta de entrada y un archivo para el contenedor de blobs

En esta sección, creará una carpeta denominada entrada en el contenedor que creó y cargará un archivo de ejemplo en dicha carpeta. Antes de empezar, abra un editor de texto, como el Bloc de notas, y cree un archivo denominado emp.txt con el siguiente contenido:

John, Doe
Jane, Doe

Guarde el archivo en la carpeta C:\ADFv2QuickStartPSH. (Si la carpeta no existe, créela). A continuación, vuelva a Azure Portal y siga estos pasos:

  1. En la página <Account name> - Contenedores en la que lo dejó, seleccione adftutorial en la lista actualizada de contenedores.

    1. Si ha cerrado la ventana o ha pasado a otra página; inicie sesión de nuevo en Azure Portal.
    2. En el menú de Azure Portal, seleccione Todos los servicios y, a continuación, seleccione Almacenamiento > Cuentas de almacenamiento. También puede buscar y seleccionar cuentas de almacenamiento desde cualquier página.
    3. Seleccione la cuenta de almacenamiento y, después, seleccione Contenedores > adftutorial.
  2. En la barra de herramientas de la página del contenedor adftutorial, seleccione Cargar.

  3. En la página Cargar blob, seleccione Archivos y, a continuación, busque y seleccione el archivo emp.txt.

  4. Expanda el título Avanzado. La página aparece ahora como a continuación:

    Selección del vínculo Avanzado

  5. En el cuadro Cargar en carpeta, escriba input.

  6. Seleccione el botón Cargar. Debería ver el archivo emp.txt y el estado de la carga en la lista.

  7. Seleccione el icono Cerrar (X) para cerrar la página Cargar blob.

Mantenga abierta la página del contenedor adftutorial. Úsela para comprobar la salida al final de esta guía de inicio rápido.

Crear una factoría de datos

  1. Inicie el explorador web Microsoft Edge o Google Chrome. Actualmente, la interfaz de usuario de Data Factory solo se admite en los exploradores web Microsoft Edge y Google Chrome.

  2. Vaya a Azure Portal.

  3. En el menú de Azure Portal, seleccione Crear un recurso > Integración > Data Factory:

    Creación de nueva factoría de datos

  4. En la página Nueva factoría de datos, escriba ADFTutorialDataFactory en Nombre.

    El nombre de la instancia de Azure Data Factory debe ser único de forma global. Si ve el siguiente error, cambie el nombre de la factoría de datos (por ejemplo, <suNombre>ADFTutorialDataFactory) e intente crearlo de nuevo. Para conocer las reglas de nomenclatura de los artefactos de Data Factory, consulte el artículo Azure Data Factory: reglas de nomenclatura.

    Mensaje de error cuando un nombre no está disponible

  5. En Suscripción, seleccione la suscripción de Azure donde desea crear la factoría de datos.

  6. Para Grupo de recursos, realice uno de los siguientes pasos:

    • Seleccione en primer lugar Usar existente y después un grupo de recursos de la lista.
    • Seleccione Crear nuevo y escriba el nombre de un grupo de recursos.

    Para obtener más información sobre los grupos de recursos, consulte Uso de grupos de recursos para administrar los recursos de Azure.

  7. En Versión, seleccione V2.

  8. En Ubicación, seleccione la ubicación de la factoría de datos.

    En la lista solo se muestran las ubicaciones que admite Data Factory y dónde se almacenarán los metadatos de Azure Data Factory. Los almacenes de datos asociados (como Azure Storage y Azure SQL Database) y los procesos (como Azure HDInsight) que usa Data Factory se pueden ejecutar en otras regiones.

  9. Seleccione Crear.

  10. Una vez completada la creación, verá la página Data Factory. Seleccione el icono Author & Monitor (Creación y supervisión) para iniciar la aplicación de interfaz de usuario de Azure Data Factory en una pestaña independiente.

    Página principal de Azure Data Factory, con el icono de creación y supervisión

Inicio de la herramienta Copy Data

  1. En la página principal de Azure Data Factory, seleccione el icono Ingest (Ingerir) para iniciar la herramienta Copiar datos.

    Captura de pantalla que muestra la página principal de Azure Data Factory.

  2. En la página Propiedades de la herramienta Copiar datos, elija Tarea de copia integrada en Tipo de tarea y, a continuación, seleccione Siguiente.

    Página de propiedades

  3. En la página Almacén de datos de origen, realice los pasos siguientes:

    1. Haga clic en + Crear nueva conexión para agregar una conexión.

    2. Seleccione el tipo de servicio vinculado que desea crear para la conexión de origen. En este tutorial, se usará Azure Blob Storage. Selecciónelo en la galería y, luego, elija Continuar.

      Selección de blob

    3. En la página New connection (Azure Blob Storage) [Nueva conexión (Azure Blob Storage)], especifique un nombre para el servicio vinculado. Seleccione la suscripción a Azure de la lista Suscripción a Azure y la cuenta de almacenamiento de la lista Nombre de la cuenta de almacenamiento, pruebe la conexión y, a continuación, seleccione Crear.

      Configuración de la cuenta de Azure Blob Storage

    4. Seleccione la conexión recién creada en el bloque Conexión.

    5. En la sección Archivo o carpeta, seleccione Examinar para ir a la carpeta adftutorial/input, seleccione el archivo emp.txt y, finalmente, haga clic en Aceptar.

    6. Seleccione la casilla Binary copy (Copia binaria) para copiar el archivo tal cual está, después, seleccione Siguiente.

      Captura de pantalla que muestra la página Almacén de datos de origen.

  4. En la página Almacén de datos de destino, realice los pasos siguientes:

    1. Seleccione la conexión AzureBlobStorage que creó en el bloque Conexión.

    2. En la sección Ruta de acceso de carpeta, escriba adftutorial/output para la ruta de acceso de la carpeta.

      Captura de pantalla que muestra la página Almacén de datos de destino.

    3. Deje otras opciones con sus valores predeterminados y, a continuación, seleccione Siguiente.

  5. En la página Configuración, especifique un nombre para la canalización y su descripción y, a continuación, seleccione Siguiente para usar otras configuraciones predeterminadas.

    Captura de pantalla que muestra la página Configuración.

  6. En la página Resumen, revise todos los valores y seleccione Siguiente.

  7. En la página Deployment complete (Implementación finalizada), haga clic en Monitor (Supervisión) para supervisar la canalización que ha creado.

    Página de implementación completada

  8. La aplicación cambia a la pestaña Monitor (Supervisión). En esta pestaña verá el estado de la canalización. Seleccione Refresh (Actualizar) para actualizar la lista. Haga clic en el vínculo en Nombre de canalización para ver los detalles de la ejecución de actividad o volver a ejecutar la canalización.

    Actualización de canalización

  9. En la página Ejecuciones de actividad, seleccione el vínculo Detalles (icono de gafas) en la columna Nombre de actividad para obtener más detalles sobre la operación de copia. Para más información sobre las propiedades, consulte Introducción a la actividad de copia.

  10. Para volver a la vista Ejecuciones de canalizaciones, seleccione el vínculo Todas las ejecuciones de la canalización en el menú de la ruta de navegación. Para actualizar la vista, seleccione Refresh (Actualizar).

  11. Compruebe que se crea el archivo emp.txt en la carpeta output del contenedor adftutorial. Si no existe la carpeta de salida, el servicio Data Factory la crea automáticamente.

  12. Cambie a la pestaña Creador situada encima de la pestaña Supervisar del panel izquierdo para editar los servicios, conjuntos de datos y canalizaciones vinculados. Para saber cómo editarlos en la interfaz de usuario de Data Factory, consulte Crear una factoría de datos mediante Azure Portal.

    Pestaña de selección de autor

Pasos siguientes

La canalización de este ejemplo copia los datos de una ubicación a otra en una instancia de Azure Blob Storage. Para más información sobre el uso de Data Factory en otros escenarios, consulte los siguientes tutoriales.