Copia de datos de una base de datos de SQL Server en Azure Blob Storage con la herramienta Copiar datos

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

En este tutorial, usará Azure Portal para crear una factoría de datos. A continuación, usará la herramienta Copiar datos para crear una canalización que copia datos de una instancia de base de datos de SQL Server en una instancia de Azure Blob Storage.

Nota

En este tutorial, realizará los siguientes pasos:

  • Creación de una factoría de datos.
  • Uso de la herramienta Copy Data para crear una canalización.
  • Supervisión de las ejecuciones de canalización y actividad.

Requisitos previos

Suscripción de Azure

Antes de empezar, si no tiene una suscripción a Azure, cree una cuenta gratuita.

Roles de Azure

Para crear instancias de Data Factory, a la cuenta de usuario que use para iniciar sesión en Azure debe se le deben asignar los roles Colaborador o Propietario, o bien debe de ser de un administrador de la suscripción a Azure.

Para ver los permisos que tiene en la suscripción, vaya a Azure Portal. Seleccione su nombre de usuario en la esquina superior derecha y luego seleccione Permisos. Si tiene acceso a varias suscripciones, elija la correspondiente. Para obtener instrucciones de ejemplo sobre cómo agregar un usuario a un rol, consulte Asignación de roles de Azure mediante Azure Portal.

SQL Server 2014, 2016 y 2017

En este tutorial, usará una base de datos de SQL Server como almacén de datos de origen. La canalización de la factoría de datos que crea en este tutorial copia los datos de esta base de datos de SQL Server (origen) a Blob Storage (receptor). Luego, cree una tabla denominada emp en la base de datos de SQL Server e inserte un par de entradas de ejemplo en la tabla.

  1. Inicie SQL Server Management Studio. Si no está instalada en su máquina, vaya a Descarga de SQL Server Management Studio (SSMS).

  2. Conéctese a una instancia de SQL Server con sus credenciales.

  3. Cree una base de datos de ejemplo. En la vista de árbol, haga clic con el botón derecho en Bases de datos y, luego, seleccione Nueva base de datos.

  4. En el cuadro de diálogo Nueva base de datos, escriba el nombre de la base de datos y haga clic en Aceptar.

  5. Para crear la tabla emp e insertar en ella algunos datos de ejemplo, ejecute el siguiente script de consulta en la base de datos. En la vista de árbol, haga clic con el botón derecho en la base de datos que ha creado y, después, haga clic en Nueva consulta.

    CREATE TABLE dbo.emp
    (
        ID int IDENTITY(1,1) NOT NULL,
        FirstName varchar(50),
        LastName varchar(50)
    )
    GO
    
    INSERT INTO emp (FirstName, LastName) VALUES ('John', 'Doe')
    INSERT INTO emp (FirstName, LastName) VALUES ('Jane', 'Doe')
    GO
    

Cuenta de almacenamiento de Azure

En este tutorial, use una cuenta de almacenamiento de Azure (en concreto Blob Storage) de uso general como almacén de datos de destino o receptor. Si no dispone de una cuenta de almacenamiento de uso general, consulte Crear una cuenta de almacenamiento, donde se indica cómo crearla. La canalización de Data Factory que crea en este tutorial copia los datos de la base de datos de SQL Server (origen) a esta instancia de Blob Storage (receptor).

Obtención de un nombre y una clave de cuenta de almacenamiento

En este tutorial, use el nombre y la clave de su cuenta de almacenamiento. Para obtener el nombre y la clave de la cuenta de almacenamiento, siga estos pasos:

  1. Inicie sesión en Azure Portal con el nombre de usuario y la contraseña de Azure.

  2. Seleccione Todos los servicios en el panel izquierdo. Use la palabra clave Almacenamiento para filtrar el resultado y, luego, seleccione Cuentas de almacenamiento.

    Storage account search

  3. En la lista de cuentas de almacenamiento, filtre por su cuenta de almacenamiento, si fuera necesario. Después, seleccione su cuenta de almacenamiento.

  4. En la ventana Cuenta de almacenamiento, seleccione Claves de acceso.

  5. En los cuadros Nombre de la cuenta de almacenamiento y key1, copie los valores y péguelos en el Bloc de notas, u otro editor, para su uso posterior en el tutorial.

Crear una factoría de datos

  1. En el menú de la izquierda, seleccione Crear un recurso>Integración>Data Factory.

    New data factory creation

  2. En la página Nueva factoría de datos, en Nombre, escriba ADFTutorialDataFactory.

    El nombre de la factoría de datos tiene que ser único a nivel global. Si ve el siguiente mensaje de error en el campo de nombre, cambie el nombre de la factoría de datos (por ejemplo, suNombreADFTutorialDataFactory). Para conocer las reglas de nomenclatura de los artefactos de Data Factory, consulte Azure Data Factory: reglas de nomenclatura.

    New data factory error message for duplicate name.

  3. Seleccione la suscripción de Azure en la que quiere crear la factoría de datos.

  4. Para Grupo de recursos, realice uno de los siguientes pasos:

  5. En Versión, seleccione V2.

  6. En Ubicación, seleccione la ubicación de la factoría de datos. En la lista desplegable solo se muestran las ubicaciones que se admiten. Los almacenes de datos (por ejemplo, Azure Storage y SQL Database) y los procesos (por ejemplo, Azure HDInsight) que usa Data Factory pueden estar en otras ubicaciones o regiones.

  7. Seleccione Crear.

  8. Una vez finalizada la creación, verá la página Data Factory tal como se muestra en la imagen.

    Home page for the Azure Data Factory, with the Open Azure Data Factory Studio tile.

  9. Seleccione Abrir en el icono Abrir Azure Data Factory Studio para iniciar la aplicación de interfaz de usuario de Data Factory en una pestaña independiente.

Uso de la herramienta Copy Data para crear una canalización

  1. En la página principal de Azure Data Factory, seleccione Ingerir para iniciar la herramienta Copiar datos.

    Screenshot that shows the Azure Data Factory home page.

  2. En la página Propiedades de la herramienta Copiar datos, elija Tarea de copia integrada en Tipo de tarea y elija Ejecutar una vez ahora en Cadencia de tareas o programación de tareas. A continuación, seleccione Siguiente.

  3. En la página Almacén de datos de origen, haga clic en + Crear una conexión nueva.

  4. En Nueva conexión, busque SQL Servery, a continuación, seleccione Continuar.

  5. En el cuadro de diálogo Nueva conexión (SQL Server) , en Nombre, escriba SqlServerLinkedService. Seleccione +Nuevo en la opción Connect via integration runtime (Conectar mediante IR). Tiene que crear un entorno de ejecución de integración, descargarlo en la máquina y registrarlo en Data Factory. El entorno de ejecución de integración autohospedado copia datos entre el entorno local y la nube.

  6. En el cuadro de diálogo Configuración de Integration Runtime, seleccione Autohospedado. Después, seleccione Continuar.

    Create integration runtime

  7. En el cuadro de diálogo Configuración de Integration Runtime, en Nombre escriba TutorialIntegrationRuntime. Seleccione Crear.

  8. En el cuadro de diálogo Configuración de Integration Runtime, seleccione Haga clic aquí para iniciar la configuración rápida en este equipo. Esta acción instala el entorno de ejecución de integración en la máquina y la registra en Data Factory. Como alternativa, puede usar la instalación manual para descargar el archivo de instalación, ejecutarlo y registrar la instancia de Integration Runtime con la clave.

  9. Ejecute la aplicación descargada. Verá el estado de la configuración rápida en la ventana.

    Express setup status

  10. En el cuadro de diálogo Nueva conexión (SQL Server) , confirme que TutorialIntegrationRuntime está seleccionado en Conectar a través de IR. A continuación, siga estos pasos:

    a. En Name (Nombre), escriba SqlServerLinkedService.

    b. Escriba el nombre de la instancia de SQL Server en Server name (Nombre del servidor).

    c. Escriba el nombre de la base de datos local en Database name (Nombre de la base de datos).

    d. Seleccione la autenticación adecuada en Authentication type (Tipo de autenticación).

    e. Escriba el nombre de usuario con acceso a la instancia de SQL Server en User name (Nombre de usuario).

    f. Escriba la contraseña del usuario.

    g. Pruebe la conexión y seleccione Crear.

    Integration runtime selected

  11. En la página Almacén de datos de origen, asegúrese de que la conexión de SQL Server recién creada está seleccionada en el bloque Conexión. A continuación, en la sección Tablas de origen, elija TABLAS EXISTENTES y seleccione la tabla dbo.emp en la lista, y seleccione Siguiente. Puede seleccionar cualquier otra tabla en función de la base de datos.

  12. En la página Aplicar filtro, puede obtener una vista previa de los datos y ver el esquema de los datos de entrada seleccionando el botón Vista previa de los datos. Luego, seleccione Siguiente.

  13. En la página Almacén de datos de destino, seleccione + Crear nueva conexión

  14. En Nueva conexión, busque y seleccione Azure Blob Storage y, después, seleccione Continuar.

    Blob storage selection

  15. En el cuadro de diálogo Nueva conexión (Azure Blob Storage) , realice los siguientes pasos:

    a. En Name (Nombre), escriba AzureStorageLinkedService.

    b. En Conectar mediante IR, seleccione TutorialIntegrationRuntime y seleccione Clave de cuenta en Método de autenticación.

    c. En Suscripción de Azure, seleccione la suscripción de Azure en la lista desplegable.

    d. Seleccione la cuenta de almacenamiento en la lista desplegable Storage account name (Nombre de la cuenta de almacenamiento).

    e. Pruebe la conexión y seleccione Crear.

  16. En el cuadro de diálogo Almacén de datos de destino, asegúrese de que la conexión de Azure Blob Storage recién creada está seleccionada en el bloque Conexión. A continuación, en Ruta de acceso de carpeta, escriba adftutorial/fromonprem. El contenedor adftutorial se creó como parte de los requisitos previos. Si no existe la carpeta de salida (en este caso fromonprem), Data Factory la crea automáticamente. También puede usar el botón Browse (Examinar) para examinar Blob Storage y sus contenedores o carpetas. Si no especifica ningún valor en nombre de archivo, de forma predeterminada se usará el nombre del origen (en este caso dbo.emp).

    Screenshot that shows the configuration of the 'Destination data store' page.

  17. En el cuadro de diálogo File format settings (Configuración de formato de archivo), seleccione Next (Siguiente).

  18. En el cuadro de diálogo Configuración, en Nombre de tarea, escriba CopyFromOnPremSqlToAzureBlobPipeline y, a continuación, seleccione Siguiente. La herramienta Copy Data crea una canalización con el nombre que especificó para este campo.

  19. En el cuadro de diálogo Summary (Resumen), revise los valores de configuración y seleccione Next (Siguiente).

  20. En la página Implementación, seleccione Supervisión para supervisar la canalización (tarea).

  21. Cuando la ejecución de la canalización se complete, podrá ver el estado de la canalización que ha creado.

  22. En la página "Ejecuciones de canalización", seleccione Actualizar para actualizar la lista. Seleccione el vínculo en Nombre de canalización para ver los detalles de la ejecución de actividad o volver a ejecutar la canalización.

    Screenshot that shows the 'Pipeline runs' page.

  23. En la página "Ejecuciones de actividad", seleccione el vínculo Detalles (icono de gafas) en la columna Nombre de actividad para obtener más detalles sobre la operación de copia. Para volver a la página "Ejecuciones de canalización", seleccione el vínculo Todas las ejecuciones de la canalización en el menú de la ruta de navegación. Para actualizar la vista, seleccione Refresh (Actualizar).

    Screenshot that shows the activity details.

  24. Confirme que ve un archivo de salida en la carpeta fromonprem del contenedor adftutorial.

  25. Seleccione la pestaña Author (Crear) de la izquierda para cambiar al modo de edición. Con el editor puede actualizar los servicios vinculados, los conjuntos de datos y las canalizaciones creados mediante la herramienta. Seleccione Code (Código) para ver el código JSON asociado con la entrada abierta en el editor. Para más información sobre cómo editar estas entidades en la interfaz de usuario de Data Factory, consulte la versión de Azure Portal de este tutorial.

    Screenshot that shows the Author tab.

La canalización de este ejemplo copia datos de la base de datos de SQL Server en Blob Storage. Ha aprendido a:

  • Creación de una factoría de datos.
  • Uso de la herramienta Copy Data para crear una canalización.
  • Supervisión de las ejecuciones de canalización y actividad.

Para ver una lista de los almacenes de datos compatibles con Data Factory, consulte los almacenes de datos que se admiten.

Para informarse acerca de cómo copiar datos de forma masiva de un origen a un destino, pase al tutorial siguiente: