Movimiento de datos desde o hacia Azure Blob Storage con conectores SSIS

El Azure Feature Pack para Integration Services (SSIS) ofrece componentes para conectarse a Azure, transferir datos entre Azure y orígenes de datos locales y procesar datos almacenados en Azure.

Este menú vincula a tecnologías que puede usar para mover datos hacia Azure Blob Storage y desde este:

Una vez que los clientes han movido los datos locales a la nube, pueden acceder a sus datos desde cualquier servicio de Azure para aprovechar al máximo el conjunto de tecnologías de Azure. Posteriormente, los datos se pueden usar, por ejemplo, en Azure Machine Learning o en un clúster de HDInsight.

Los ejemplos de uso de estos recursos de Azure se encuentran en los tutoriales de SQL y HDInsight.

Si desea ver un análisis de los escenarios canónicos que usan SSIS para satisfacer las necesidades de negocio comunes en escenarios de integración de datos híbridos, visite el blog Doing more with SQL Server Integration Services Feature Pack for Azure (Aprovechar más el Feature Pack de SQL Server Integration Services para Azure).

Nota

Para ver una introducción completa a Azure Blob Storage, consulte Aspectos básicos de Azure Blob y API REST de Azure Blob Service.

Requisitos previos

Para realizar las tareas que se describen en este artículo, debe tener configurada una suscripción a Azure y una cuenta de Azure Storage. El nombre y la clave de la cuenta de Azure Storage se necesitan para cargar o descargar datos.

Para usar los conectores SSIS, debe descargar:

Nota:

SSIS se instala con SQL Server, pero no está incluido en la versión Express. Para obtener información sobre qué aplicaciones se incluyen en las distintas versiones de SQL Server, consulte la Documentación técnica de SQL Server.

Para instalar SSIS, vea Instalar Integration Services (SSIS).

Para obtener información sobre cómo trabajar con SISS para crear paquetes de extracción, transformación y carga (ETL) sencillos, consulte Tutorial de SSIS: Creación de un paquete ETL sencillo.

Descargar el conjunto de datos de taxis de la ciudad de Nueva York

En el ejemplo que se describe aquí se usa un conjunto de datos disponible públicamente, disponible en Azure Open Datasets y Datos de registro de viaje de TLC. El conjunto de datos consta de alrededor de 173 millones de viajes en taxi que se realizaron en Nueva York durante el año 2013. Existen dos tipos de datos: datos de los detalles de las carreras y datos sobre las tarifas.

Carga de datos en Blob Storage

Para mover los datos con el Feature Pack de SSIS desde un almacenamiento local a Blob Storage de Azure, usamos una instancia de la tarea de carga de blobs de Azure, que aparece a continuación:

Screenshot that shows Azure Blob Upload Task button.

En la tabla siguiente se describen los parámetros que utiliza la tarea.

Campo Descripción
AzureStorageConnection Especifica un Administrador de conexiones de Azure Storage existente o crea uno nuevo que hace referencia a una cuenta de Azure Storage que apunta a la ubicación en que se almacenan los archivos de blob.
BlobContainer Especifica el nombre del contenedor de blobs que contiene los archivos cargados como blobs.
BlobDirectory Especifica el directorio de blobs donde se almacena el archivo cargado como un blob en bloques. El directorio de blobs es una estructura jerárquica virtual. Si ya existe el blob, se reemplaza.
LocalDirectory Especifica el directorio local que contiene los archivos que se cargarán.
FileName Especifica un nombre de filtro para seleccionar archivos con el patrón de nombre especificado. Por ejemplo, MiHoja*.xls incluirá archivos como MiHoja001.xls y MiHojaABC.xlsx.
TimeRangeFrom/TimeRangeTo Especifica un filtro de intervalo de tiempo. Se incluyen los archivos modificados después de TimeRangeFrom y antes de TimeRangeTo.

Nota

Es necesario corregir las credenciales de AzureStorageConnection y se debe salir de BlobContainer antes de intentar realizar la transferencia.

Descarga de datos desde el almacenamiento de blobs

Para descargar datos desde Blob Storage a un almacenamiento local con SSIS, use una instancia de Tarea de descarga de blobs de Azure.

Escenarios de SSIS Azure más avanzados

El Feature Pack de SSIS permite administrar flujos más complejos al empaquetar juntas las tareas. Por ejemplo, los datos de blobs se podrían ingresar directamente en un clúster de HDInsight cuya salida se podría descargar nuevamente a un blob y, luego, a un almacenamiento local. SSIS puede ejecutar trabajos de Hive y Pig en un clúster de HDInsight, mediante el uso de conectores SSIS adicionales:

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Autor principal:

Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.

Pasos siguientes