Déplacer des données vers ou depuis Stockage Blob Azure à l’aide de connecteurs SSIS

Le pack de fonctionnalités Azure pour Integration Services (SSIS) fournit des composants permettant de se connecter à Azure, de transférer des données entre Azure et des sources de données locales et de traiter les données stockées dans Azure.

Ce menu vous permet d’accéder aux technologies que vous pouvez utiliser pour déplacer des données vers et depuis le stockage Blob Azure :

Une fois que les clients ont déplacé des données locales vers le cloud, ils peuvent y accéder à partir de tout service Azure pour tirer pleinement parti de la puissance de la suite de technologies Azure. Ils peuvent ensuite utiliser les données, par exemple, dans Azure Machine Learning ou sur un cluster HDInsight.

Vous trouverez des exemples d’utilisation de ces ressources Azure dans les procédures pas à pas SQL et HDInsight.

Pour une présentation de scénarios canoniques utilisant SSIS pour répondre aux besoins de l’entreprise communs dans les scénarios d’intégration hybrides, reportez-vous à la section En faire plus avec le Feature Pack SQL Server Integration Services pour Azure .

Notes

Pour une présentation complète du Stockage Blob Azure, consultez les articles Concepts de base de Stockage Blob Azure et API REST du service Blob Azure.

Prérequis

Pour exécuter les tâches décrites dans cet article, vous devez disposer d’un abonnement Azure et d’un compte de stockage Azure. Pour charger ou télécharger des données, vous devez connaître le nom et la clé du compte de stockage Azure.

Pour utiliser les connecteurs SSISvous devez télécharger :

Remarque

SSIS est installé avec SQL Server, mais n’est pas inclus dans la version Express. Pour plus d’informations sur les applications incluses dans les différentes éditions de SQL Server, consultez Documentation technique de SQL Server.

Pour installer SSIS, consultez Installer Integration Services (SSIS).

Pour plus d’informations sur la mise en service à l’aide de SISS pour la création des packages d’extraction, de transformation et de chargement (ETL), consultez Didacticiel SSIS : création d’un Package ETL Simple.

Télécharger l’ensemble de données Taxi NYC

L’exemple décrit ici utilise un jeu de données accessible au public, disponible dans Azure Open datasets et les données d’enregistrement de trajet TLC. Le groupe de données se compose d’environ 173 millions de courses en taxi à New York dans l’année 2013. Il existe deux types de données : les données détaillées relatives aux voyages et celles relatives aux tarifs des courses.

Charger des données dans un stockage blob

Pour déplacer des données à l’aide du pack de fonctionnalités du site local pour le stockage d’objets blobs Azure, nous utilisons une instance de la tâche de téléchargement d’objets blobs Azure, comme illustré ici :

Screenshot that shows Azure Blob Upload Task button.

Le tableau ci-dessous décrit les paramètres utilisés par la tâche.

Champ Description
AzureStorageConnection Spécifie un Gestionnaire de connexions de Stockage Azure ou en crée un faisant référence à un compte de stockage Azure pointant vers l’emplacement où les fichiers blob sont hébergés.
BlobContainer Spécifie le nom du conteneur d’objets blobs dans lequel se trouvent les fichiers chargés en tant qu’objets blobs.
BlobDirectory Spécifie le répertoire d’objets blob dans lequel le fichier chargé est stocké en tant qu’objet blob de bloc. Le répertoire d’objet blob est une structure hiérarchique virtuelle. Si l’objet blob existe déjà, il est remplacé.
LocalDirectory Spécifie le répertoire local qui contient les fichiers à télécharger.
FileName Spécifie un filtre de nom pour sélectionner des fichiers obéissant à un schéma de nom spécifié. Par exemple, MySheet*.xls* inclut les fichiers MySheet001.xls et MySheetABC.xlsx.
TimeRangeFrom/TimeRangeTo Spécifie une plage de temps pour appliquer un filtre. Les fichiers modifiés après TimeRangeFrom et avant TimeRangeTo sont inclus.

Notes

Les informations d’identification AzureStorageConnection doivent être correctes et BlobContainer doit exister avant que le transfert soit tenté.

Télécharger les données depuis le stockage d’objets blobs

Pour télécharger des données depuis le stockage d’objets blob vers le stockage sur site avec SSIS, utilisez une instance de la tâche de téléchargement d’objets blob Azure.

Scénarios SSIS-Azure plus élaborés

Le pack de fonctionnalités SSIS permet de gérer des flux de données plus complexes en regroupant plusieurs tâches. Par exemple, les données d’objets blobs peuvent alimenter directement un cluster HDInsight dont le résultat peut être de nouveau téléchargé vers un objet blob, puis dans un espace de stockage local. SSIS peut exécuter des tâches Hive et Pig sur un cluster HDInsight à l’aide de connecteurs SSIS supplémentaires :

Contributeurs

Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.

Auteur principal :

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes