Didacticiel : Créer un pipeline avec l’activité de copie à l’aide de l’Assistant de copie de Data FactoryTutorial: Create a pipeline with Copy Activity using Data Factory Copy Wizard

Notes

Cet article s’applique à la version 1 de Data Factory.This article applies to version 1 of Data Factory. Si vous utilisez la version actuelle du service Data Factory, consultez le tutoriel sur l’activité de copie.If you are using the current version of the Data Factory service, see copy activity tutorial.

Ce tutoriel vous montre comment utiliser l’Assistant de copie pour copier des données à partir d’un stockage Blob Azure dans une base de données Azure SQL.This tutorial shows you how to use the Copy Wizard to copy data from an Azure blob storage to an Azure SQL database.

L’Assistant de copie Azure Data Factory vous permet de créer rapidement un pipeline de données qui copie les données d’un magasin de données source pris en charge dans un magasin de données de destination pris en charge.The Azure Data Factory Copy Wizard allows you to quickly create a data pipeline that copies data from a supported source data store to a supported destination data store. Par conséquent, nous vous recommandons d’utiliser l’Assistant en vue de créer un exemple de pipeline pour votre scénario de déplacement de données.Therefore, we recommend that you use the wizard as a first step to create a sample pipeline for your data movement scenario. Pour obtenir la liste des magasins de données pris en charge en tant que sources et destinations, consultez Magasins de données pris en charge .For a list of data stores supported as sources and as destinations, see supported data stores.

Ce didacticiel vous montre comment créer une fabrique de données Azure, lancer l’Assistant Copie et suivre une série d’étapes pour fournir des informations sur votre scénario d’ingestion/déplacement de données.This tutorial shows you how to create an Azure data factory, launch the Copy Wizard, go through a series of steps to provide details about your data ingestion/movement scenario. Une fois les étapes de l’Assistant terminées, celui-ci crée automatiquement un pipeline avec une activité de copie pour copier des données d’un stockage Blob Azure à une base de données Azure SQL.When you finish steps in the wizard, the wizard automatically creates a pipeline with a Copy Activity to copy data from an Azure blob storage to an Azure SQL database. Pour plus d’informations sur l’activité de copie, consultez Activités de déplacement des données.For more information about Copy Activity, see data movement activities.

PrérequisPrerequisites

Assurez-vous que vous respectez la configuration requise décrite dans l’article Vue d’ensemble du didacticiel avant de suivre ce didacticiel.Complete prerequisites listed in the Tutorial Overview article before performing this tutorial.

Créer une fabrique de donnéesCreate data factory

Dans cette étape, vous allez utiliser le portail Azure pour créer une fabrique de données Azure nommée ADFTutorialDataFactory.In this step, you use the Azure portal to create an Azure data factory named ADFTutorialDataFactory.

  1. Connectez-vous au portail Azure.Log in to Azure portal.

  2. Cliquez sur Créer une ressource en haut à gauche, cliquez sur Données + analyse, puis sur Data Factory.Click Create a resource from the top-left corner, click Data + analytics, and click Data Factory.

    Nouveau -> DataFactory

  3. Dans le panneau Nouvelle fabrique de données :In the New data factory blade:

    1. Entrez ADFTutorialDataFactory comme nom.Enter ADFTutorialDataFactory for the name. Le nom de la fabrique de données Azure doit être un nom global unique.The name of the Azure data factory must be globally unique. Si l’erreur Data factory name “ADFTutorialDataFactory” is not available s’affiche, changez le nom de la fabrique de données (par exemple, votrenomADFTutorialDataFactoryAAAAMMJJ), puis tentez de la recréer.If you receive the error: Data factory name “ADFTutorialDataFactory” is not available, change the name of the data factory (for example, yournameADFTutorialDataFactoryYYYYMMDD) and try creating again. Consultez la rubrique Data Factory - Règles d’affectation des noms pour savoir comment nommer les artefacts Data Factory.See Data Factory - Naming Rules topic for naming rules for Data Factory artifacts.

      Nom de la fabrique de données indisponible

    2. Sélectionnez votre abonnementAzure.Select your Azure subscription.

    3. Pour Groupe de ressources, effectuez l’une des opérations suivantes :For Resource Group, do one of the following steps:

      • Sélectionnez Utiliser l’existant pour sélectionner un groupe de ressources existant.Select Use existing to select an existing resource group.

      • Sélectionnez Créer un nouveau pour entrer un nom pour un groupe de ressources.Select Create new to enter a name for a resource group.

        Certaines étapes de ce tutoriel utilisent le nom : ADFTutorialResourceGroup pour le groupe de ressources.Some of the steps in this tutorial assume that you use the name: ADFTutorialResourceGroup for the resource group. Pour plus d’informations sur les groupes de ressources, consultez Utilisation des groupes de ressources pour gérer vos ressources Azure.To learn about resource groups, see Using resource groups to manage your Azure resources.

    4. Sélectionnez un emplacement pour la fabrique de données.Select a location for the data factory.

    5. Sélectionnez la case à cocher Épingler au tableau de bord en bas du panneau.Select Pin to dashboard check box at the bottom of the blade.

    6. Cliquez sur Créer.Click Create.

      Panneau Nouvelle fabrique de données

  4. Une fois la création terminée, le panneau Data Factory s’affiche comme sur l’image suivante :After the creation is complete, you see the Data Factory blade as shown in the following image:

    Page d’accueil Data Factory

Lancer l’Assistant CopieLaunch Copy Wizard

  1. Dans le panneau Fabrique de données, cliquez sur Copier les données pour lancer l’Assistant de copie.On the Data Factory blade, click Copy data to launch the Copy Wizard.

    Notes

    Si vous voyez que le navigateur web est bloqué au niveau « Autorisation... », désactivez/décochez l’option Block third party cookies and site data (Bloquer les cookies et les données de site tiers) dans les paramètres du navigateur (ou) laissez cette option activée et créez une exception pour login.microsoftonline.com, puis essayez de relancer l’Assistant.If you see that the web browser is stuck at "Authorizing...", disable/uncheck Block third-party cookies and site data setting in the browser settings (or) keep it enabled and create an exception for login.microsoftonline.com and then try launching the wizard again.

  2. Dans la page Propriétés :In the Properties page:

    1. Saisissez CopyFromBlobToAzureSql dans Nom de la tâche.Enter CopyFromBlobToAzureSql for Task name

    2. Saisissez une Description (facultative).Enter description (optional).

    3. Modifiez les champs Date et heure de début et Date et heure de fin de manière à définir la date de fin sur la date du jour et la date de début cinq jours plus tôt.Change the Start date time and the End date time so that the end date is set to today and start date to five days earlier.

    4. Cliquez sur Suivant.Click Next.

      Outil de copie - page Propriétés

  3. Dans la page Source data store (Magasin de données source), cliquez sur la vignette Stockage d’objets blob Azure.On the Source data store page, click Azure Blob Storage tile. Cette page sert à spécifier le magasin de données source pour la tâche de copie.You use this page to specify the source data store for the copy task.

    Outil de copie - page Source data store (Magasin de données source)

  4. Dans la page Specify the Azure Blob storage account (Spécifier le compte de stockage d’objets blob Azure) :On the Specify the Azure Blob storage account page:

    1. Saisissez AzureStorageLinkedService dans Nom du service lié.Enter AzureStorageLinkedService for Linked service name.

    2. Vérifiez que l’option À partir des abonnements est sélectionnée pour Account selection method (Méthode de sélection du compte).Confirm that From Azure subscriptions option is selected for Account selection method.

    3. Sélectionnez votre abonnementAzure.Select your Azure subscription.

    4. Sélectionnez un compte de stockage Azure dans la liste des comptes de stockage Azure disponibles dans l’abonnement sélectionné.Select an Azure storage account from the list of Azure storage accounts available in the selected subscription. Vous pouvez également choisir de saisir manuellement les paramètres du compte de stockage en sélectionnant l’option Saisir manuellement dans Account selection method (Méthode de sélection de compte). Cliquez ensuite sur Suivant.You can also choose to enter storage account settings manually by selecting Enter manually option for the Account selection method, and then click Next.

      Outil de copie - spécifiez le compte de stockage d’objets blob Azure

  5. Dans la page Choose the input file or folder (Choisir le fichier ou le dossier d’entrée) :On Choose the input file or folder page:

    1. Double-cliquez sur adftutorial (dossier).Double-click adftutorial (folder).

    2. Sélectionnez emp.txt, puis cliquez sur Choisir.Select emp.txt, and click Choose

      Outil de copie - choisissez le fichier ou le dossier d’entrée

  6. Sur la page Choose the input file or folder (Choisir le fichier ou le dossier d’entrée) , cliquez sur Suivant.On the Choose the input file or folder page, click Next. Ne sélectionnez pas copie binaire.Do not select Binary copy.

    Outil de copie - choisissez le fichier ou le dossier d’entrée

  7. Dans la page File format settings (Paramètres de format de fichier), vous pouvez voir les délimiteurs et le schéma qui sont détectés automatiquement par l’Assistant en analysant le fichier.On the File format settings page, you see the delimiters and the schema that is auto-detected by the wizard by parsing the file. Vous pouvez également entrer les délimiteurs manuellement pour que l’Assistant copie arrête leur détection automatique ou pour remplacer les délimiteurs détectés.You can also enter the delimiters manually for the copy wizard to stop auto-detecting or to override. Une fois que vous avez vérifié les délimiteurs et afficher un aperçu des données, cliquez sur Suivant.Click Next after you review the delimiters and preview data.

    Outil de copie - Paramètres de format de fichier

  8. Dans la page de la banque de données de destination, cliquez sur la vignette Azure SQL Database, puis sur Suivant.On the Destination data store page, select Azure SQL Database, and click Next.

    Outil de copie - Choisir une banque de destination

  9. Dans la page Specify the Azure SQL database (Spécifier la base de données Azure SQL Database) :On Specify the Azure SQL database page:

    1. Saisissez AzureSqlLinkedService dans le champ Nom de la connexion.Enter AzureSqlLinkedService for the Connection name field.

    2. Vérifiez que l’option À partir des abonnements est sélectionnée pour Server / database selection method (Méthode de sélection du serveur/de la base de données).Confirm that From Azure subscriptions option is selected for Server / database selection method.

    3. Sélectionnez votre abonnementAzure.Select your Azure subscription.

    4. Sélectionnez le Nom du serveur et la Base de données.Select Server name and Database.

    5. Saisissez le Nom d’utilisateur et le Mot de passe.Enter User name and Password.

    6. Cliquez sur Suivant.Click Next.

      Outil de copie - Spécifier la base de données Azure SQL

  10. Dans la page Mappage de table, sélectionnez emp dans la liste déroulante du champ Destination, puis cliquez sur Flèche vers le bas (facultatif) pour afficher le schéma et un aperçu des données.On the Table mapping page, select emp for the Destination field from the drop-down list, click down arrow (optional) to see the schema and to preview the data.

    Outil de copie - Mappage de Table

  11. Dans la page Mappage de schéma cliquez sur Suivant.On the Schema mapping page, click Next.

    Outil de copie - Mappage de schéma

  12. Dans la page Paramètres de performances cliquez sur Suivant.On the Performance settings page, click Next.

    Outil de copie - Paramètres de performances

  13. Passez en revue les informations contenues dans la page Résumé, puis cliquez sur Terminer.Review information in the Summary page, and click Finish. L’Assistant crée deux services liés, deux jeux de données (entrée et sortie) et un pipeline dans la fabrique de données (d’où vous avez lancé l’Assistant Copie).The wizard creates two linked services, two datasets (input and output), and one pipeline in the data factory (from where you launched the Copy Wizard).

    Outil de copie - Paramètres de performances

Lancer l’application Surveiller et gérerLaunch Monitor and Manage application

  1. Dans la page Déploiement, cliquez sur le lien : Click here to monitor copy pipeline.On the Deployment page, click the link: Click here to monitor copy pipeline.

    Outil de copie - Déploiement réussi

  2. L’application d’analyse est lancée dans un onglet distinct de votre navigateur web.The monitoring application is launched in a separate tab in your web browser.

    Application de surveillance

  3. Pour afficher le dernier état des tranches horaires, cliquez sur le bouton Actualiser dans la liste FENÊTRES D’ACTIVITÉ en bas.To see the latest status of hourly slices, click Refresh button in the ACTIVITY WINDOWS list at the bottom. Cette opération affiche cinq fenêtres d’activité pour cinq jours entre les heures de début et de fin du pipeline.You see five activity windows for five days between start and end times for the pipeline. Comme la liste n’est pas actualisée automatiquement, vous devrez peut-être cliquer sur Actualiser plusieurs fois avant que toutes les fenêtres d’activité soient à l’état Prêt.The list is not automatically refreshed, so you may need to click Refresh a couple of times before you see all the activity windows in the Ready state.

  4. Sélectionnez une fenêtre d’activité dans la liste.Select an activity window in the list. Affichez les informations la concernant dans l’Explorateur de fenêtres d’activité à droite.See the details about it in the Activity Window Explorer on the right.

    Détails de la fenêtre d’activité

    Notez que les dates, 11, 12, 13, 14 et 15 sont en vert, ce qui signifie que les tranches de sortie quotidiennes de ces dates ont déjà été produites.Notice that the dates 11, 12, 13, 14, and 15 are in green color, which means that the daily output slices for these dates have already been produced. Ce codage couleur apparaît également sur le pipeline et dans le jeu de données de sortie de la vue du diagramme.You also see this color coding on the pipeline and the output dataset in the diagram view. À l’étape précédente, notez que deux tranches ont déjà été produites et une tranche est en cours de traitement. Les deux autres sont en attente de traitement (comme l’indique le codage couleur).In the previous step, notice that two slices have already been produced, one slice is currently being processed, and the other two are waiting to be processed (based on the color coding).

    Pour plus d’informations sur l’utilisation de cette application, consultez l’article Surveiller et gérer les pipelines Azure Data Factory à l’aide de la nouvelle application de surveillance et de gestion.For more information on using this application, see Monitor and manage pipeline using Monitoring App article.

Étapes suivantesNext steps

Dans ce tutoriel, vous avez utilisé le stockage Blob Azure comme magasin de données source et une base de données Azure SQL comme banque de données de destination dans une opération de copie.In this tutorial, you used Azure blob storage as a source data store and an Azure SQL database as a destination data store in a copy operation. Le tableau ci-dessous contient la liste des magasins de données pris en charge en tant que sources et destinations par l’activité de copie :The following table provides a list of data stores supported as sources and destinations by the copy activity:

CatégorieCategory Banque de donnéesData store Prise en charge en tant que sourceSupported as a source Prise en charge en tant que récepteurSupported as a sink
Microsoft AzureAzure stockage d’objets blob AzureAzure Blob storage
  Azure Cosmos DB (API SQL)Azure Cosmos DB (SQL API)
  Azure Data Lake Storage Gen1Azure Data Lake Storage Gen1
  Azure SQL DatabaseAzure SQL Database
  Azure SQL Data WarehouseAzure SQL Data Warehouse
  Index Recherche AzureAzure Search Index
  Stockage Table AzureAzure Table storage
Bases de donnéesDatabases Amazon RedshiftAmazon Redshift
  DB2*DB2*
  MySQL*MySQL*
  Oracle*Oracle*
  PostgreSQL*PostgreSQL*
  SAP Business Warehouse*SAP Business Warehouse*
  SAP HANA*SAP HANA*
  SQL Server*SQL Server*
  Sybase*Sybase*
  Teradata*Teradata*
NoSQLNoSQL Cassandra*Cassandra*
  MongoDB*MongoDB*
FileFile Amazon S3Amazon S3
  Système de fichiers*File System*
  FTPFTP
  HDFS*HDFS*
  SFTPSFTP
AutresOthers HTTP génériqueGeneric HTTP
  OData génériqueGeneric OData
  ODBC générique*Generic ODBC*
  SalesforceSalesforce
  Table web (table HTML)Web Table (table from HTML)

Pour plus d’informations sur les champs/propriétés affichés dans l’Assistant de copie d’un magasin de données, cliquez sur le lien du magasin de données dans la table.For details about fields/properties that you see in the copy wizard for a data store, click the link for the data store in the table.