Quand utiliser Azure Data Factory

Effectué

Dans cette unité, nous allons voir comment déterminer si Azure Data Factory est une solution d’intégration de données adaptée à votre organisation. Nous allons évaluer Azure Data Factory selon les critères suivants :

  • Les exigences d’intégration de données
  • Les ressources de programmation
  • La prise en charge de plusieurs sources de données
  • La présence d’une infrastructure serverless

Critères de décision

Pour déterminer s’il est nécessaire d’utiliser Azure Data Factory, servez-vous des critères décrits dans le tableau suivant.

Critères Analyse
Avez-vous besoin d’une intégration de données ? Si votre organisation utilise des Big Data, ou s’il s’agit d’une organisation d’entreposage de données relationnelle classique, une solution d’intégration de données peut se révéler intéressante.
Avez-vous besoin de ressources de programmation ? Tous ceux qui utilisent des données n’ont pas forcément d’expérience en programmation. Certains préfèreront peut-être utiliser des outils graphiques qui fournissent des visualisations pour faciliter la création de tâches associées aux données sources.
Avez-vous besoin d’utiliser plusieurs sources de données ? Certaines organisations peuvent stocker leurs données brutes dans un large éventail de systèmes disparates, aussi bien locaux que dans le cloud. Une solution d’analytique données doit pouvoir se connecter facilement à de nombreuses sources de données.
Pouvez-vous créer et gérer des composants d’intégration de données séparés ? En l’absence d’un service managé pour l’analytique données, les entreprises doivent créer des composants personnalisés de déplacement des données. Elles peuvent également créer des services personnalisés pour intégrer leurs sources de données et leur traitement. L’intégration et la maintenance de ces systèmes peuvent être onéreuses et difficiles. En outre, tous les systèmes de ce type ne disposeront pas de la supervision, des alertes et des contrôles qu’offre un service complètement managé.

Appliquer les critères

Si vous prévoyez d’utiliser Azure Data Factory comme solution d’intégration de données, passez en revue les questions suivantes.

Avez-vous besoin d’une intégration de données ?

Si votre organisation est de petite taille et fonctionne avec des sources de données limitées, vous n’aurez peut-être pas besoin d’un service d’intégration de données. Toutefois, si votre organisation utilise des Big Data, ou s’il s’agit d’une organisation d’entreposage de données relationnelle classique, une solution d’intégration de données peut se révéler intéressante. Considérations importantes :

  • Les organisations Big Data utilisent des technologies qui permettent de gérer de grandes quantités de données diverses. Pour eux, Azure Data Factory constitue un moyen de créer et d’exécuter des pipelines dans le cloud. Ces pipelines peuvent accéder aux services de données cloud et locaux. Ces pipelines fonctionnent généralement avec des technologies comme Azure Synapse Analytics, les objets Blob Azure, Azure Data Lake, Azure HDInsight, Azure Databricks et Azure Machine Learning.
  • Les organisations d’entreposage de données relationnelles utilisent généralement des technologies comme SQL Server. SSIS est souvent utilisé pour créer des packages SSIS. Pour de telles organisations, Azure Data Factory offre la possibilité d’exécuter des packages SSIS sur Azure, ce qui leur permet d’accéder aux services de données cloud et locaux.

Avez-vous besoin de ressources de programmation ?

Si votre organisation ne dispose pas des ressources de programmation nécessaires pour créer les activités dont vous avez besoin, utilisez Azure Data Factory. Azure Data Factory fournit un processus impliquant peu de code, voire pas de code du tout, pour utiliser des sources de données et les activités associées. Par exemple, l’outil de création et de supervision Azure Data Factory vous permet de créer des pipelines de façon graphique en glissant-déposant des activités sur une aire de conception. La capture d’écran suivante montre l’interface dans laquelle un ingénieur données crée un pipeline avec plusieurs activités :

Screenshot that displays the Azure Data Factory authoring and monitoring tool.

Avez-vous besoin d’utiliser plusieurs sources de données ?

Si votre organisation a besoin d’accéder à des données provenant de plusieurs endroits et de plusieurs sources, vous devez envisager une solution d’intégration de données qui fournit cette prise en charge. Azure Data Factory utilise des connecteurs pour s’intégrer à des sources de données disparates. Il existe actuellement plus de 90 sources de données prises en charge. De plus, Azure Data Factory prend en charge des options extensibles pour atteindre des sources de données supplémentaires.

Pouvez-vous créer et gérer des composants d’intégration de données séparés ?

Il peut être extrêmement complexe et fastidieux de créer et de gérer votre propre solution d’intégration de données basée sur un serveur. Si vous envisagez d’exécuter une telle solution dans le centre de données de votre organisation, il n’est pas nécessaire d’envisager Azure Data Factory. Toutefois, l’utilisation d’une solution serverless complètement managée pour l’intégration de données présente des avantages. Voici les principaux avantages :

  • Possibilité d’effectuer une mise à l’échelle en fonction des besoins de manière à prendre en charge les charges de travail supplémentaires.
  • Vous n’avez pas besoin de déployer, configurer ni gérer des serveurs pour héberger vos charges de travail d’intégration de données.

Résumé

Pour résumer, vous devez envisager Azure Data Factory lorsque vous êtes concerné par un ou plusieurs des critères suivants :

  • Vos ingénieurs données n’ont pas le temps nécessaire pour créer du code permettant d’exécuter des tâches d’analytique données.
  • Vous avez plusieurs sources de données dans des emplacements disparates.
  • Vous souhaitez bénéficier d’une solution cloud complètement managée.