Bien démarrer avec le déploiement de Clusters Big Data SQL Server

Article
03/21/2023

S’applique à : SQL Server 2019 (15.x)

Important

Le module complémentaire Clusters Big Data Microsoft SQL Server 2019 sera mis hors service. La prise en charge de la plateforme Clusters Big Data Microsoft SQL Server 2019 se terminera le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme, et le logiciel continuera à être maintenu par les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Cet article présente une vue d’ensemble de la façon de déployer des Clusters Big Data SQL Server. L’article présente les concepts et fournit un cadre pour vous aider à comprendre les scénarios de déploiement. Les étapes de déploiement varient selon la plateforme choisie pour le client et le serveur. Pour une présentation des Clusters Big Data SQL Server, consultez Clusters de Big Data SQL Server 2019

Pour d’autres scénarios de déploiement de SQL Server, consultez :

Présentation rapide

Regardez cette vidéo de 9 minutes pour obtenir une vue d’ensemble de la façon de déployer des clusters Big Data :

Conseil

Pour obtenir rapidement un environnement avec Kubernetes et déployer un cluster Big Data afin de vous aider à bénéficier de ses capacités, utilisez l’un des exemples de scripts désignés dans la section des scripts. Après le déploiement, pour gérer le cluster, utilisez les outils clients dans la section suivante.

Outils clients

Les clusters Big Data nécessitent un ensemble spécifique d’outils clients. Avant de déployer un cluster Big Data sur Kubernetes, vous devez installer les outils nécessaires à votre déploiement. Des outils spécifiques sont requis pour divers scénarios. Chaque article doit expliquer les outils prérequis permettant d’effectuer différentes tâches. Pour obtenir la liste complète des outils et des liens d’installation, consultez Installer les outils de Big Data SQL Server 2019.

Kubernetes

Les clusters Big Data sont déployés sous la forme d’une série de conteneurs interdépendants qui sont gérés dans Kubernetes. Vous pouvez héberger Kubernetes de différentes façons. Même si vous disposez déjà d’un environnement Kubernetes, vous devez passer en revue les conditions requises relatives aux clusters Big Data.

Azure Kubernetes Service (AKS) : AKS vous permet de déployer un cluster Kubernetes géré dans Azure. Vous gérez uniquement les nœuds de l’agent. Avec AKS, vous n’avez pas besoin de provisionner votre matériel pour le cluster. Il est aussi facile d’utiliser un script Python ou un notebook de déploiement pour créer le cluster AKS et déployer le cluster Big Data en une seule étape. Pour plus d’informations sur la configuration d’AKS en vue d’un déploiement de cluster Big Data, consultez Configurer Azure Kubernetes Service pour le déploiement de Clusters de Big Data SQL Server 2019.
Azure Red Hat OpenShift (ARO) : ARO vous permet de déployer un cluster Red Hat OpenShift géré dans Azure. Vous gérez uniquement les nœuds de l’agent. Avec ARO, vous n’avez pas besoin de provisionner votre matériel pour le cluster. Il est aussi facile d’utiliser un script Python pour créer le cluster ARO et déployer le cluster Big Data en une seule étape. Ce modèle de déploiement est introduit dans SQL Server 2019 CU5.
Plusieurs machines : Vous pouvez également déployer Kubernetes sur plusieurs machines Linux, qui peuvent être des serveurs physiques ou des machines virtuelles. L’outil kubeadm peut être utilisé pour créer le cluster Kubernetes. Vous pouvez utiliser un script bash pour automatiser ce type de déploiement. Cette méthode fonctionne bien si vous disposez déjà d’une infrastructure existante que vous souhaitez utiliser pour votre cluster Big Data. Pour plus d’informations sur l’utilisation de déploiements kubeadm avec des clusters Big Data, consultez Configurer Kubernetes sur plusieurs machines pour le déploiement de Clusters de Big Data SQL Server 2019.
Red Hat OpenShift : Déploiement sur votre propre cluster Red Hat OpenShift. Pour plus d’informations, voir Déploiement de Clusters Big Data SQL Server sur OpenShift en local et sur Azure Red Hat OpenShift. Ce modèle de déploiement est introduit dans SQL Server 2019 CU5.

Déployer un cluster Big Data

Après avoir configuré Kubernetes, vous devez déployer un cluster Big Data à l’aide de la commande azdata bdc create. Lors du déploiement, plusieurs méthodes sont possibles.

Si vous effectuez un déploiement sur un environnement Dev/Test, vous pouvez choisir d’utiliser l’une des configurations par défaut fournies par azdata.
Pour personnaliser votre déploiement, vous pouvez créer et utiliser vos propres fichiers de configuration de déploiement.
Pour une installation totalement sans assistance, vous pouvez passer tous les autres paramètres dans des variables d’environnement. Pour plus d’informations, consultez Déploiements sans assistance.

Scripts de déploiement

Les scripts de déploiement vous permettent de déployer les clusters Kubernetes et Big Data en une seule étape. Ils fournissent également souvent des valeurs par défaut pour les paramètres des clusters Big Data. Vous pouvez personnaliser n’importe quel script de déploiement de cluster Big Data.

Les scripts de déploiement actuellement disponibles sont les suivants :

Notebooks de déploiement

Vous pouvez également déployer un cluster Big Data en exécutant un notebook Azure Data Studio. Pour plus d’informations sur l’utilisation d’un notebook pour un déploiement sur AKS, consultez l’article suivant :

Déployer un cluster Big Data avec des notebooks Azure Data Studio.

Étapes suivantes

Une fois que vous avez réussi à déployer un cluster Big Data, connectez-vous au cluster en vue de charger des exemples de données à utiliser dans le cadre de différentes procédures pas à pas.