Erste Schritte bei der Bereitstellung von Big Data-Cluster für SQL Server

Anwendungsbereich: JaSQL Server 2019 (15.x)

In diesem Artikel finden Sie eine Übersicht über die Bereitstellung von Big Data-Cluster für SQL Server. Er bietet eine Einführung in Konzepte und einen Rahmen für das Verständnis der Bereitstellungsszenarios. Die konkreten Schritte für die Bereitstellung hängen von der Plattform ab, die Sie für den Client und Server ausgewählt haben. Eine Einführung in Big Data-Cluster für SQL Server finden Sie unter SQL Server 2019: Big Data-Cluster.

Weitere SQL Server-Bereitstellungsszenarios finden Sie unter:

Kurze Einführung

Sehen Sie sich dieses 9-minütige Video an, um einen Überblick über die Bereitstellung von Big Data Clustern zu erhalten:

Tipp

Verwenden Sie eines der Beispielskripts aus dem Abschnitt zu Skripts, um schnell eine Umgebung mit Kubernetes und einem Big Data-Cluster bereitzustellen, damit Sie die Funktionen kennenlernen können. Verwenden Sie nach der Bereitstellung die Clienttools aus dem folgenden Abschnitt, um den Cluster zu verwalten.

Clienttools

Für die Bereitstellung von Big-Data-Clustern benötigen Sie eine Reihe von bestimmten Clienttools. Installieren Sie die folgenden, für die Bereitstellung erforderlichen Tools, bevor Sie Big Data-Cluster in Kubernetes bereitstellen. Für die unterschiedlichen Szenarios sind jeweils bestimmte Tools erforderlich. Welche Tools für eine bestimmte Aufgabe erforderlich sind, erfahren Sie im jeweiligen Artikel. Eine vollständige Liste der Tools und Installationslinks finden Sie unter Install SQL Server 2019 big data tools (Installieren von Big-Data-Tools für SQL Server 2019).

Kubernetes

Big-Data-Cluster werden als eine Reihe von miteinander verbundenen Containern bereitgestellt, die in Kubernetes verwaltet werden. In Kubernetes stehen Ihnen verschiedene Hostingmöglichkeiten zur Verfügung. Auch wenn Sie bereits über eine vorhandene Kubernetes-Umgebung verfügen, sollten Sie die entsprechenden Anforderungen für Big-Data-Cluster überprüfen.

  • Azure Kubernetes Service (AKS) : Mit AKS können Sie einen verwalteten Kubernetes-Cluster in Azure bereitstellen. Sie verwalten und warten nur die Agent-Knoten. Sie müssen mit AKS keine eigene Hardware für den Cluster bereitstellen. Außerdem können Sie mithilfe eines Python-Skripts oder eines Notebooks für die Bereitstellung in einem einzigen Schritt den AKS-Cluster erstellen und den Big-Data-Cluster bereitstellen. Weitere Informationen zum Konfigurieren von AKS für die Bereitstellung eines Big Data-Clusters finden Sie unter Konfigurieren von Azure Kubernetes Service für SQL Server 2019: Big Data-Cluster-Bereitstellungen.

  • Azure Red Hat OpenShift (ARO): Mit ARO können Sie einen verwalteten Red Hat OpenShift-Cluster in Azure bereitstellen. Sie verwalten und warten nur die Agent-Knoten. Sie müssen mit ARO keine eigene Hardware für den Cluster bereitstellen. Außerdem können Sie mithilfe eines Python-Skripts in einem einzigen Schritt den ARO-Cluster erstellen und den Big Data-Cluster bereitstellen. Dieses Bereitstellungsmodell wurde in SQL Server 2019 CU5 eingeführt.

  • Mehrere Computer: Sie können Kubernetes auch auf mehreren Linux-Computern bereitstellen. Dabei kann es sich um physische Server oder virtuelle Computer handeln. Den Kubernetes-Cluster können Sie mithilfe des Tools kubeadm erstellen. Diese Art der Bereitstellung können Sie mit einem Bash-Skript automatisieren. Diese Methode eignet sich hervorragend, wenn Sie bereits über eine vorhandene Infrastruktur verfügen, die Sie für den Big-Data-Cluster verwenden möchten. Weitere Informationen zur Verwendung von kubeadm-Bereitstellungen mit Big Data-Clustern finden Sie unter Konfigurieren von Kubernetes auf mehreren Computern für SQL Server 2019: Big Data-Cluster-Bereitstellungen.

  • Red Hat OpenShift: Ermöglicht die Bereitstellung in Ihrem eigenen Red Hat OpenShift-Cluster. Weitere Informationen finden Sie unter Bereitstellen von Big Data-Cluster für SQL Server lokal auf OpenShift und Azure Red Hat OpenShift. Dieses Bereitstellungsmodell wurde in SQL Server 2019 CU5 eingeführt.

Bereitstellen von Big Data-Clustern

Nach der Konfiguration von Kubernetes stellen Sie mit dem Befehl azdata bdc create einen Big-Data-Cluster bereit. Für die Bereitstellung gibt es verschiedene Ansätze:

Bereitstellungsskripts

Mithilfe von Bereitstellungsskripts können Sie Kubernetes und Big-Data-Cluster in einem einzigen Schritt bereitstellen. Häufig enthalten Bereitstellungsskripts auch Standardwerte für die Einstellungen von Big-Data-Clustern. Sie können ein Bereitstellungsskript auch anpassen, indem Sie Ihre eigene Version erstellen, mit der die Bereitstellung des Big-Data-Clusters anders konfiguriert wird.

Folgende Bereitstellungsskripts sind derzeit verfügbar:

Bereitstellungsnotebooks

Sie können Big-Data-Cluster auch über die Ausführung eines Azure Data Studio-Notebooks bereitstellen. Weitere Informationen zur Bereitstellung in AKS mithilfe eines Notebooks finden Sie im folgenden Artikel:

Nächste Schritte

Nachdem Sie einen Big-Data-Cluster erfolgreich bereitgestellt haben, stellen Sie nun eine Verbindung mit dem Cluster her, und laden Sie Beispieldaten für die weitere Verwendung in verschiedenen exemplarischen Vorgehensweisen.