Azure Synapse Analytics: Häufig gestellte Fragen

In diesem Leitfaden finden Sie die am häufigsten gestellten Fragen zu Azure Synapse Analytics.

Allgemein

Wie kann ich RBAC-Rollen verwenden, um meinen Arbeitsbereich zu schützen?

Mit Azure Synapse werden verschiedene Rollen sowie Bereiche für deren Zuweisung eingeführt, um das Schützen Ihres Arbeitsbereichs zu vereinfachen.

RBAC-Rollen von Synapse:

  • Synapse-Administrator
  • Synapse SQL-Administrator
  • Synapse Spark-Administrator
  • Synapse-Mitwirkender (Vorschau)
  • Synapse-Artefaktherausgeber (Vorschau)
  • Synapse-Artefaktbenutzer (Vorschau)
  • Synapse-Compute-Operator (Vorschau)
  • Synapse-Anmeldeinformationen-Benutzer (Vorschau)

Weisen Sie die RBAC-Rollen den folgenden RBAC-Bereichen zu, um Ihren Synapse-Arbeitsbereich zu schützen:

  • Arbeitsbereiche
  • Spark-Pools
  • Integration Runtimes
  • Verknüpfte Dienste
  • Anmeldeinformationen

Darüber hinaus verfügen Sie bei dedizierten SQL-Pools über alle Sicherheitsfunktionen, mit denen Sie bereits vertraut sind.

Wie kann ich dedizierte SQL-Pools, serverlose SQL-Pools und serverlose Spark-Pools steuern?

Der Ausgangspunkt ist, dass von Azure Synapse die integrierte Kostenanalyse und die Kostenwarnungen auf Azure-Abonnementebene genutzt werden.

  • Dedizierte SQL-Pools: Sie verfügen über direkten Einblick in die Kosten und besitzen die Kontrolle darüber, weil Sie die dedizierten SQL-Pools erstellen und deren Größen angeben. Außerdem können Sie mit Azure RBAC-Rollen steuern, welche Benutzer dedizierte SQL-Pools erstellen oder skalieren können.

  • Serverlose SQL-Pools: Sie verfügen über Tools für die Überwachung und Kostenkontrolle, mit denen Sie die täglichen, wöchentlichen und monatlichen Ausgaben begrenzen können. Weitere Informationen finden Sie unter Kostenverwaltung für serverlose SQL-Pools in Azure Synapse Analytics.

  • Serverlose Spark-Pools: Sie können mit Synapse-RBAC-Rollen einschränken, wer Spark-Pools erstellen kann.

Verfügt der Synapse-Arbeitsbereich in der Phase „Allgemeine Verfügbarkeit“ über Unterstützung für die Anordnung von Objekten in Ordnern und der Granularität?

Für Synapse-Arbeitsbereiche werden benutzerdefinierte Ordner unterstützt.

Kann ich mehrere Power BI-Arbeitsbereiche mit einem einzelnen Azure Synapse-Arbeitsbereich verknüpfen?

Derzeit können Sie mit einem Azure Synapse-Arbeitsbereich nur einen Power BI-Arbeitsbereich verknüpfen.

Synapse Link für Apache Spark befindet sich in der Phase „Allgemeine Verfügbarkeit“. Synapse Link für serverlose SQL-Pools befindet sich in der öffentlichen Vorschauphase.

Wird für den Azure Synapse-Arbeitsbereich CI/CD unterstützt?

Ja! Alle Pipelineartefakte, Notebooks, SQL-Skripts und Spark-Auftragsdefinitionen werden sich in Git befinden. Alle Pooldefinitionen werden in Git als ARM-Vorlagen (Azure Resource Manager) gespeichert. Dedizierte SQL-Poolobjekte (Schemas, Tabellen, Sichten usw.) werden über Datenbankprojekte mit CI/CD-Unterstützung verwaltet.

Pipelines

Wie kann ich ermitteln, welche Anmeldeinformationen zum Ausführen einer Pipeline verwendet werden?

Jede Aktivität in einer Synapse-Pipeline wird mit den Anmeldeinformationen ausgeführt, die im verknüpften Dienst angegeben sind.

Werden SSIS IRs in Synapse Integrate unterstützt?

Derzeit leider nicht.

Wie kann ich vorhandene Pipelines aus Azure Data Factory zu einem Azure Synapse-Arbeitsbereich migrieren?

Aktuell müssen Sie Ihre Azure Data Factory-Pipelines und die zugehörigen Artefakte manuell neu erstellen, indem Sie den JSON-Code aus der ursprünglichen Pipeline exportieren und in Ihren Synapse-Arbeitsbereich importieren.

Apache Spark

Worin besteht der Unterschied zwischen Apache Spark für Synapse und Apache Spark?

Apache Spark für Synapse ist mit Apache Spark identisch, verfügt aber zusätzlich über Unterstützung für Integrationen mit anderen Diensten (AAD, Azure ML usw.) und zusätzliche Bibliotheken (mssparkutils, Hummingbird) sowie vorab optimierte Leistungskonfigurationen.

Alle Workloads, die zurzeit unter Apache Spark ausgeführt werden, werden ohne Änderungen auch unter Apache Spark für Azure Synapse ausgeführt.

Welche Versionen von Spark sind verfügbar?

Azure Synapse Apache Spark verfügt über umfassende Unterstützung von Spark 2.4. Eine vollständige Liste mit den Kernkomponenten und den zurzeit unterstützten Versionen finden Sie unter Versionsunterstützung für Apache Spark.

Gibt es in Azure Synapse Spark eine Option, die DBUtils entspricht?

Ja. Azure Synapse Apache Spark verfügt über die Bibliothek mssparkutils. Die vollständige Dokumentation zum Hilfsprogramm finden Sie unter Einführung in Microsoft Spark-Hilfsprogramme.

Wie lege ich Sitzungsparameter in Apache Spark fest?

Verwenden Sie zum Festlegen von Sitzungsparametern den verfügbaren Magic-Befehl „%%configure“. Damit die Parameter wirksam werden, ist ein Neustart der Sitzung erforderlich.

Wie kann ich in einem serverlosen Spark-Pool Parameter für die Clusterebene festlegen?

Zum Festlegen von Parametern für die Clusterebene können Sie eine „spark.conf“-Datei für den Spark-Pool angeben. Vom Pool werden dann die Parameter berücksichtigt, die in der Konfigurationsdatei enthalten sind.

Kann ich einen Spark-Cluster mit mehreren Benutzern in Azure Synapse Analytics ausführen?

Azure Synapse verfügt über zweckgebundene Engines für bestimmte Anwendungsfälle. Apache Spark für Synapse wurde als Auftragsdienst und nicht als Clustermodell konzipiert. Es gibt zwei Szenarien, in denen ein mehrbenutzerfähiges Clustermodell benötigt wird.

Szenario 1: Viele Benutzer greifen auf einen Cluster zu, um Daten für BI-Zwecke bereitzustellen.

Die einfachste Lösungsmöglichkeit ist das Aufbereiten der Daten mit Spark und die anschließende Nutzung der Bereitstellungsfunktionen von Synapse SQL, damit für Power BI eine Verbindung mit diesen Datasets hergestellt werden kann.

Szenario 2: In einem Cluster sind mehrere Entwickler angeordnet, um Kosten zu sparen.

Bei diesem Szenario sollte für jeden Entwickler ein serverloser Spark-Pool vorhanden sein, für den die Nutzung einer geringen Zahl von Spark-Ressourcen festgelegt ist. Da für serverlose Spark-Pools erst dann Kosten anfallen, wenn sie aktiv genutzt werden, kann bei mehreren vorhandenen Entwicklern eine Kostenreduzierung erzielt werden. Von den Pools werden Metadaten (Spark-Tabellen) gemeinsam genutzt, damit die Zusammenarbeit leicht möglich ist.

Wie kann ich Bibliotheken einfügen, verwalten und installieren?

Sie können externe Pakete mit der Datei „requirements.txt“ über den Synapse-Arbeitsbereich oder das Azure-Portal installieren, während Sie den Spark-Pool erstellen. Weitere Informationen finden Sie unter Verwalten von Bibliotheken für Apache Spark in Azure Synapse Analytics.

Dedizierte SQL-Pools

Welche Funktionsunterschiede gibt es zwischen dedizierten SQL-Pools und serverlosen Pools?

Eine vollständige Liste mit den Unterschieden finden Sie unter T-SQL-Funktionsunterschiede in Synapse SQL.

Da Azure Synapse jetzt allgemein verfügbar ist: Wie kann ich meine dedizierten SQL-Pools, die bisher eigenständig waren, nach Azure Synapse verschieben?

Eine „Verschiebung“ oder „Migration“ ist nicht möglich. Sie können auswählen, dass neue Arbeitsbereichsfeatures für Ihre vorhandenen Pools aktiviert werden sollen. Wenn Sie so vorgehen, kommt es nicht zu Breaking Changes, sondern Sie können die neuen Features nutzen, z. B. Synapse Studio, Spark und serverlose SQL-Pools.

Wie sieht die Standardbereitstellung von dedizierten SQL-Pools jetzt aus?

Standardmäßig werden alle neuen dedizierten SQL-Pools in einem Arbeitsbereich bereitgestellt. Bei Bedarf können Sie aber trotzdem noch einen dedizierten SQL-Pool (vormals SQL DW) basierend auf dem Formfaktor „Eigenständig“ erstellen.

Netzwerksicherheit

Gewusst wie: Sichern des Zugriffs auf meinen Azure Synapse-Arbeitsbereich

Sowohl mit als auch ohne ein verwaltetes virtuelles Netzwerk können Sie aus öffentlichen Netzwerken eine Verbindung mit Ihrem Arbeitsbereich herstellen. Weitere Informationen finden Sie unter Konnektivitätseinstellungen. Der Zugriff aus öffentlichen Netzwerken lässt sich kontrollieren, indem Sie das Feature für den Zugriff auf öffentliche Netzwerke oder die Arbeitsbereichsfirewall aktivieren. Alternativ können Sie auch über einen verwalteten privaten Endpunkt und Private Link eine Verbindung mit Ihrem Arbeitsbereich herstellen. Synapse-Arbeitsbereiche ohne das verwaltete virtuelle Netzwerk von Azure Synapse Analytics können keine Verbindung über verwaltete private Endpunkte herstellen.