Question 1

Wie kann ich RBAC-Rollen verwenden, um meinen Arbeitsbereich zu schützen?

Accepted Answer

Mit Azure Synapse werden verschiedene Rollen sowie Bereiche für deren Zuweisung eingeführt, um das Schützen Ihres Arbeitsbereichs zu vereinfachen.

RBAC-Rollen von Synapse:

Synapse-Administrator
Synapse SQL-Administrator
Synapse Spark-Administrator
Synapse-Mitwirkender
Herausgeber von Synapse-Artefakten
Benutzer von Synapse-Artefakten
Operator von Synapse-Computeressourcen
Synapse-Anmeldeinformationsbenutzer
Synapse-Manager für verknüpfte Daten
Synapse-Benutzer

Weisen Sie die RBAC-Rollen den folgenden RBAC-Bereichen zu, um Ihren Synapse-Arbeitsbereich zu schützen:

Arbeitsbereiche
Spark-Pools
Integration Runtimes
Verknüpfte Dienste
Anmeldeinformationen

Darüber hinaus verfügen Sie bei dedizierten SQL-Pools über alle Sicherheitsfunktionen, mit denen Sie bereits vertraut sind.

Question 2

Wie kann ich dedizierte SQL-Pools, serverlose SQL-Pools und serverlose Spark-Pools steuern?

Accepted Answer

Der Ausgangspunkt ist, dass von Azure Synapse die integrierte Kostenanalyse und die Kostenwarnungen auf Azure-Abonnementebene genutzt werden.

Dedizierte SQL-Pools: Sie verfügen über direkten Einblick in die Kosten und besitzen die Kontrolle darüber, weil Sie die dedizierten SQL-Pools erstellen und deren Größen angeben. Außerdem können Sie mit Azure RBAC-Rollen steuern, welche Benutzer dedizierte SQL-Pools erstellen oder skalieren können.
Serverlose SQL-Pools: Sie verfügen über Tools für die Überwachung und Kostenkontrolle, mit denen Sie die täglichen, wöchentlichen und monatlichen Ausgaben begrenzen können. Weitere Informationen finden Sie unter Kostenverwaltung für serverlose SQL-Pools in Azure Synapse Analytics.
Serverlose Spark-Pools: Sie können mit Synapse-RBAC-Rollen einschränken, wer Spark-Pools erstellen kann.

Question 3

Verfügt der Synapse-Arbeitsbereich in der Phase „Allgemeine Verfügbarkeit“ über Unterstützung für die Anordnung von Objekten in Ordnern und der Granularität?

Accepted Answer

Für Synapse-Arbeitsbereiche werden benutzerdefinierte Ordner unterstützt.

Question 4

Kann ich mehrere Power BI-Arbeitsbereiche mit einem einzelnen Azure Synapse-Arbeitsbereich verknüpfen?

Accepted Answer

Ja. Seit dem 10. Juni 2021 können Sie mit Synapse Studio einem Azure Synapse-Arbeitsbereich mehr als einen Power BI-Arbeitsbereich hinzufügen.

Question 5

Ist Azure Synapse Link zu Azure Cosmos DB allgemein verfügbar?

Accepted Answer

Azure Synapse Analytics unterstützt derzeit Azure Synapse Link von Azure Cosmos DB zu Synapse Apache Spark und serverlosen SQL-Pools. Azure Synapse Link für Apache Spark ist allgemein verfügbar. Synapse Link für serverlose SQL-Pools befindet sich in der öffentlichen Vorschauphase. Weitere Informationen finden Sie unter Azure Synapse Link für Azure Cosmos DB.

Question 6

Ist Azure Synapse Link für SQL allgemein verfügbar?

Accepted Answer

Azure Synapse Link für SQL ist für SQL Server 2022 und Azure SQL-Datenbank allgemein verfügbar. Weitere Informationen finden Sie unter Was ist Azure Synapse Link für SQL?

Question 7

Wird für den Azure Synapse-Arbeitsbereich CI/CD unterstützt?

Accepted Answer

Ja! Alle Pipelineartefakte, Notebooks, SQL-Skripts und Spark-Auftragsdefinitionen werden sich in Git befinden. Alle Pooldefinitionen werden in Git als ARM-Vorlagen (Azure Resource Manager) gespeichert. Dedizierte SQL-Pool-Objekte (Schemas, Tabellen, Views usw.) werden mit Datenbankprojekten mit CI/CD-Unterstützung verwaltet. Weitere Informationen finden Sie in diesem CI- und CD-Leitfaden.

Question 8

Welche Funktionsunterschiede gibt es zwischen dedizierten SQL-Pools und serverlosen Pools?

Accepted Answer

Die Fähigkeiten und Anforderungen unterscheiden sich zwischen den beiden Arten von Pools. Zu den Unterschieden gehören Datenbankobjekte, Abfragesprachenfähigkeiten, Sicherheit, Tools, Datenzugriff und Datenformat. Einen detaillierten Vergleich von SQL-Pools und serverlosen Pools finden Sie unter Poolvergleich. Für bewährte Methoden beim Verwenden eines poolstyps können Sie bewährte Methoden für Dedicated SQL-Pool und bewährte Methoden für serverlose SQL-Pool anzeigen.

Question 9

Was sind Delta-Tabellen, und warum sollte ich sie verwenden?

Accepted Answer

Lakehouse basiert auf offenen, direkt zugänglichen Datenformaten wie Apache Parquet. Es bietet erstklassige Unterstützung für maschinelles Lernen und Data Science. Eine Delta-Tabelle ist eine Ansicht von Daten, die in einem Delta Lake enthalten sind, der die meisten Optionen unterstützt, die von Apache Spark DataFrame-Lese- und Schreib-APIs bereitgestellt werden. Lakehouses kann bei großen Herausforderungen mit Data Warehouses helfen, wie z. B. Datenveraltung, Zuverlässigkeit, Gesamtbetriebskosten und Datensperre. Für Delta-Tabellen sind Optimierungen wie automatische Komprimierung und adaptive Abfragepläne verfügbar. Eine detaillierte Anleitung zum Delta Lake finden Sie im Delta Lake Guide.

Question 10

Was ist automatische Komprimierung?

Accepted Answer

Die automatische Komprimierung ist eine von zwei sich ergänzenden Funktionen der automatischen Optimierung für Delta-Tabellen. Nachdem ein Schreibvorgang in eine Tabelle erfolgreich war, kann die automatische Komprimierung Dateien für Partitionen weiter komprimieren, die die meisten kleinen Dateien enthalten. Die Aktivierung der automatischen Komprimierung wird für Streaming-Anwendungsfälle empfohlen, bei denen das Hinzufügen von Minuten Latenz akzeptabel ist und wenn Sie keine regelmäßigen OPTIMIZE-Aufrufe in Ihrer Tabelle haben. Weitere Informationen zur automatischen Optimierung finden Sie in diesem Leitfaden zur automatischen Optimierung.

Question 11

Wie kann ich ermitteln, welche Anmeldeinformationen zum Ausführen einer Pipeline verwendet werden?

Accepted Answer

Jede Aktivität in einer Synapse-Pipeline wird mit den Anmeldeinformationen ausgeführt, die im verknüpften Dienst angegeben sind.

Question 12

Werden SSIS IRs in Synapse Integrate unterstützt?

Accepted Answer

Derzeit leider nicht.

Question 13

Wie unterscheiden sich Azure Data Factory-Pipelines und Azure Synapse-Pipelines?

Accepted Answer

Einige Beispiele für Unterschiede sind die Unterstützung globaler Parameter, die Überwachung von Spark-Jobs für den Datenfluss und die gemeinsame Nutzung der Integration Runtime. Weitere Informationen finden Sie in diesem Dokument für die Datenintegration – Synapse vs ADF.

Question 14

Wie kann ich vorhandene Pipelines aus Azure Data Factory zu einem Azure Synapse-Arbeitsbereich migrieren?

Accepted Answer

Aktuell müssen Sie Ihre Azure Data Factory-Pipelines und die zugehörigen Artefakte manuell neu erstellen, indem Sie den JSON-Code aus der ursprünglichen Pipeline exportieren und in Ihren Synapse-Arbeitsbereich importieren.

Question 15

Gewusst wie ich eine Apache Spark-Auftragsdefinition verwende?

Accepted Answer

Schauen Sie sich die Schnellstartanleitung an.

Question 16

Kann ich Notebooks aus ADF-Pipelines aufrufen?

Accepted Answer

Für diesen Anwendungsfall gibt es zwei Möglichkeiten. Eine Option besteht darin, Pipelines in ADF zu belassen, und Sie müssen eine Webaktivität einschließen. Weitere Informationen zu dieser Option finden Sie in diesem Webaktivitätshandbuch. Die andere Möglichkeit besteht darin, die Pipelines zu Synapse zu migrieren. Weitere Informationen zur zweiten Option finden Sie in diesem Migrationscodebeispiel.

Question 17

Worin besteht der Unterschied zwischen Apache Spark für Synapse und Apache Spark?

Accepted Answer

Apache Spark für Synapse ist mit Apache Spark identisch, verfügt aber zusätzlich über Unterstützung für Integrationen mit anderen Diensten (Microsoft Entra ID, Azure ML usw.) und zusätzliche Bibliotheken (mssparkutils, Hummingbird) sowie vorab optimierte Leistungskonfigurationen.

Alle Workloads, die zurzeit unter Apache Spark ausgeführt werden, werden ohne Änderungen auch unter Apache Spark für Azure Synapse ausgeführt.

Question 18

Welche Versionen von Spark sind verfügbar?

Accepted Answer

Seit September 2023 unterstützt Azure Synapse Apache Spark vollständig Spark 3.3. Eine vollständige Liste der Kernkomponenten und derzeit unterstützten Versionen finden Sie unter Apache Spark-Versionsunterstützung.

Question 19

Gibt es in Azure Synapse Spark eine Option, die DBUtils entspricht?

Accepted Answer

Ja. Azure Synapse Apache Spark verfügt über die Bibliothek mssparkutils. Die vollständige Dokumentation zum Hilfsprogramm finden Sie unter Einführung in Microsoft Spark-Hilfsprogramme.

Question 20

Wie lege ich Sitzungsparameter in Apache Spark fest?

Accepted Answer

Verwenden Sie zum Festlegen von Sitzungsparametern den verfügbaren Magic-Befehl „%%configure“. Damit die Parameter wirksam werden, ist ein Neustart der Sitzung erforderlich.

Question 21

Wie kann ich in einem serverlosen Spark-Pool Parameter für die Clusterebene festlegen?

Accepted Answer

Zum Festlegen von Parametern für die Clusterebene können Sie eine „spark.conf“-Datei für den Spark-Pool angeben. Vom Pool werden dann die Parameter berücksichtigt, die in der Konfigurationsdatei enthalten sind.

Question 22

Kann ich einen Spark-Cluster mit mehreren Benutzern in Azure Synapse Analytics ausführen?

Accepted Answer

Azure Synapse verfügt über zweckgebundene Engines für bestimmte Anwendungsfälle. Apache Spark für Synapse wurde als Auftragsdienst und nicht als Clustermodell konzipiert. Es gibt zwei Szenarien, in denen ein mehrbenutzerfähiges Clustermodell benötigt wird.

Szenario 1: Viele Benutzer greifen auf einen Cluster zu, um Daten für BI-Zwecke bereitzustellen.

Die einfachste Lösungsmöglichkeit ist das Aufbereiten der Daten mit Spark und die anschließende Nutzung der Bereitstellungsfunktionen von Synapse SQL, damit für Power BI eine Verbindung mit diesen Datasets hergestellt werden kann.

Szenario 2: In einem Cluster sind mehrere Entwickler angeordnet, um Kosten zu sparen.

Bei diesem Szenario sollte für jeden Entwickler ein serverloser Spark-Pool vorhanden sein, für den die Nutzung einer geringen Zahl von Spark-Ressourcen festgelegt ist. Da für serverlose Spark-Pools erst dann Kosten anfallen, wenn sie aktiv genutzt werden, kann bei mehreren vorhandenen Entwicklern eine Kostenreduzierung erzielt werden. Von den Pools werden Metadaten (Spark-Tabellen) gemeinsam genutzt, damit die Zusammenarbeit leicht möglich ist.

Question 23

Wie kann ich Bibliotheken einfügen, verwalten und installieren?

Accepted Answer

Sie können externe Pakete mit der Datei „requirements.txt“ über den Synapse-Arbeitsbereich oder das Azure-Portal installieren, während Sie den Spark-Pool erstellen. Weitere Informationen finden Sie unter Verwalten von Bibliotheken für Apache Spark in Azure Synapse Analytics.

Question 24

Welche Tools stehen mir auf Synapse Spark zur Verfügung?

Accepted Answer

MSSparkUtils auf Synapse Spark bietet eine Vielzahl von Dienstprogrammen, um Ihre Erfahrung zu verbessern und die Integration mit anderen Tools und Diensten zu vereinfachen. Arbeiten Sie mit Dateisystemen, rufen Sie Umgebungsvariablen ab, verketten Sie Notebooks und arbeiten Sie mit Geheimnissen mit minimalen manuellen Schritten. Die vollständige Dokumentation finden Sie unter Microsoft Spark Utilities.

Question 25

Was ist der Unterschied zwischen dedizierten SQL-Pools (SQL DW) und dedizierten SQL-Pools in Azure Synapse Arbeitsbereichen?

Accepted Answer

Dedizierte SQL-Pools (früher SQL DW) sind eine Azure Platform-as-a-Service (PaaS)-Data Warehousing-Plattform für Unternehmen. Sie können vorhandene dedizierte SQL-Pools (ehemals SQL DW) abfragen und auch neue dedizierte SQL-Pools in Ihrem Azure Synapse-Arbeitsbereich erstellen. Nicht alle Features des dedizierten SQL Pools in Azure Synapse Arbeitsbereichen gelten für einen eigenständigen dedizierten SQL Pool (ehemals SQL DW) und umgekehrt. Weitere Informationen finden Sie unter Was ist der Unterschied zwischen dedizierten SQL-Pools in Azure Synapse (ehemals SQL DW) und dedizierten SQL-Pools in einem Azure Synapse Analytics-Arbeitsbereich?. Wie Sie Azure Synapse-Arbeitsbereichsfunktionen für einen vorhandenen dedizierten SQL-Pool (ehemals SQL DW) aktivieren, erfahren Sie unter Aktivieren eines Arbeitsbereichs für Ihren dedizierten SQL-Pool (ehemals SQL DW).

Question 26

Welche Funktionsunterschiede gibt es zwischen dedizierten SQL-Pools und serverlosen Pools?

Accepted Answer

Eine vollständige Liste mit den Unterschieden finden Sie unter T-SQL-Funktionsunterschiede in Synapse SQL.

Question 27

Da Azure Synapse jetzt allgemein verfügbar ist: Wie kann ich meine dedizierten SQL-Pools, die bisher eigenständig waren, nach Azure Synapse verschieben?

Accepted Answer

Eine „Verschiebung“ oder „Migration“ ist nicht erforderlich. Sie können auswählen, dass neue Arbeitsbereichsfeatures für Ihre vorhandenen Pools aktiviert werden sollen. Wenn Sie so vorgehen, kommt es nicht zu Breaking Changes, sondern Sie können die neuen Features nutzen, z. B. Synapse Studio, Spark und serverlose SQL-Pools. Nicht alle Features des dedizierten SQL Pools in Azure Synapse Arbeitsbereichen gelten für dedizierte SQL Pools (ehemals SQL DW) und umgekehrt. Wie Sie Arbeitsbereichsfunktionen für einen vorhandenen dedizierten SQL-Pool (ehemals SQL DW) aktivieren, erfahren Sie unter Aktivieren von Synapse-Arbeitsbereichsfunktionen für einen dedizierten SQL-Pool (ehemals SQL DW).

Question 28

Wie sieht die Standardbereitstellung von dedizierten SQL-Pools jetzt aus?

Accepted Answer

Standardmäßig werden alle neuen dedizierten SQL-Pools in einem Arbeitsbereich bereitgestellt. Bei Bedarf können Sie aber trotzdem noch einen dedizierten SQL-Pool (vormals SQL DW) basierend auf dem Formfaktor „Eigenständig“ erstellen.

Question 29

Gewusst wie: Sichern des Zugriffs auf meinen Azure Synapse-Arbeitsbereich

Accepted Answer

Sowohl mit als auch ohne ein verwaltetes virtuelles Netzwerk können Sie aus öffentlichen Netzwerken eine Verbindung mit Ihrem Arbeitsbereich herstellen. Weitere Informationen finden Sie unter Konnektivitätseinstellungen. Der Zugriff aus öffentlichen Netzwerken lässt sich kontrollieren, indem Sie das Feature für den Zugriff auf öffentliche Netzwerke oder die Arbeitsbereichsfirewall aktivieren. Alternativ können Sie auch über einen verwalteten privaten Endpunkt und Private Link eine Verbindung mit Ihrem Arbeitsbereich herstellen. Synapse-Arbeitsbereiche ohne das verwaltete virtuelle Netzwerk von Azure Synapse Analytics können keine Verbindung über verwaltete private Endpunkte herstellen.

Azure Synapse Analytics: Häufig gestellte Fragen

Allgemein

Wie kann ich RBAC-Rollen verwenden, um meinen Arbeitsbereich zu schützen?

Wie kann ich dedizierte SQL-Pools, serverlose SQL-Pools und serverlose Spark-Pools steuern?

Verfügt der Synapse-Arbeitsbereich in der Phase „Allgemeine Verfügbarkeit“ über Unterstützung für die Anordnung von Objekten in Ordnern und der Granularität?

Kann ich mehrere Power BI-Arbeitsbereiche mit einem einzelnen Azure Synapse-Arbeitsbereich verknüpfen?

Ist Azure Synapse Link zu Azure Cosmos DB allgemein verfügbar?

Ist Azure Synapse Link für SQL allgemein verfügbar?

Wird für den Azure Synapse-Arbeitsbereich CI/CD unterstützt?

Welche Funktionsunterschiede gibt es zwischen dedizierten SQL-Pools und serverlosen Pools?

Was sind Delta-Tabellen, und warum sollte ich sie verwenden?

Was ist automatische Komprimierung?

Pipelines

Wie kann ich ermitteln, welche Anmeldeinformationen zum Ausführen einer Pipeline verwendet werden?

Werden SSIS IRs in Synapse Integrate unterstützt?

Wie unterscheiden sich Azure Data Factory-Pipelines und Azure Synapse-Pipelines?

Wie kann ich vorhandene Pipelines aus Azure Data Factory zu einem Azure Synapse-Arbeitsbereich migrieren?

Gewusst wie ich eine Apache Spark-Auftragsdefinition verwende?

Kann ich Notebooks aus ADF-Pipelines aufrufen?

Apache Spark

Worin besteht der Unterschied zwischen Apache Spark für Synapse und Apache Spark?

Welche Versionen von Spark sind verfügbar?

Gibt es in Azure Synapse Spark eine Option, die DBUtils entspricht?

Wie lege ich Sitzungsparameter in Apache Spark fest?

Wie kann ich in einem serverlosen Spark-Pool Parameter für die Clusterebene festlegen?

Kann ich einen Spark-Cluster mit mehreren Benutzern in Azure Synapse Analytics ausführen?

Wie kann ich Bibliotheken einfügen, verwalten und installieren?

Welche Tools stehen mir auf Synapse Spark zur Verfügung?

Dedizierte SQL-Pools

Was ist der Unterschied zwischen dedizierten SQL-Pools (SQL DW) und dedizierten SQL-Pools in Azure Synapse Arbeitsbereichen?

Welche Funktionsunterschiede gibt es zwischen dedizierten SQL-Pools und serverlosen Pools?

Da Azure Synapse jetzt allgemein verfügbar ist: Wie kann ich meine dedizierten SQL-Pools, die bisher eigenständig waren, nach Azure Synapse verschieben?

Wie sieht die Standardbereitstellung von dedizierten SQL-Pools jetzt aus?

Netzwerksicherheit

Gewusst wie: Sichern des Zugriffs auf meinen Azure Synapse-Arbeitsbereich

Nächste Schritte

Feedback

Zusätzliche Ressourcen