Azure Synapse Analytics-Task

Gilt für:SQL Server SSIS Integration Runtime in Azure Data Factory

Der Azure Synapse Analytics-Task ermöglicht es einem SSIS-Paket, Tabellendaten aus dem Dateisystem oder Azure Blob Storage in einen dedizierten Azure Synapse Analytics-SQL-Pool zu kopieren. Der Task nutzt PolyBase zur Leistungssteigerung gemäß der Beschreibung im Artikel Azure Synapse Analytics Loading Patterns and Strategies(Azure Synapse Analytics: Muster und Strategien zum Laden). Das gegenwärtig unterstützte Quelldatenformat ist Text mit Trennzeichen in UTF8-Codierung. Beim Kopieren aus einem Dateisystem werden Daten zunächst in Azure Blob Storage für das Staging und dann in einen dedizierten SQL-Pool hochgeladen. Darum ist ein Azure Blob Storage-Konto erforderlich.

Hinweis

Der Azure Storage-Verbindungs-Manager mit dem Diensttyp „Data Lake Gen2“ wird nicht unterstützt.

Wenn Sie Azure Data Lake Gen2 für das Staging oder eine Quelle verwenden möchten, können Sie über den Azure Storage-Verbindungs-Manager eine Verbindung mit dem Diensttyp „Azure Blob Storage“ herstellen.

Der Azure Synapse Analytics-Task ist eine Komponente des SQL Server Integration Services-Feature Packs (SSIS) für Azure.

Zum Hinzufügen eines Azure Synapse Analytics-Tasks ziehen Sie diesen aus der SSIS-Toolbox auf den Designercanvas, und doppelklicken Sie, oder klicken Sie mit der rechten Maustaste darauf, und wählen Sie dann Bearbeiten aus, um das Task-Editor-Dialogfeld zu öffnen.

Konfigurieren Sie auf der Seite Allgemein die folgenden Eigenschaften.

SourceType gibt den Typ des Quelldatenspeichers an. Wählen Sie einen der folgenden Typen aus:

  • FileSystem: Die Quelldaten befinden sich im lokalen Dateisystem.
  • BlobStorage: Die Quelldaten befinden sich in Azure Blob Storage.

Im Folgenden sind die Eigenschaften für jeden Quelltyp aufgeführt.

FileSystem

Feld BESCHREIBUNG
LocalDirectory Gibt das lokale Verzeichnis mit den Datendateien an, die hochgeladen werden sollen.
Rekursiv Gibt an, ob Unterverzeichnisse rekursiv durchsucht werden sollen.
FileName Geben Sie einen Namensfilter zum Auswählen von Dateien mit einem bestimmten Namensmuster an. Beispiel: „MeinArbeitsblatt*.xsl*“ schließt Dateien wie „MeinArbeitsblatt001.xsl“ und „MeinArbeitsblattABC.xslx“ ein.
RowDelimiter Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren.
ColumnDelimiter Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (umgekehrter Schrägstrich).
IsFirstRowHeader Gibt an, ob die erste Zeile in jeder Datendatei Spaltennamen statt tatsächlicher Daten enthält.
AzureStorageConnection Gibt einen Azure Storage-Verbindungs-Manager an.
BlobContainer Hiermit wird der Name des Blobcontainers festgelegt, auf den lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden. Falls noch nicht vorhanden ist, wird ein neuer Container erstellt.
BlobDirectory Hiermit wird das Blobverzeichnis (virtuelle Hierarchiestruktur) festgelegt, in das lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden.
RetainFiles Gibt an, ob die zu Azure Storage hochgeladenen Dateien beibehalten werden sollen.
CompressionType Gibt an, welches Komprimierungsformat beim Hochladen von Dateien in Azure Storage verwendet werden soll. Die lokale Quelle ist nicht betroffen.
CompressionLevel Gibt an, welcher Komprimierungsgrad für das Komprimierungsformat verwendet werden soll.
SqlPoolConnection Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt.
TableName Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen.
TableDistribution Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird.
HashColumnName Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird.

BlobStorage

Feld BESCHREIBUNG
AzureStorageConnection Gibt einen Azure Storage-Verbindungs-Manager an.
BlobContainer Gibt den Namen des Blobcontainers an, in dem sich die Quelldaten befinden.
BlobDirectory Gibt das Blobverzeichnis (virtuelle Hierarchiestruktur) an, in dem sich die Quelldaten befinden.
RowDelimiter Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren.
ColumnDelimiter Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (umgekehrter Schrägstrich).
CompressionType Gibt das für die Quelldaten verwendete Komprimierungsformat an.
SqlPoolConnection Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt.
TableName Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen.
TableDistribution Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird.
HashColumnName Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird.

Je nachdem, ob Sie zu einer neuen oder einer vorhandenen Tabelle kopieren, sehen Sie eine andere Seite Zuordnungen. Konfigurieren Sie im ersten Fall, welche Quellspalten zugeordnet werden sollen, sowie ihre entsprechenden Namen in der zu erstellenden Zieltabelle. Konfigurieren Sie im letzten Fall die Zuordnungsbeziehungen zwischen Quell- und Zielspalten.

Konfigurieren Sie auf der Seite Spalten die Datentypeigenschaften für jede Quellspalte.

Die Seite T-SQL zeigt die T-SQL-Anweisung, die zum Laden von Daten aus Azure Blob Storage in den dedizierten SQL-Pool verwendet wird. Das T-SQL wird automatisch von Konfigurationen auf den anderen Seiten generiert und als Teil der Taskausführung ausgeführt. Um das generierte T-SQL wahlweise nach Ihren speziellen Bedürfnissen manuell zu bearbeiten, klicken Sie auf die Schaltfläche Bearbeiten . Sie können später durch Klicken auf die Schaltfläche Zurücksetzen das automatisch generierte wiederherstellen.