Bearbeiten

Häufig gestellte Fragen in PolyBase

Gilt für: SQL Server 2016 (13.x) und höhere Versionen

PolyBase vs. verknüpfte Server

In der folgenden Tabelle werden die Unterschiede zwischen PolyBase und Verbindungsserverfunktionen hervorgehoben:

PolyBase Verbindungsserver
Datenbankweites Objekt Instanzweites Objekt
Verwendet ODBC-Treiber. Verwendet OLEDB-Anbieter.
Unterstützt schreibgeschützte Vorgänge für alle Datenquellen und Schreiben in einige externe Datenquellen Unterstützt sowohl Lese- als auch Schreibvorgänge
Abfragen einer Remotedatenquelle über eine einzige Verbindung lassen sich horizontal skalieren Abfragen einer Remotedatenquelle über eine einzige Verbindung lassen sich nicht horizontal skalieren
Weitergabe von Prädikaten wird unterstützt Weitergabe von Prädikaten wird unterstützt
Es ist keine separate Konfiguration für die Verfügbarkeitsgruppe erforderlich Es ist eine separate Konfiguration für jede Instanz in der Verfügbarkeitsgruppe erforderlich
Nur Standardauthentifizierung Standard- und integrierte Authentifizierung
Geeignet für Analyseabfragen, die eine große Anzahl von Zeilen verarbeiten Geeignet für OLTP-Abfragen, die einzelne oder wenige Zeilen zurückgeben
Abfragen, die externe Tabellen verwenden, können nicht an der verteilten Transaktion teilnehmen Verteilte Abfragen können an verteilter Transaktion teilnehmen

Was ist neu in PolyBase in SQL Server 2022?

SQL Server 2022 (16.x) unterstützt jetzt CSV-, Parkett- und Delta-Dateien, die auf Azure Storage Account v2, Azure Data Lake Storage Gen2 oder einem S3-kompatiblen Objektspeicher mit der S3-REST-API, lokal oder in der Cloud gespeichert sind.

SQL Server 2022 (16.x) kann jetzt CREATE EXTERNAL TABLE as SELECT (CETAS) zusammen mit Befehlen wie OPENROWSET, CREATE EXTERNAL TABLE (CET) und allen neuen T-SQL-Verbesserungen verwenden.

Derzeit wurde die Unterstützung für externe Hadoop-Datenquellen in SQL Server 2022 (16.x) entfernt.

Das kumulative Update 2 für SQL Server 2022 (16.x) bietet jetzt Unterstützung für Oracle TNS-Dateien. Weitere Informationen und Beispiele finden Sie unter CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS.

Weitere Informationen zur Datenvirtualisierung mit PolyBase für SQL Server 2022 und zu sql Server 2022 PolyBase-Verbesserungen.

Neuerungen in PolyBase in SQL Server 2019?

PolyBase in SQL Server 2019 (15.x) kann jetzt Daten aus einer größeren Vielfalt von Datenquellen lesen. Die Daten aus diesen externen Datenquellen können als externe Tabellen auf Ihrem SQL Server gespeichert werden. Zudem unterstützt PolyBase die Weitergabeberechnung für diese externen Datenquellen, mit Ausnahme von generischen ODBC-Typen.

Kompatible Datenquellen

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Kompatible generische ODBC-Typen

Das kumulative Update 19 für SQL Server 2019 (15.x) bietet jetzt Unterstützung für Oracle TNS-Dateien. Weitere Informationen und Beispiele finden Sie unter CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS.

Hinweis

PolyBase kann die Verbindung mit externen Datenquellen mithilfe von ODBC-Treibern von Drittanbietern ermöglichen. Diese Treiber sind nicht im Lieferumfang von PolyBase enthalten und funktionieren ggf. nicht wie vorgesehen. Weitere Informationen finden Sie unter Configure PolyBase to access external data with ODBC generic types.

Welche CONNECTION_OPTIONS kann ich für die Verbindung mit Datenquellen von Drittanbietern angeben?

Überprüfen Sie CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS für unterstützte Datenanbieterverbindungsoptionen für SQL Server, Oracle, Teradata, die MongoDB-API für Cosmos DB und generische ODBC-Datenanbieter.

Wie kann ich den Ausführungsplan für Remoteabfragen der PolyBase-Pushdownberechnung anzeigen?

Hierfür gibt es verschiedene Methoden, die von der SQL Server-Version abhängen. Informationen finden Sie unter Überwachung und Problembehandlung für PolyBase – So zeigen Sie den PolyBase-Abfrageplan an (Änderung vorbehalten).

Wie kann ich feststellen, ob die PolyBase-Pushdownberechnung ausgeführt wird?

Informationen finden Sie unter Identifizieren eines externen Pushdowns.

Wird PolyBase auf Azure SQL-Datenbank unterstützt?

Nein, Sie können jedoch Daten in den Dateien abfragen, die in Azure Blob Storage gespeichert sind, mithilfe der OPENROWSET-Funktion oder mithilfe von CREATE EXTERNAL TABLE aus einem serverlosen SQL-Pool in Synapse Analytics lesen. Weitere Informationen finden Sie unter Azure SQL, die Azure Data Lake-Speicherdateien mit externen Synapse SQL-Tabellen lesen können.

Wird PolyBase in Azure SQL verwaltete Instanz unterstützt?

Azure SQL verwaltete Instanz verfügt über eigene Datenvirtualisierungsfunktionen für Azure Data Lake Storage (ADLS) und Azure Blob Storage als Datenquellen. Weitere Informationen finden Sie unter "Datenvirtualisierung mit Azure SQL verwaltete Instanz".

Welche Ports meiner Firewall sollte ich für PolyBase zulassen?

Für PolyBase selbst müssen keine zusätzlichen Ports geöffnet werden, außer im Fall einer PolyBase-Erweiterungsgruppe. Ohne eine Erweiterungsgruppe sollte der PolyBase-Dienst allein keine Firewallregel erfordern.

Auf Windows-Servern nutzt PolyBase die von SQL Server im Abschnitt IPAll der TCP/IP-Einstellungen im SQL Server-Konfigurations-Manager verwendeten Ports. Weitere Informationen finden Sie unter TCP/IP-Eigenschaften. Auf Linux-Servern nutzt PolyBase die Einstellung network.tcpport. Weitere Informationen finden Sie unter TCP-Port.

Informationen zu PolyBase-Erweiterungsgruppen über mehrere Windows-Server finden Sie unter „Portinformationen“ in der nächsten Frage.

Sie müssen jedoch andere Ports für die Kommunikation mit den verschiedenen externen Datenquellen zulassen, die von PolyBase verwendet werden. Lesen Sie die Dokumentation zu ODBC-Konfiguration, Azure-Ressourcenkonfiguration oder bestimmten Datenquellen. Beispiel:

Quellplattform Verweis
Microsoft SQL Server Von SQL Server verwendete Ports
Hortonworks HDP Verwalten von HDFS
Cloudera CDH Von CDH-Komponenten verwendete Ports

Welche Ports werden für die PolyBase-Erweiterungsgruppe verwendet?

Standardmäßig stellt der PolyBase-Datenverschiebungsdienst über einen Portbereich von TCP 16450-16460 eine Verbindung mit dem Hauptknoten einer Erweiterungsgruppe her, wobei normalerweise die Ports 16450-16453 und 17001 verwendet werden. Diese Ports werden nur verwendet, wenn eine PolyBase-Erweiterungsgruppe konfiguriert wurde und über Serverfirewalls zugelassen werden soll. Beim Einrichten von SQL Server sollte automatisch eine lokale Firewallregel erstellt werden, die diese Ports bei der Feature-Installation zulässt. Weitere Informationen finden Sie unter Konfigurieren von PolyBase-Erweiterungsgruppen unter Windows.

Hinweis

Die Microsoft SQL Server PolyBase-Erweiterungsgruppen werden eingestellt. Die Erweiterungsgruppen-Funktionalität wird in SQL Server 2022 (16.x) aus dem Produkt entfernt.

PolyBase in Big Data-Cluster vs. PolyBase in eigenständigen Instanzen

Weitere Informationen zu Verbindungen mit dem generischen ODBC-Connector finden Sie in unserem Leitfaden zum Konfigurieren generischer ODBC-Typen.

In der folgenden Tabelle werden die PolyBase-Features hervorgehoben, die in SQL Server 2019 (15.x) eigenständige Installation und SQL Server 2019 (15.x) Big Data Cluster verfügbar sind:

Funktion Big Data-Cluster Eigenständige Instanz
Erstellen einer externen Datenquelle für SQL Server, Oracle, Teradata und Mongo DB X X
Erstellen einer externe Datenquelle mit einem kompatiblen ODBC-Treibers eines Drittanbieters X
Erstellen einer externen Datenquelle für Hadoop-Datenquelle X X
Erstellen einer externen Datenquelle für Azure Blob Storage X X
Erstellen einer externen Tabelle für einen SQL Server-Datenpool X
Erstellen einer externen Tabelle für einen SQL Server-Speicherpool X
Horizontale Skalierung der Abfrageausführung X X (nur Windows)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.