Guida a PolyBasePolyBase Guide

QUESTO ARGOMENTO SI APPLICA A:sìSQL Server (a partire dalla versione 2016)noDatabase SQL di AzuresìAzure SQL Data Warehouse sìParallel Data Warehouse THIS TOPIC APPLIES TO:yesSQL Server (starting with 2016)noAzure SQL DatabaseyesAzure SQL Data Warehouse yesParallel Data Warehouse

PolyBase è una tecnologia che accede ai dati all'esterno del database tramite il linguaggio T-SQL.PolyBase is a technology that accesses data outside of the database via the t-sql language. In SQL Server 2016 questa tecnologia consente di eseguire query sui dati esterni in Hadoop o di importare/esportare dati da Archiviazione BLOB di Azure.In SQL Server 2016, it allows you to run queries on external data in Hadoop or to import/export data from Azure Blob Storage. Le query vengono ottimizzate per eseguire il push del calcolo in Hadoop.Queries are optimized to push computation to Hadoop. In Azure SQL Data Warehouse è possibile importare/esportare dati da Archiviazione BLOB di Azure e Azure Data Lake Store.In Azure SQL Data Warehouse, you can import/export data from Azure Blob Storage and Azure Data Lake Store.

Per usare PolyBase, vedere Get started with PolyBase(Introduzione a PolyBase).To use PolyBase, see Get started with PolyBase.

Logica PolyBasePolyBase logical

Perché usare PolyBaseWhy use PolyBase?

Per prendere decisioni valide, è necessario analizzare sia i dati relazionali che altri dati non strutturati in tabelle, in particolare in Hadoop,To make good decisions, you want to analyze both relational data and other data that is not structured into tables —notably Hadoop. ma è difficile farlo se non è possibile trasferire i dati tra i diversi tipi di archivi dati.This is difficult to do unless you have a way to transfer data among the different types of data stores. PolyBase risolve il problema operando sui dati esterni a SQL Server.PolyBase bridges this gap by operating on data that is external to SQL Server.

In sostanza, PolyBase non richiede di installare software aggiuntivo nell'ambiente Hadoop.To keep it simple, PolyBase does not require you to install additional software to your Hadoop environment. Le query dei dati esterni usano la stessa sintassi della query di una tabella di databaseQuerying external data uses the same syntax as querying a database table. in modo trasparente.This all happens transparently. PolyBase gestisce tutti i dettagli in background e, per eseguire query sulle tabelle esterne, non è necessario che l'utente finale conosca Hadoop.PolyBase handles all the details behind-the-scenes, and no knowledge about Hadoop is required by the end user to query external tables.

PolyBase può:PolyBase can:

  • Eseguire query sui dati archiviati in Hadoop da SQL Server o PDW.Query data stored in Hadoop from SQL Server or PDW. Gli utenti scelgono di archiviare i dati in sistemi distribuiti e scalabili convenienti, come Hadoop.Users are storing data in cost-effective distributed and scalable systems, such as Hadoop. PolyBase semplifica la query dei dati con T-SQL.PolyBase makes it easy to query the data by using T-SQL.

  • Eseguire query sui dati archiviati in Archiviazione BLOB di Azure.Query data stored in Azure Blob Storage. Nell'archivio BLOB di Azure è possibile salvare i dati da usare con i servizi di Azure.Azure blob storage is a convenient place to store data for use by Azure services. PolyBase semplifica l'accesso ai dati con T-SQL.PolyBase makes it easy to access the data by using T-SQL.

  • Importare dati da Hadoop, Archiviazione BLOB di Azure o Azure Data Lake Store. Sfruttare la velocità della tecnologia columnstore e delle funzionalità di analisi di Microsoft SQL importando i dati da Hadoop, Archiviazione BLOB di Azure o Azure Data Lake Store in tabelle relazionali.Import data from Hadoop, Azure Blob Storage, or Azure Data Lake Store Leverage the speed of Microsoft SQL's columnstore technology and analysis capabilities by importing data from Hadoop, Azure Blob Storage, or Azure Data Lake Store into relational tables. Non è necessario uno strumento di importazione o ETL separato.There is no need for a separate ETL or import tool.

  • Esportare i dati in Hadoop, nell'archivio BLOB di Azure o in Azure Data Lake Store.Export data to Hadoop, Azure Blob Storage, or Azure Data Lake Store. Archiviare i dati in Hadoop, nell'archivio BLOB di Azure o in Azure Data Lake Store per un'archiviazione conveniente e mantenerli online per accedervi facilmente.Archive data to Hadoop, Azure Blob Storage, or Azure Data Lake Store to achieve cost-effective storage and keep it online for easy access.

  • Integrarsi con strumenti BI.Integrate with BI tools. Usare PolyBase con la business intelligence e lo stack di analisi di Microsoft o usare strumenti di terze parti compatibili con SQL Server.Use PolyBase with Microsoft’s business intelligence and analysis stack, or use any third party tools that is compatible with SQL Server.

PrestazioniPerformance

  • Eseguire il push del calcolo in Hadoop.Query Optimizer prende una decisione basata sui costi di eseguire il push del calcolo in Hadoop se in questo modo migliorano le prestazioni della query.Push computation to Hadoop.The query optimizer makes a cost-based decision to push computation to Hadoop when doing so will improve query performance. Per prendere la decisione basata sui costi, usa le statistiche sulle tabelle esterne.It uses statistics on external tables to make the cost-based decision. Il push del calcolo crea processi MapReduce e sfrutta le risorse di calcolo distribuite di Hadoop.Pushing computation creates MapReduce jobs and leverages Hadoop's distributed computational resources.

  • Ridimensionare le risorse di calcolo.Scale compute resources. Per migliorare le prestazioni delle query, è possibile usare i gruppi con scalabilità orizzontale di PolyBaseper SQL Server.To improve query performance, you can use SQL Server PolyBase scale-out groups. In questo modo viene abilitato il trasferimento dei dati paralleli tra le istanze di SQL Server e i nodi di Hadoop e vengono aggiunte le risorse di calcolo per operare sui dati esterni.This enables parallel data transfer between SQL Server instances and Hadoop nodes, and it adds compute resources for operating on the external data.

Argomenti della guida di PolyBasePolyBase Guide Topics

Questa guida include argomenti che illustrano come usare PolyBase in modo efficiente ed efficace.This guide includes topics to help you use PolyBase efficiently and effectively.

ArgomentoTopic DescrizioneDescription
Get started with PolyBaseGet started with PolyBase Passaggi di base per installare e configurar PolyBase.Basic steps to install and configure PolyBase. Illustra come creare oggetti esterni che fanno riferimento ai dati in Hadoop o nell'archivio BLOB di Azure e include esempi di query.This shows how to create external objects that point to data in Hadoop or Azure blob storage, and gives query examples.
PolyBase Versioned Feature Summary (Riepilogo delle funzionalità con controllo delle versioni di PolyBase)PolyBase Versioned Feature Summary Descrive le funzionalità di PolyBase supportate in SQL Server, nel database SQL e in SQL Data Warehouse.Describes which PolyBase features are supported on SQL Server, SQL Database, and SQL Data Warehouse.
gruppi con scalabilità orizzontale di PolyBasePolyBase scale-out groups Parallelismo con scalabilità orizzontale tra SQL Server e Hadoop con i gruppi con scalabilità orizzontale di SQL Server.Scale out parallelism between SQL Server and Hadoop by using SQL Server scale-out groups.
Installazione di PolyBasePolyBase installation Informazioni di riferimento e passaggi per l'installazione di PolyBase con l'installazione guidata o con uno strumento da riga di comando.Reference and steps for installing PolyBase with the installation wizard or with a command-line tool.
Configurazione di PolyBasePolyBase configuration Configurare le impostazioni di SQL Server per PolyBase.Configure SQL Server settings for PolyBase. Ad esempio, configurare la distribuzione del calcolo e la sicurezza Kerberos.For example, configure computation pushdown and kerberos security.
Oggetti T-SQL PolyBasePolyBase T-SQL objects Creare gli oggetti T-SQL usati da PolyBase per definire e accedere ai dati esterni.Create the T-SQL objects that PolyBase uses to define and access external data.
PolyBase QueriesPolyBase Queries Usare le istruzioni T-SQL per eseguire una query, importare o esportare i dati esterni.Use T-SQL statements to query, import, or export external data.
Risoluzione dei problemi di PolyBasePolyBase troubleshooting Tecniche per gestire le query di PolyBase.Techniques to manage PolyBase queries. Usare le viste DMV per monitorare le query di PolyBase e imparare a leggere un piano di query di PolyBase per trovare i colli di bottiglia delle prestazioni.Use dynamic management views (DMVs) to monitor PolyBase queries, and learn to read a PolyBase query plan to find performance bottlenecks.