Funzionalità Premium dei flussi di datiPremium features of dataflows

I flussi di dati sono supportati per gli utenti di Power BI Pro e Power BI Premium.Dataflows are supported for Power BI Pro and Power BI Premium users. Alcune funzionalità sono disponibili solo con una sottoscrizione di Power BI Premium.Some features are only available with a Power BI Premium subscription. Questo articolo descrive e illustra in dettaglio le funzionalità solo Premium e come vengono usate.This article describes and details the Premium-only features and their uses.

Le funzionalità seguenti sono disponibili solo con Power BI Premium:The following features are available only with Power BI Premium:

  • Motore di calcolo avanzatoEnhanced compute engine
  • DirectQueryDirect Query
  • Entità calcolateComputed entities
  • Entità collegateLinked Entities
  • Aggiornamento incrementaleIncremental refresh

Le sezioni seguenti descrivono in dettaglio ognuna di queste funzionalità.The following sections described each of these features in detail.

Motore di calcolo avanzatoThe enhanced compute engine

Il motore di calcolo avanzato in Power BI consente ai sottoscrittori di Power BI Premium di usare la propria capacità per ottimizzare l'uso dei flussi di dati.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. L'uso del motore di calcolo avanzato offre i vantaggi seguenti:Using the enhanced compute engine provides the following advantages:

  • Riduzione drastica del tempo di aggiornamento necessario per i passaggi ETL (estrazione, trasformazione e caricamento ) con esecuzione prolungata sulle entità calcolate, ad esempio l'esecuzione di operazioni join, distinct, filter e group byDrastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • Eseguire query DirectQuery sulle entitàPerform DirectQuery queries over entities

L'impostazione predefinita per il motore di calcolo avanzato è .By default, the enhanced compute engine is On. Se il motore di calcolo avanzato non è attivato, l'abilitazione del motore di calcolo avanzato è descritta nella sezione successiva, insieme alle risposte alle domande più comuni.If the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

Uso del motore di calcolo avanzatoUsing the enhanced compute engine

È possibile abilitare il motore di calcolo avanzato nella pagina Impostazioni di capacità del servizio Power BI, nella sezione Flussi di dati.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. L'impostazione predefinita per il motore di calcolo avanzato è No.By default, the enhanced compute engine is Off. Per abilitare il motore di calcolo avanzato, impostare l'opzione su come illustrato nell'immagine seguente e salvare le impostazioni.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

Attivare il motore di calcolo avanzato

Importante

Il motore di calcolo avanzato funziona solo per le capacità di Power BI A3 e successive.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Una volta attivato il motore di calcolo avanzato, tornare ai flussi di dati e si riscontrerà un miglioramento delle prestazioni in qualsiasi entità calcolata che esegue operazioni complesse, ad esempio operazioni join o group by, per i flussi di dati creati da entità collegate esistenti nella stessa capacità.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

Per sfruttare al meglio il motore di calcolo, dividere la fase ETL in due flussi di dati separati, nel modo seguente:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Flusso di dati 1: questo flusso di dati deve solo inserire tutti i dati richiesti da un'origine dati e posizionarli nel flusso di dati 2.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Flusso di dati 2: eseguire tutte le operazioni ETL in questo secondo flusso di dati, ma assicurarsi di fare riferimento al flusso di dati 1, che si deve trovare nella stessa capacità.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Assicurarsi inoltre di eseguire le operazioni di tipo fold (filter, group by, distinct, join) prima di qualsiasi altra operazione, per garantire che il motore di calcolo venga utilizzato.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Domande frequenti e risposteCommon questions and answers

Domanda: Dopo aver abilitato il motore di calcolo avanzato, gli aggiornamenti sono più lenti.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Questo problema dipendeWhy?

Risposta: Se si abilita il motore di calcolo avanzato, ci sono due possibili spiegazioni per il rallentamento dei tempi di aggiornamento:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Quando il motore di calcolo avanzato è abilitato, richiede una certa quantità di memoria per funzionare correttamente.When the enhanced compute engine is enabled, it requires some memory to function properly. Di conseguenza, la memoria disponibile per l'esecuzione di un aggiornamento è ridotta e quindi aumenta la probabilità che gli aggiornamenti vengano accodati, riducendo di conseguenza il numero di flussi di dati che possono essere aggiornati contemporaneamente.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Per risolvere questo problema, quando si abilita il calcolo avanzato, aumentare la memoria assegnata ai flussi di dati per garantire che la memoria disponibile per gli aggiornamenti contemporanei dei flussi di dati rimanga invariata.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Un'altra possibile causa del rallentamento degli aggiornamenti è che il motore di calcolo funziona solo sulle entità esistenti.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Se il flusso di dati fa riferimento a un'origine dati che non è un flusso di dati, non si riscontrerà alcun miglioramento.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Non ci sarà un aumento delle prestazioni, poiché in alcuni scenari di Big Data la lettura iniziale da un'origine dati risulta più lenta, in quanto i dati devono essere passati al motore di calcolo avanzato.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Domanda: L'opzione di attivazione/disattivazione del motore di calcolo avanzato non è visibile.Question: I cannot see the enhanced compute engine toggle. Questo problema dipendeWhy?

Risposta: Il rilascio del motore di calcolo avanzato sta avvenendo per fasi nelle diverse aree di tutto il mondo.Answer: The enhanced compute engine is being released in stages to regions around the world. Si prevede che il supporto sarà disponibile in tutte le aree entro la fine del 2020.We anticipate all regions will supported by the end of 2020.

Domanda: Quali sono i tipi di dati supportati per il motore di calcolo?Question: What are the supported data types for the compute engine?

Risposta: Il motore di calcolo avanzato e i flussi di dati attualmente supportano i tipi di dati seguenti.Answer: The enhanced compute engine and dataflows currently support the following data types. Se il flusso di dati non usa uno dei tipi di dati seguenti, si verifica un errore durante l'aggiornamento:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Data/oraDate/Time
  • Numero decimaleDecimal Number
  • TestoText
  • Numero interoWhole number
  • Data/ora/fuso orarioDate/Time/Zone
  • Vero/FalsoTrue/False
  • DataDate
  • OraTime

Usare DirectQuery con i flussi di dati in Power BI (anteprima)Use DirectQuery with dataflows in Power BI (preview)

È possibile usare DirectQuery per connettersi direttamente ai flussi di dati e quindi connettersi direttamente al proprio flusso di dati senza dover importare i dati.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

L'uso di DirectQuery con i flussi di dati consente i miglioramenti seguenti ai processi di Power BI e dei flussi di dati:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Evitare pianificazioni di aggiornamenti separate: DirectQuery si connette direttamente a un flusso di dati, eliminando la necessità di creare un set di dati importato.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Di conseguenza, usando DirectQuery con i flussi di dati, non sono più necessarie pianificazioni di aggiornamenti separate per il flusso di dati e il set di dati per garantire la sincronizzazione dei dati.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Filtro dei dati: DirectQuery è utile per lavorare su una visualizzazione filtrata dei dati all'interno di un flusso di dati.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Per filtrare i dati e quindi utilizzare un subset più piccolo dei dati nel flusso di dati, è possibile usare DirectQuery (e il motore di calcolo) per filtrare i dati del flusso di dati e utilizzare il subset filtrato necessario.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

Uso di DirectQuery per i flussi di datiUsing DirectQuery for dataflows

L'uso di DirectQuery con i flussi di dati è una funzionalità di anteprima disponibile a partire dalla versione di maggio 2020 di Power BI Desktop.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Esistono anche alcuni prerequisiti per l'uso di DirectQuery con i flussi di dati:There are also prerequisites for using DirectQuery with dataflows:

  • Il flusso di dati deve trovarsi all'interno di un'area di lavoro abilitata per Power BI PremiumYour dataflow must reside within a Power BI Premium enabled workspace
  • Il motore di calcolo deve essere attivatoThe compute engine must be turned on

Abilitare DirectQuery per i flussi di datiEnable DirectQuery for dataflows

Per assicurarsi che il flusso di dati sia disponibile per l'accesso con DirectQuery, il motore di calcolo avanzato deve essere ottimizzato.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Per abilitare DirectQuery per i flussi di dati, impostare la nuova opzione Impostazioni del motore di calcolo avanzato su Attivato.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. L'immagine seguente mostra l'impostazione selezionata correttamente.The following image shows the setting properly selected.

Controllo granulare per DirectQuery

Dopo aver applicato questa impostazione, aggiornare il flusso di dati per rendere effettiva l'ottimizzazione.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

Considerazioni e limitazioni per DirectQueryConsiderations and limitations for DirectQuery

A DirectQuery e ai flussi di dati si applicano alcune limitazioni note:There are a few known limitations with DirectQuery and dataflows:

  • Durante il periodo di anteprima di questa funzionalità, alcuni clienti potrebbero riscontrare timeout o problemi di prestazioni mentre usano DirectQuery con i flussi di dati.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Durante il periodo di anteprima si lavorerà attivamente alla risoluzione di tali problemi.Such issues are being actively addressed during this preview period.

  • Attualmente non sono supportati modelli compositi/misti con origini dati importate e DirectQuery.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • I flussi di dati di grandi dimensioni potrebbero riscontrare problemi di timeout quando si attivano le visualizzazioni.Large dataflows may have trouble with timeout issues when viewing visualizations. I flussi di dati di grandi dimensioni che riscontrano problemi di timeout devono usare la modalità importazione.Large dataflows that run into trouble with timeout issues should use Import mode.

  • Nelle impostazioni dell'origine dati il connettore del flusso di dati visualizzerà credenziali non valide se si usa DirectQuery.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Ciò non influisce sul comportamento e il set di dati funzionerà correttamente.This does not affect the behavior, and the dataset will work properly.

Entità calcolateComputed entities

È possibile eseguire calcoli in archivio quando si usano i flussi di dati con una sottoscrizione di Power BI Premium.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. Ciò consente di eseguire i calcoli sui flussi di dati esistenti e ottenere risultati che consentono di concentrarsi sulla creazione di report e sull'analisi.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Entità calcolata

Per eseguire i calcoli in archivio, è prima di tutto necessario creare il flusso di dati e inserire i dati nell'archivio del flusso di dati di Power BI.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Dopo aver creato un flusso di dati contenente dati, è possibile creare entità calcolate, ovvero le entità che eseguono calcoli in archivio.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Considerazioni e limitazioni delle entità calcolateConsiderations and limitations of computed entities

  • Quando si usano flussi di dati creati in un account di Azure Data Lake Storage Gen2 dell'organizzazione, le entità collegate e calcolate funzionano correttamente solo quando risiedono nello stesso account di archiviazione.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Come procedura consigliata, quando si eseguono calcoli sui dati aggiunti dai dati locali e cloud, creare un nuovo flusso di dati per ogni origine (uno per l'ambiente locale e uno per il cloud) e quindi creare un terzo flusso di dati per eseguire il merge/calcolo su queste due origini dati.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Entità collegateLinked entities

È possibile fare riferimento a flussi di dati esistenti quando li si usa con una sottoscrizione di Power BI Premium. Ciò consente di eseguire il calcolo su queste entità usando le entità calcolate o di creare una tabella "singola origine dei dati reali" che è possibile riutilizzare in più flussi di dati.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Aggiornamento incrementaleIncremental refresh

I flussi di dati possono essere impostati per l'aggiornamento incrementale, per evitare di dover eseguire il pull di tutti i dati a ogni aggiornamento.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. A tale scopo, selezionare il flusso di dati, quindi selezionare l'icona Aggiornamento incrementale.To do so, select the dataflow then select the incremental refresh icon.

Aggiornamento incrementale

L'impostazione dell'aggiornamento incrementale aggiunge al flusso di dati i parametri per specificare l'intervallo di date.Setting incremental refresh adds parameters to the dataflow to specify the date range. Per informazioni dettagliate su come configurare l'aggiornamento incrementale, vedere l'articolo Aggiornamento incrementale.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Considerazioni su quando non impostare l'aggiornamento incrementaleConsiderations for when not to set incremental refresh

Non impostare un flusso di dati sull'aggiornamento incrementale nelle situazioni seguenti:Do not set a dataflow to incremental refresh in the following situations:

  • Le entità collegate non devono usare l'aggiornamento incrementale se fanno riferimento a un flusso di dati.Linked entities should not use incremental refresh if they reference a dataflow. I flussi di dati non supportano la riduzione delle query (anche se l'entità è abilitata per DirectQuery).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • I set di dati che fanno riferimento a flussi di dati non devono usare l'aggiornamento incrementale.Datasets referencing dataflows should not use incremental refresh. Gli aggiornamenti ai flussi di dati in genere dovrebbero funzionare correttamente.Refreshes to dataflows should generally perform well. Se gli aggiornamenti richiedono più tempo del previsto, provare a usare il motore di calcolo e/o la modalità DirectQuery.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Passaggi successiviNext steps

Gli articoli seguenti contengono altre informazioni sui flussi di dati e su Power BI:The following articles provide more information about dataflows and Power BI: