Recursos Premium de fluxos de dadosPremium features of dataflows

Os usuários do Power BI Pro e Power BI Premium podem usar fluxos de dados.Dataflows are supported for Power BI Pro and Power BI Premium users. Alguns recursos estão disponíveis apenas com uma assinatura Power BI Premium.Some features are only available with a Power BI Premium subscription. Este artigo descreve e detalha os recursos somente Premium e seus usos.This article describes and details the Premium-only features and their uses.

Os seguintes recursos estão disponíveis apenas com o Power BI Premium:The following features are available only with Power BI Premium:

  • Mecanismo de computação aprimoradoEnhanced compute engine
  • Consulta DiretaDirect Query
  • Entidades computadasComputed entities
  • Entidades vinculadasLinked Entities
  • Atualização incrementalIncremental refresh

As seções a seguir descrevem cada um desses recursos em detalhes.The following sections described each of these features in detail.

O mecanismo de computação aprimoradoThe enhanced compute engine

O mecanismo de computação aprimorado do Power BI permite que os assinantes do Power BI Premium usem a capacidade de otimizar o uso de fluxos de dados.The enhanced compute engine in Power BI enables Power BI Premium subscribers to use their capacity to optimize the use of dataflows. O uso do mecanismo de computação aprimorado oferece as seguintes vantagens:Using the enhanced compute engine provides the following advantages:

  • Reduz drasticamente o tempo de atualização necessário para etapas de ETL de longa execução em entidades computadas, como a execução de operações de junções, contagens distintas, filtros e agrupar porDrastically reduces the refresh time required for long-running ETL steps over computed entities, such as performing joins, distinct, filters, and group by
  • Executar consultas do DirectQuery em entidadesPerform DirectQuery queries over entities

Por padrão, o mecanismo de computação aprimorado está Ativado.By default, the enhanced compute engine is On. Caso o mecanismo de computação aprimorado não esteja ativado, a habilitação dele está descrita na próxima seção, junto com respostas a perguntas comuns.If the enhanced compute engine is not on, enabling the enhanced compute engine is described in the next section, along with answers to common questions.

Com usar o mecanismo de computação aprimoradoUsing the enhanced compute engine

O mecanismo de computação aprimorado é habilitado na página Configurações de Capacidade do serviço do Power BI, na seção Fluxos de dados.The enhanced compute engine is enabled from the Capacity Settings page in the Power BI service, in the dataflows section. Por padrão, o mecanismo de computação aprimorado está Desativado.By default, the enhanced compute engine is Off. Para habilitar o mecanismo de computação aprimorado, mude o controle para Ativado conforme mostrado na imagem a seguir e salve as configurações.To enable the enhanced compute engine, switch the toggle to On as shown in the following image, and save your settings.

Ativar o mecanismo de computação aprimorado

Importante

O mecanismo de computação aprimorado funciona apenas para capacidades A3 e superiores do Power BI.The enhanced compute engine works only for Power BI capacities of A3 and larger.

Depois que o mecanismo de computação aprimorado é ativado, retorne aos fluxos de dados e você verá uma melhoria no desempenho de qualquer entidade computada que execute operações complexas, como junções ou agrupar por, para fluxos de dados criados com base nas entidades vinculadas existentes na mesma capacidade.Once the enhanced compute engine is on, return to dataflows and you should see a performance improvement in any computed entity that performs complex operations, such as joins or group by operations for dataflows created from existing linked entities on the same capacity.

Para fazer o melhor uso do mecanismo de computação, divida o estágio de ETL em dois fluxos de dados separados da seguinte maneira:To make best use of the compute engine, split the ETL stage into two separate dataflows, in the following way:

  • Fluxo de dados 1: esse fluxo de dados só deverá ingerir tudo o que é necessário de uma fonte de dados e colocá-la no fluxo de dados 2.Dataflow 1 - this dataflow should only be ingesting all of the required from a data source, and placing it into dataflow 2.
  • Fluxo de dados 2: execute todas as operações de ETL nesse segundo fluxo de dados, mas referencie o fluxo de dados 1, que deverá estar na mesma capacidade.Dataflow 2 - perform all ETL operations in this second dataflow, but ensure you're referencing Dataflow 1, which should be on the same capacity. Além disso, execute primeiro as operações que podem ser particionadas (filtrar, agrupar por, contagem distinta, junção) antes de qualquer outra operação, a fim de garantir que o mecanismo de computação seja utilizado.Also ensure you perform operations that can fold (filter, group by, distinct, join) first, before any other operation, to ensure the compute engine is utilized.

Perguntas comuns e respostasCommon questions and answers

Pergunta: Habilitei o mecanismo de computação aprimorado, mas minhas atualizações são mais lentas.Question: I've enabled the enhanced compute engine, but my refreshes are slower. Por que?Why?

Resposta: Se você habilitar o mecanismo de computação aprimorado, haverá duas explicações possíveis que podem levar a tempos de atualização mais lentos:Answer: If you enable the enhanced compute engine, there are two possible explanations that could lead to slower refresh times:

  • Quando o mecanismo de computação aprimorado é habilitado, ele exige memória para funcionar corretamente.When the enhanced compute engine is enabled, it requires some memory to function properly. Assim, a memória disponível para executar uma atualização é reduzida e, portanto, aumenta a probabilidade de as atualizações serem colocadas na fila, o que, por sua vez, reduz o número de fluxos de dados que podem ser atualizados simultaneamente.As such, memory available to perform a refresh is reduced and therefore increases the likelihood of refreshes to be queued, which in turn reduces the number of dataflows that can refresh concurrently. Para resolver isso, ao habilitar a computação aprimorada, aumente a memória atribuída aos fluxos de dados, a fim de garantir que a memória disponível para as atualizações de fluxos de dados simultâneos permaneça a mesma.To address this, when enabling enhanced compute, increase the memory assigned for dataflows to ensure the memory available for concurrent dataflow refreshes remains the same.

  • Outro motivo pelo qual você pode se deparar com atualizações mais lentas é que o mecanismo de computação funciona apenas em entidades existentes.Another reason you may encounter slower refreshes is that the compute engine only works on top of existing entities. Se o fluxo de dados fizer referência a uma fonte de dados que não é um fluxo de dados, você não verá nenhum aprimoramento.If your dataflow references a data source that's not a dataflow, you won't see an improvement. Não haverá aumento de desempenho, pois, em alguns cenários de Big Data, a leitura inicial de uma fonte de dados será mais lenta, porque os dados precisam ser transmitidos para o mecanismo de computação aprimorado.There will be no performance increase, since in some big data scenarios, the initial read from a data source would be slower because the data needs to be passed to the enhanced compute engine.

Pergunta: Não consigo ver a alternância do mecanismo de computação aprimorado.Question: I cannot see the enhanced compute engine toggle. Por que?Why?

Resposta: O mecanismo de computação aprimorado está sendo lançado em estágios nas regiões em todo o mundo.Answer: The enhanced compute engine is being released in stages to regions around the world. Prevemos que todas as regiões terão suporte até o final de 2020.We anticipate all regions will supported by the end of 2020.

Pergunta: Quais são os tipos de dados compatíveis com o mecanismo de computação?Question: What are the supported data types for the compute engine?

Resposta: Atualmente, o mecanismo de computação aprimorado e os fluxos de dados dão suporte aos tipos de dados a seguir.Answer: The enhanced compute engine and dataflows currently support the following data types. Se o fluxo de dados não usar um dos seguintes tipos de dados, ocorrerá um erro durante a atualização:If your dataflow doesn't use one of the following data types, an error occurs during refresh:

  • Data/HoraDate/Time
  • Número DecimalDecimal Number
  • TextoText
  • Número inteiroWhole number
  • Data/Hora/Fuso HorárioDate/Time/Zone
  • Verdadeiro/FalsoTrue/False
  • DataDate
  • HoraTime

Usar o DirectQuery com fluxos de dados no Power BI (versão prévia)Use DirectQuery with dataflows in Power BI (preview)

Você pode usar o DirectQuery para se conectar diretamente aos fluxos de dados e, portanto, conectar-se diretamente ao seu fluxo de dados sem ter que importar os respectivos dados.You can use DirectQuery to connect directly to dataflows, and thereby connect directly to your dataflow without having to import its data.

O uso do DirectQuery com fluxos de dados permite os seguintes aprimoramentos aos seus processos de Power BI e de fluxo de dados:Using DirectQuery with dataflows enables the following enhancements to your Power BI and dataflows processes:

  • Evitar agendas de atualização separadas – o DirectQuery se conecta diretamente a um fluxo de dados, eliminando a necessidade de criar um conjunto de dados importado.Avoid separate refresh schedules - DirectQuery connects directly to a dataflow, removing the need to create an imported dataset. Dessa forma, o uso do DirectQuery com seus fluxos de dados significa que não há mais necessidade de agendar atualizações separadamente para o fluxo de dados e o conjunto de dados a fim de garantir que os dados fiquem sincronizados.As such, using DirectQuery with your dataflows means you no longer need separate refresh schedules for the dataflow and the dataset to ensure your data is synchronized.

  • Filtragem de dados – o DirectQuery é útil para trabalhar em uma exibição filtrada de dados dentro de um fluxo de dados.Filtering data - DirectQuery is useful for working on a filtered view of data inside a dataflow. Se você quiser filtrar os dados e, portanto, trabalhar com um subconjunto menor dos dados em seu fluxo de dados, poderá usar o DirectQuery (e o mecanismo de computação) para filtrar os dados do fluxo de dados e trabalhar com o subconjunto filtrado de que precisar.If you want to filter data, and thereby work with a smaller subset of the data in your dataflow, you can use DirectQuery (and the compute engine) to filter dataflow data and work with the filtered subset you need.

Usar o DirectQuery para fluxos de dadosUsing DirectQuery for dataflows

O uso do DirectQuery com fluxos de dados de entrada é uma versão prévia do recurso disponível começando com a versão de maio de 2020 do Power BI Desktop.Using DirectQuery with dataflows is a preview feature available beginning with the May 2020 version of Power BI Desktop.

Também há pré-requisitos para usar o DirectQuery com fluxos de dados:There are also prerequisites for using DirectQuery with dataflows:

  • O fluxo de dados precisa residir em um workspace habilitado para o Power BI PremiumYour dataflow must reside within a Power BI Premium enabled workspace
  • O mecanismo de computação precisa estar ativadoThe compute engine must be turned on

Habilitar o DirectQuery para fluxos de dadosEnable DirectQuery for dataflows

Para garantir que o fluxo de dados esteja disponível para acesso pelo DirectQuery, o mecanismo de computação aprimorado precisa estar em seu estado otimizado.To ensure your dataflow is available for DirectQuery access, the enhanced compute engine must be in its optimized state. Para habilitar o DirectQuery para fluxos de dados, defina a nova opção Configurações aprimoradas do mecanismo de computação para Ativado.To enable DirectQuery for dataflows, set the new Enhanced compute engine settings option to On. A imagem a seguir mostra a configuração selecionada corretamente.The following image shows the setting properly selected.

Controle granular para consulta direta

Depois de aplicar essa configuração, atualize o fluxo de dados para que a otimização entre em vigor.Once you've applied that setting, refresh the dataflow for the optimization to take effect.

Considerações e limitações do DirectQueryConsiderations and limitations for DirectQuery

Existem algumas limitações conhecidas com o DirectQuery e os fluxos de dados:There are a few known limitations with DirectQuery and dataflows:

  • Durante o período de versão prévia desse recurso, alguns clientes podem enfrentar problemas de tempo limite ou de desempenho ao usar o DirectQuery com fluxos de dados.During the preview period of this feature, some customers may experience timeouts or performance issues when using DirectQuery with dataflows. Esses problemas estão sendo resolvidos ativamente durante esse período de versão prévia.Such issues are being actively addressed during this preview period.

  • Modelos compostos/mistos que têm fontes de dados do DirectQuery e de importação não são compatíveis atualmente.Composite/mixed models that have import and DirectQuery data sources are currently not supported.

  • Grandes fluxos de dados podem ter problemas de tempo limite ao exibir visualizações.Large dataflows may have trouble with timeout issues when viewing visualizations. Grandes fluxos de dados que encontrarem problemas de tempo limite devem usar o Modo de importação.Large dataflows that run into trouble with timeout issues should use Import mode.

  • Em configurações da fonte de dados, o conector de fluxo de dados mostrará credenciais inválidas se você estiver usando o DirectQuery.Under data source settings, the dataflow connector will show invalid credentials if you are using DirectQuery. Isso não afeta o comportamento e o conjunto de dados funcionará corretamente.This does not affect the behavior, and the dataset will work properly.

Entidades computadasComputed entities

Você pode executar cálculos em armazenamento ao usar fluxos de dados com uma assinatura do Power BI Premium.You can perform in-storage computations when using dataflows with a Power BI Premium subscription. Isso permite que você realize cálculos em seus fluxos de dados existentes e retorne resultados que permitem que você se concentre na criação e na análise de relatórios.This lets you perform calculations on your existing dataflows, and return results that enable you to focus on report creation and analytics.

Entidade computada

Para executar cálculos em armazenamento, primeiro você deve criar o fluxo de dados e trazer dados para esse armazenamento de fluxo de dados do Power BI.To perform in-storage computations, you first must create the dataflow and bring data into that Power BI dataflow storage. Depois de ter um fluxo de dados que contém dados, você pode criar entidades computadas, que são entidades que executam cálculos em armazenamento.Once you have a dataflow that contains data, you can create computed entities, which are entities that perform in-storage computations.

Considerações e limitações das entidades computadasConsiderations and limitations of computed entities

  • Ao trabalharem com fluxos de dados criados em uma conta do Azure Data Lake Storage Gen2 da organização, entidades vinculadas e entidades computadas só funcionam corretamente quando residem na mesma conta de armazenamento.When working with dataflows created in an organization's Azure Data Lake Storage Gen2 account, linked entities and computed entities only work properly when the entities reside in the same storage account.

Como melhor prática, ao fazer computações em dados unidos por dados locais e na nuvem, crie um novo fluxo de dados para cada fonte (um para a local e outro para a nuvem) e, em seguida, crie um terceiro fluxo de dados para mesclar/computar nessas duas fontes de dados.As a best practice, when doing computations on data joined by on-premises and cloud data, create a new dataflow for each source (one for on-premises and one for cloud) and then create a third dataflow to merge/compute over these two data sources.

Entidades vinculadasLinked entities

Você pode fazer referência a fluxos de dados existentes ao usar com uma assinatura do Power BI Premium, que permite executar o cálculo nessas entidades usando entidades computadas ou permite que você crie uma tabela de "única fonte da verdade" que pode ser reutilizada em vários fluxos de dados.You can reference existing dataflows when using with a Power BI Premium subscription, which lets you either perform calculation on these entities using computed entities or allows you to create a "single source of the truth" table that you can reuse within multiple dataflows.

Atualização incrementalIncremental refresh

Os fluxos de dados podem ser definidos para atualização incremental a fim de evitar ter que efetuar pull em todas as atualizações.Dataflows can be set to refresh incrementally to avoid having to pull all the data on every refresh. Para fazer isso, selecione o fluxo de dados e, em seguida, selecione o ícone de atualização incremental.To do so, select the dataflow then select the incremental refresh icon.

Atualização incremental

A configuração da atualização incremental adiciona parâmetros ao fluxo de dados para especificar o intervalo de datas.Setting incremental refresh adds parameters to the dataflow to specify the date range. Para obter informações detalhadas sobre como configurar a atualização incremental, consulte o artigo Atualização incremental.For detailed information on how to set up incremental refresh, see the incremental refresh article.

Considerações de quando não definir a atualização incrementalConsiderations for when not to set incremental refresh

Não defina um fluxo de dados para a atualização incremental nas seguintes situações:Do not set a dataflow to incremental refresh in the following situations:

  • Entidades vinculadas não devem usar a atualização incremental se fizerem referência a um fluxo de dados.Linked entities should not use incremental refresh if they reference a dataflow. Os fluxos de dados não são compatíveis com a dobragem de consultas (mesmo se a entidade estiver habilitada para o DirectQuery).Dataflows does not support query folding (even if the entity is DirectQuery enabled).
  • Os conjuntos de dados que fazem referência a fluxos de dados não devem usar a atualização incremental.Datasets referencing dataflows should not use incremental refresh. As atualizações dos fluxos de dados geralmente têm um bom desempenho.Refreshes to dataflows should generally perform well. Se as atualizações demorarem mais do que o esperado, considere o uso do mecanismo de computação e o modo DirectQuery.If the refreshes take longer than expected, consider using the compute engine and or DirectQuery mode.

Próximas etapasNext steps

Os seguintes artigos fornecem mais informações sobre os fluxos de dados e o Power BI:The following articles provide more information about dataflows and Power BI: