Recursos Premium de fluxos de dados

Artigo
11/10/2023

Os fluxos de dados são compatíveis com usuários do Power BI Pro, do PPU (Premium por Usuário) e do Power BI Premium. Alguns recursos estão disponíveis somente com uma assinatura do Power BI Premium (que seria uma capacidade Premium ou uma licença PPU). Este artigo descreve e detalha os recursos somente Premium e PPU seus usos.

Os recursos a seguir estão disponíveis apenas com o Power BI Premium (PPU ou uma assinatura de capacidade Premium):

Mecanismo de computação aprimorado
DirectQuery
Entidades computadas
Entidades vinculadas
Atualização incremental

As seções a seguir descrevem cada um desses recursos em detalhes.

Importante

Este artigo se aplica à primeira geração de fluxos de dados (Gen1) e não se aplica à segunda geração (Gen2) de fluxos de dados, que estão disponíveis no Microsoft Fabric (versão prévia). Para obter mais informações, consulte Passando de fluxos de dados Geração 1 para fluxos de dados Geração 2.

O mecanismo de computação aprimorado

O mecanismo de computação aprimorado do Power BI permite que os assinantes do Power BI Premium usem a capacidade de otimizar o uso de fluxos de dados. O uso do mecanismo de computação aprimorado oferece as seguintes vantagens:

Reduz drasticamente o tempo de atualização necessário para etapas de ETL (extrair, transformar, carregar) de longa execução em entidades computadas, como a execução de operações de junções, contagens distintas, filtros e agrupar por.
Executa consultas do DirectQuery em todas as entidades.

Observação

Os processos de validação e atualização informam quais são os fluxos de dados do esquema de modelo. Para definir o esquema de tabelas por conta própria, use o Editor do Power Query e determine os tipos de dados.
Esse recurso está disponível em todos os clusters do Power BI, exceto WABI-INDIA-CENTRAL-A-PRIMARY

Habilitar o mecanismo de computação aprimorado

Importante

O mecanismo de computação aprimorado funciona apenas para capacidades A3 e superiores do Power BI.

No Power BI Premium, o mecanismo de computação aprimorado é definido individualmente para cada fluxo de dados. Há três configurações para escolher:

Desabilitado
Otimizado (padrão) – o mecanismo de computação aprimorado está desativado. Ele é ativado automaticamente quando uma tabela no fluxo de dados é referenciada por outra tabela ou quando o fluxo de dados está conectado a outro fluxo de dados no mesmo workspace.
Ativado

Para alterar a configuração padrão e habilitar o mecanismo de computação aprimorado, siga estas etapas:

Em seu workspace, ao lado do fluxo de dados para o qual você deseja alterar as configurações, selecione Mais opções.
No menu Mais opções do fluxo de dados, selecione Configurações.
Expanda as Configurações do Mecanismo de Computação Aprimorado.
Nas configurações do mecanismo de computação aprimorado, selecioneAtivar e escolha Aplicar.

Usar o mecanismo de computação aprimorado

Depois que o mecanismo de computação aprimorado for ativado, retorne aos fluxos de dados e você verá um aprimoramento no desempenho de qualquer tabela computada que execute operações complexas, como junções ou agrupar por para fluxos de dados criados com base nas entidades vinculadas existentes na mesma capacidade.

Para fazer o melhor uso do mecanismo de computação, divida o estágio de ETL em dois fluxos de dados separados da seguinte maneira:

Fluxo de dados 1: esse fluxo de dados só deverá ingerir tudo o que é necessário de uma fonte de dados.
Fluxo de dados 2: execute todas as operações de ETL nesse segundo fluxo de dados, mas referencie o fluxo de dados 1, que deverá estar na mesma capacidade. Além disso, verifique se você executa operações que podem ser dobradas primeiro: filtrar, agrupar por, distinto, unir). Execute essas operações antes de qualquer outra operação para garantir o uso do mecanismo de computação.

Perguntas comuns e respostas

Pergunta: Habilitei o mecanismo de computação aprimorado, mas minhas atualizações são mais lentas. Por que?

Resposta: Se você habilitar o mecanismo de computação aprimorado, haverá duas explicações possíveis que podem levar a tempos de atualização mais lentos:

Quando o mecanismo de computação aprimorado é habilitado, ele exige memória para funcionar corretamente. Assim, a memória disponível para executar uma atualização é reduzida e, portanto, aumenta a probabilidade de as atualizações serem colocadas na fila. Esse aumento reduz o número de fluxos de dados que podem ser atualizados simultaneamente. Para resolver esse problema, ao habilitar a computação aprimorada, aumente a memória atribuída aos fluxos de dados, a fim de garantir que a memória disponível para as atualizações de fluxos de dados simultâneos permaneça a mesma.
Outro motivo pelo qual você pode se deparar com atualizações mais lentas é que o mecanismo de computação funciona apenas em entidades existentes. Se o fluxo de dados fizer referência a uma fonte de dados que não é um fluxo de dados, você não verá nenhum aprimoramento. Não haverá aumento de desempenho, pois, em alguns cenários de Big Data, a leitura inicial de uma fonte de dados será mais lenta, porque os dados precisam ser transmitidos para o mecanismo de computação aprimorado.

Pergunta: não consigo ver a alternância do mecanismo de computação aprimorado. Por quê?

Resposta o mecanismo de computação aprimorado está sendo lançado em estágios em regiões em todo o mundo, mas ainda não está disponível em todas as regiões.

Pergunta: Quais são os tipos de dados compatíveis com o mecanismo de computação?

Resposta: Atualmente, o mecanismo de computação aprimorado e os fluxos de dados dão suporte aos tipos de dados a seguir. Se o fluxo de dados não usar um dos seguintes tipos de dados, ocorrerá um erro durante a atualização:

Data/hora
Número decimal
Texto
Número inteiro
Data/hora/fuso horário
Verdadeiro/Falso
Data
Hora

Usar o DirectQuery com fluxos de dados no Power BI

Você pode usar o DirectQuery para se conectar diretamente aos fluxos de dados e, portanto, conectar-se diretamente ao seu fluxo de dados sem ter que importar os respectivos dados.

O uso do DirectQuery com fluxos de dados permite os seguintes aprimoramentos aos seus processos de Power BI e de fluxo de dados:

Evitar agendas de atualização separadas – o DirectQuery se conecta diretamente a um fluxo de dados, eliminando a necessidade de criar um modelo semântico importado. Dessa forma, o uso do DirectQuery com seus fluxos de dados significa que não há mais necessidade de agendar atualizações separadamente para o fluxo de dados e o modelo semântico a fim de garantir que os dados fiquem sincronizados.
Filtragem de dados – o DirectQuery é útil para trabalhar em uma exibição filtrada de dados dentro de um fluxo de dados. Você pode usar o DirectQuery com o mecanismo de computação para filtrar dados de fluxo de dados e trabalhar com o subconjunto filtrado necessário. Filtrar dados permite que você trabalhe com um subconjunto menor e mais gerenciável dos dados em seu fluxo de dados.

Usar DirectQuery para fluxos de dados

O uso do DirectQuery com fluxos de dados está disponível no Power BI Desktop.

Há pré-requisitos para usar o DirectQuery com fluxos de dados:

O fluxo de dados precisa residir em um workspace habilitado para o Power BI Premium.
O mecanismo de computação precisa estar ativado.

Para saber mais sobre o DirectQuery com fluxos de dados, confira Como usar o DirectQuery com fluxos de dados.

Habilitar o DirectQuery para fluxos de dados

Para garantir que o fluxo de dados esteja disponível para acesso pelo DirectQuery, o mecanismo de computação aprimorado precisa estar em seu estado otimizado. Para habilitar o DirectQuery para fluxos de dados, defina a nova opção Configurações aprimoradas do mecanismo de computação para Ativado.

Screenshot of the enhanced compute engine settings with the on option selected.

Depois de aplicar essa configuração, atualize o fluxo de dados para que a otimização entre em vigor.

Considerações e limitações do DirectQuery

Existem algumas limitações conhecidas com o DirectQuery e os fluxos de dados:

Modelos compostos/mistos que têm fontes de dados do DirectQuery e de importação não são compatíveis atualmente.
Grandes fluxos de dados podem ter problemas de tempo limite ao exibir visualizações. Grandes fluxos de dados que encontrarem problemas de tempo limite devem usar o Modo de importação.
Em configurações da fonte de dados, o conector de fluxo de dados mostrará credenciais inválidas se você estiver usando o DirectQuery. Este aviso não afeta o comportamento e o modelo semântico funcionará corretamente.

Entidades computadas

Você pode executar cálculos em armazenamento ao usar fluxos de dados com uma assinatura do Power BI Premium. Esse recurso permite que você realize cálculos em seus fluxos de dados existentes e retorne resultados que permitem que você se concentre na criação e na análise de relatórios.

Screenshot of a Power Query Editor, highlighting a table that is being edited.

Para executar cálculos em armazenamento, primeiro você deve criar o fluxo de dados e trazer dados para esse armazenamento de fluxo de dados do Power BI. Depois de ter um fluxo de dados que contém dados, você pode criar entidades computadas, que são entidades que executam cálculos em armazenamento.

Considerações e limitações das entidades computadas

Ao trabalharem com fluxos de dados criados em uma conta do Azure Data Lake Storage Gen2 da organização, entidades vinculadas e entidades computadas só funcionam corretamente quando residem na mesma conta de armazenamento.

Como melhor prática, ao fazer computações em dados unidos por dados locais e na nuvem, crie um novo fluxo de dados para cada fonte (um para a local e outro para a nuvem) e, em seguida, crie um terceiro fluxo de dados para mesclar/computar nessas duas fontes de dados.

Entidades vinculadas

Você pode fazer referência a fluxos de dados existentes usando entidades vinculadas com uma assinatura do Power BI Premium, que permite executar os cálculos nessas entidades usando entidades computadas ou permite que você crie uma tabela de "única fonte da verdade" que pode ser reutilizada em vários fluxos de dados.

Atualização incremental

Os fluxos de dados podem ser definidos para atualização incremental a fim de evitar ter que efetuar pull em todas as atualizações. Para fazer isso, selecione o fluxo de dados e, em seguida, selecione o ícone de Atualização Incremental.

Screenshot of the table in a Power BI dataflow with the Incremental Refresh icon highlighted.

A configuração da atualização incremental adiciona parâmetros ao fluxo de dados para especificar o intervalo de datas. Para obter informações detalhadas sobre como configurar a atualização incremental, confira Usar a atualização incremental com fluxos de dados.