Limitações e considerações dos fluxos de dadosDataflows limitations and considerations

Há algumas limitações dos fluxos de dados que os usuários devem ter em mente, relativas à criação, às atualizações e ao gerenciamento de capacidade, conforme descrito nas seções a seguir.There are a few dataflow limitations across authoring, refreshes, and capacity management that users should keep in mind, as described in the following sections.

Limitações geraisGeneral limitations

  • A paridade de recursos entre ambientes governamentais pode ser encontrada no artigo Disponibilidade do recurso do Power BI para governo.Feature parity across government environments can be found in the Power BI feature availability for government article.
  • As fontes de fonte excluídas não são removidas da página da fonte de dados do fluxo de dados.Deleted datasources are not removed from the dataflow datasource page. Esse é um comportamento benigno e não afeta a atualização nem a edição de fluxos de dados.This is a benign behavior and does not impact the refresh or editing of dataflows. No modo de exibição de diagrama, as fontes de dados excluídas aparecem como linhagem para um fluxo de dados.In Diagram View, deleted data sources appear as lineage for a dataflow.
  • As fontes de dados excluídas ainda serão exibidas na página Configuração na lista suspensa de gateway.Deleted datasources will still appear in the Setting page in the gateway drop-down.
  • A profundidade é igual a fluxos de dados vinculados a outros fluxos de dados.Depth equates to dataflows linked to other dataflows. A profundidade máxima atual é 32.The current maximum depth is 32.
  • A amplitude é igual a entidades dentro de um fluxo de dados.Breadth equates to entities within a dataflow.
    • Não há nenhuma orientação ou limite para o número ideal de entidades em um fluxo de fluxos. No entanto, os fluxos de dados compartilhados tem um limite de atualização de duas horas por entidade e três por fluxo de dados.There is no guidance or limits for the optimal number of entities is in a dataflow, however, shared dataflows have a refresh limit of two hours per entity, and three per dataflow. Portanto, se você tiver duas entidades e cada uma delas levar duas horas, você não deverá colocá-las no mesmo fluxo de dados.So if you have two entities, and each takes two hours, you shouldn't put them in the same dataflow.
    • Para o Power BI Premium, as diretrizes e os limites são orientados por casos de uso individuais, em vez de requisitos específicos.For Power BI Premium, guidance and limits are driven by individual use cases rather than specific requirements. O único requisito para o Power BI Premium é uma atualização de 24 horas por fluxo de dados.The only for Power BI Premium is a 24-hour refresh per dataflow.
  • Uma assinatura do Power BI Premium será necessária para atualizar mais de dez fluxos de dados entre workspacesA Power BI Premium subscription is required in order to refresh more than ten dataflows cross workspace
  • As limitações do PowerQuery são encontradas no artigo de limites de uso do PowerQuery Online.PowerQuery limitations are found in the PowerQuery Online usage limits article.
  • Os fluxos de dados do Power BI não dão suporte ao uso de variáveis globais em um argumento de URL.Power BI dataflows do not support use of global variables in a URL argument.
  • O Multi-Geo não tem suporte no momento.Multi-Geo is currently not supported.
  • O suporte a Vnet é obtido usando um gateway.Vnet support is achieved by using a gateway.
  • Ao usar Entidades computadas com fontes de dados de gateway, a ingestão de dados deverá ser executada em fontes de dados diferentes daquelas dos cálculos.When using Computed entities with gateway data sources, the data ingestion should be performed in different data sources than the computations. As entidades computadas devem se basear em entidades que são usadas apenas para ingestão e não ingerir dados em suas próprias etapas de mashup.The computed entities should build upon entities that are only used for ingestion, and not ingest data within their own mash-up steps.

Criação de fluxo de dadosDataflow authoring

Ao criar fluxos de dados, os usuários devem estar atentos às seguintes considerações:When authoring dataflows, users should be mindful of the following considerations:

  • A criação nos fluxos de dados é feita no ambiente do PQO (Power Query Online); veja as limitações descritas em Limites do Power Query.Authoring in Dataflows is done in the Power Query Online (PQO) environment; see the limitations described in Power Query limits. Como a criação de fluxos de dados é feita no ambiente do PQO (Power Query Online), as atualizações executadas nas configurações de carga de trabalho de fluxos de dados só afetarão a atualização e não a experiência de criaçãoBecause dataflows authoring is done in the Power Query Online (PQO) environment, updates performed on the Dataflows workload configurations only impact refreshes, and will not have an impact on the authoring experience

  • Os fluxos de dados só podem ser modificados por seus proprietáriosDataflows can only be modified by their owners

  • Os fluxos de trabalho não ficam disponíveis em Meu WorkspaceDataflows are not available in My Workspace

  • Os fluxos de dados que usam fontes de dados de gateway não são compatíveis com várias credenciais para a mesma fonte de dadosDataflows using gateway data sources do not support multiple credentials for the same data source

  • O uso do conector Web.Page requer um gatewayUsing the Web.Page connector requires a gateway

Considerações sobre APIAPI considerations

Encontre mais informações sobre as APIs REST de fluxos de dados com suporte na Referência de API REST.More about supported Dataflows REST APIs can be found in the REST API reference. Aqui estão algumas considerações para ter em mente:Here are some considerations to keep in mind:

  • A Exportação e Importação de um fluxo de dados dá a ele uma nova IDExporting and Importing a dataflow gives that dataflow a new ID

  • A importação de fluxos de dados que contêm tabelas vinculadas não corrigirá as referências existentes no fluxo de dados (essas consultas devem ser corrigidas manualmente antes de importar o fluxo de dados)Importing dataflows that contain linked tables will not fix the existing references within the dataflow (these queries should be fixed manually before importing the dataflow)

  • Os fluxos de dados podem ser substituídos pelo parâmetro CreateOrOverwrite, se tiverem sido criados usando a API de importaçãoDataflows can be overwritten with the CreateOrOverwrite parameter, if they have initially been created using the import API

Fluxos de dados compartilhadosDataflows in shared

Há limitações para fluxos de dados em capacidades compartilhadas:There are limitations for Dataflows in shared capacities:

  • Ao atualizar fluxos de dados, os tempos limite em capacidades compartilhadas são de duas horas por tabela e de três horas por fluxo de dadosWhen refreshing Dataflows, timeouts in Shared are 2 hours per table, and 3 hours per Dataflow
  • As tabelas vinculadas não podem ser criadas em fluxo de dados compartilhados, embora possam existir no fluxo de dados, desde que a propriedade Carregamento Habilitado na consulta seja desabilitadaLinked tables cannot be created in shared Dataflows, although they can exist within the Dataflow as long as the Load Enabled property on the query is disabled
  • As tabelas computadas não podem ser criadas em fluxos de dados compartilhadosComputed tables cannot be created in shared Dataflows
  • Os serviços AutoML e Cognitivos não estão disponíveis em fluxos de dados compartilhadosAutoML and Cognitive services are not available in shared Dataflows
  • A atualização incremental não funciona em fluxos de trabalho compartilhadosIncremental refresh does not work in shared Dataflows

Fluxos de dados no PremiumDataflows in Premium

Os fluxos de dados que existem no Premium têm as limitações e considerações a seguir.Dataflows that exist in Premium have the following limitations and considerations.

Atualizações e considerações de dados:Refreshes and data considerations:

  • Ao atualizar fluxos de dados, os tempos limite são de 24 horas (sem distinção entre tabelas e/ou fluxos de dados)When refreshing Dataflows, timeouts are 24 hours (no distinction for tables and/or dataflows)

  • Alterar um fluxo de dados de uma política de atualização incremental para uma atualização normal ou vice-versa, removerá todos os dadosChanging a dataflow from an incremental refresh policy to a normal refresh, or vice versa, will drop all data

  • Modificar o esquema de um fluxo de dados removerá todos os dadosModifying a dataflow's schema will drop all data

  • Ao usar uma licença PPU (Premium por usuário) com fluxos de dados, os dados são apagados quando eles forem movidos para fora de um ambiente PPUWhen using a Premium Per User (PPU) license with dataflows, data is cleared when moving data out of a PPU environment

  • Quando um fluxo de dados é atualizado em um contexto de PPU (Premium por usuário), os dados não são visíveis para usuários não PPUWhen a dataflow is refreshed in a Premium Per User (PPU) context, the data is not visible to non-PPU users

Tabelas vinculadas e computadas:Linked and Computed tables:

  • As tabelas vinculadas podem chegar a uma profundidade de 32 referênciasLinked tables can go down to a depth of 32 references

  • As dependências cíclicas de tabelas vinculadas não são permitidasCyclic dependencies of linked tables are not allowed

  • Uma tabela vinculada não pode ser associada a uma tabela normal que obtém dados de uma fonte de dados localA linked table can't be joined with a regular table that gets its data from an on-premises data source

  • Quando uma consulta (consulta A, por exemplo) é usada no cálculo de outra consulta (consulta B) em fluxos de dados, a consulta B torna-se uma tabela calculada.When a query (query A, for example) is used in the calculation of another query (query B) in dataflows, query B becomes a calculated table. As tabelas calculadas não podem se referir a fontes locais.Calculated tables cannot refer to on-premises sources.

Mecanismo de computação:Compute Engine:

  • Ao usar o Mecanismo de computação, há um aumento aproximado de 10% a 20% no tempo para a ingestão de dados.While using the Compute engine, there is an approximate 10% to 20% initial increase in time for data ingestion.

    • Isso é aplicado somente ao primeiro fluxo de dados que está no mecanismo de computação e que lê os dados da fonteThis only applied to the first dataflow that is on the compute engine, and reads data from the data source
    • Os fluxos de dados subsequentes que usam o fluxo de dados de origem não sofrerão a mesma penalidadeSubsequent dataflows that use the source dataflow will not incur the same penalty
  • Somente algumas operações usam o mecanismo de computação e somente quando usadas por uma tabela vinculada ou como uma tabela computada.Only certain operations make use of the compute engine, and only when used through a linked table or as a computed table. Uma lista completa de operações está disponível nesta postagem de blog.A full list of operations is available in this blog post.

Gerenciamento de capacidade:Capacity Management:

  • Por padrão, as capacidades do Power BI Premium têm um Resource Manager interno que restringe as cargas de trabalho de maneiras diferentes quando a capacidade está sendo executada com memória insuficiente.By design, the Premium Power BI Capacities have an internal Resource Manager which throttles the workloads in different ways when the capacity is running on low memory.

    1. Nos fluxos de dados, essa pressão de limitação reduz o número de contêineres M disponíveisFor Dataflows, this throttling pressure reduces the number of available M Containers
    2. A memória para os fluxos de dados pode ser definida a 100%, com um contêiner de tamanho adequado para os tamanhos de dados e a carga de trabalho gerenciará o número de contêineres adequadamenteThe memory for Dataflows can be set to 100%, with an appropriately sized container for your data sizes, and the workload will manage the number of containers appropriately
  • O número aproximado de contêineres pode ser encontrado dividindo a memória total alocada para a carga de trabalho pela quantidade de memória alocada a um contêinerThe approximate number of containers can be found out by dividing the total memory allocated to the workload by the amount of memory allocated to a container

Uso de fluxo de dados em conjuntos de dadosDataflow usage in datasets

  • Ao criar um conjunto de dados no Power BI Desktop e, em seguida, publicá-lo no serviço do Power BI, as credenciais da fonte de dados de fluxo de dados usadas no Power BI Desktop devem ser as mesmas usadas quando o conjunto de dados é publicado no serviço.When creating a dataset in Power BI Desktop, and then publishing it to the Power BI service, ensure the credentials used in Power BI Desktop for the Dataflows data source are the same credentials used when the dataset is published to the service.
    1. Caso essas credenciais não sejam as mesmas, ocorrerá o erro Chave não encontrada na atualização do conjunto de dadosFailing to ensure those credentials are the same results in a Key not found error upon dataset refresh

Limitações do ADLSADLS limitations

  • O ADLS não está disponível em ambientes GCC, GCC High ou DOD.ADLS is not available in GCC, GCC High or DOD environments. Confira Power BI para clientes do governo dos EUA para obter mais informações.See Power BI for US government customers for more information.
  • Você deve ser proprietário do recurso, devido a alterações nas APIs do ADLS Gen 2.You must be assigned as an owner of the resource, due to changes in the ADLS Gen 2 APIs.
  • Não há suporte para a migração de assinatura do Azure, mas há duas alternativas para fazer isso:Azure subscription migration is not supported, but there are two alternatives to do so:
    • Primeira abordagem: após a migração, o usuário poderá desanexar workspaces e reanexá-los.First approach: after migration, the user can detach workspaces and reattach them. Se estiver usando a conta de nível de locatário, você deverá desanexar todos os workspaces, desanexar no nível do locatário e reanexá-los.If using the tenant level account, you must detach all workspaces then detach at the tenant level, and reattach. Isso pode ser indesejável para clientes que não querem excluir todos os seus fluxos de dados nem ter muitos workspaces.This can be undesirable for customers who don't want to delete all of their dataflows, or have many workspaces.
    • Segunda abordagem: se a abordagem anterior não for viável, envie uma solicitação de suporte para alterar a ID da assinatura no banco de dados.Second approach: if the previous approach isn't feasible, submit a support request to change the subscription ID in the database.
  • O ADLS não dá suporte à maioria dos elementos na lista da seção Diretórios e nomes de arquivo do artigo para nomenclatura de workspace e de fluxo de dados, devido às seguintes limitações:ADLS doesn't support most elements in the list in the Directories and file names section of the article for workspace naming and dataflow naming, due to the following limitations:
    • O Power BI retorna um erro não útil ou permite que o processo aconteça, mas a atualização falhará.Power BI either returns an unhelpful error, or allows the process to happen but the refresh will fail.
  • Não há suporte para assinaturas do ADLS entre locatários.Cross tenant ADLS subscriptions are not supported. O ADLS anexado ao Power BI precisa fazer parte do mesmo locatário do Azure que o Power BI usa para o Azure AD (Azure Active Directory).The ADLS attached to Power BI must be part of the same Azure tenant that Power BI uses for Azure Active Directory (Azure AD).

Tipos de dados de fluxo de dadosDataflow data types

Os tipos de dados compatíveis com os fluxos de dados são os seguintes:The data types supported in dataflows are the following:

Tipo de dados de mashupMashup data type Tipo de dados de fluxo de dadosDataflow data type
HoraTime HoraTime
DataDate DataDate
DatetimeDateTime DateTimeDateTime
DateTimeZoneDateTimeZone DateTimeOffsetDateTimeOffset
LógicoLogical BooleanBoolean
TextoText Cadeia de caracteresString
QualquerAny StringString
MoedaCurrency DecimalDecimal
Int8Int8 Int64Int64
Int16Int16 Int64Int64
Int32Int32 Int64Int64
Int64Int64 Int64Int64
DoubleDouble DoubleDouble
PercentualPercentage DoubleDouble
SingleSingle DoubleDouble
DecimalDecimal DoubleDouble
NúmeroNumber DoubleDouble
DurationDuration Sem suporteNot Supported
BinárioBinary Sem suporteNot Supported
FunçãoFunction Sem suporteNot Supported
TabelaTable Sem suporteNot Supported
ListaList Sem suporteNot Supported
RecordRecord Sem suporteNot Supported
TipoType Sem suporteNot Supported
AçãoAction Sem suporteNot Supported
NenhumNone Sem suporteNot Supported
NuloNull Sem suporteNot Supported

Próximas etapasNext steps

Os seguintes artigos fornecem mais informações sobre os fluxos de dados e o Power BI:The following articles provide more information about dataflows and Power BI: