Amostragem de alta densidade em gráficos de dispersão do Power BIHigh density sampling in Power BI scatter charts

A partir da versão de setembro de 2017 do Power BI Desktop e das atualizações no serviço do Power BI, um novo algoritmo de amostragem está disponível, que melhora a maneira como os gráficos de dispersão representam dados de alta densidade.Beginning with the September 2017 release of the Power BI Desktop and updates to the Power BI service, a new sampling algorithm is available that improves how scatter charts represent high density data.

Por exemplo, você pode criar um gráfico de dispersão com base na atividade de vendas de sua organização, com cada loja tendo dezenas de milhares de pontos de dados a cada ano.For example, you might create a scatter chart from your organization's sales activity, each store having tens of thousands of data points each year. Um gráfico de dispersão de informações como essas extrairá uma amostra de dados (selecione uma representação significativa dos dados, para ilustrar como as vendas ocorreram ao longo do tempo) dos dados disponíveis e crie um gráfico de dispersão que representa os dados subjacentes.A scatter chart of such information would sample data (select a meaningful representation of that data, to illustrate how sales occurred over time) from the available data, and create a scatter chart that represents the underlying data. Essa é uma prática comum nos gráficos de dispersão de alta densidade e o Power BI melhorou sua amostragem de dados de alta densidade, cujos detalhes são descritos neste artigo.This is common practice in high density scatter charts, and Power BI has improved its sampling of high density data, the details of which are described in this article.

Observação

O algoritmo de amostragem de alta densidade descrito neste artigo aplica-se a e está disponível no gráfico de dispersão no Power BI Desktop e no serviço do Power BI.The high density sampling algorithm described in this article applies to, and is available in, scatter charts in both Power BI Desktop and the Power BI service.

Como funcionam os gráficos de dispersão de alta densidadeHow high density scatter charts work

Anteriormente, o Power BI selecionava uma coleção de pontos de dados de exemplo em toda a gama de dados subjacentes de uma maneira determinística para criar um gráfico de dispersão.Previously, Power BI selected a collection of sample data points in the full range of underlying data in a deterministic fashion to create a scatter chart. Especificamente, o Power BI selecionava as primeira e última linhas de dados na série de gráficos de dispersão e, em seguida, dividia as linhas restantes igualmente, de modo que o total de 3.500 pontos de dados fossem plotados no gráfico de dispersão.Specifically, Power BI would select the first and last rows of data in the scatter chart series, then would divide the remaining rows evenly so that 3,500 data points total would be plotted on the scatter chart. Por exemplo, se a amostra tivesse 35.000 linhas, as primeira e última linhas seriam selecionadas para plotagem e, a cada dez linhas, as linhas também seriam plotadas (35.000/10 = a cada dez linhas = 3.500 pontos de dados).For example, if the sample had 35,000 rows, then the first and last rows would be selected for plotting, then every tenth row would also be plotted (35,000 / 10 = every tenth row = 3,500 data points). Também anteriormente, pontos ou valores nulos que não podiam ser plotados (como valores de texto) na série de dados não eram mostrados e, portanto, não eram considerados durante a geração do visual.Also previously, null values or points that could not be plotted (such as text values) in data series weren't shown, and thus were not considered when generating the visual. Com tal amostragem, a densidade percebida do gráfico de dispersão também era baseada nos pontos de dados representativos e, portanto, a densidade implícita do visual era uma particularidade dos pontos amostrados e não da coleção completa dos dados subjacentes.And with such sampling, the perceived density of the scatter chart was also based on the representative data points, and thus the implied visual density was a circumstance of the sampled points, and not the full collection of the underlying data.

Quando você habilita a Amostragem de Alta Densidade, o Power BI implementa um algoritmo que elimina os pontos sobrepostos e garante que os pontos no visual possam ser alcançados durante a interação com o visual.When you enable High Density Sampling, Power BI implements an algorithm that eliminates overlapping points, and ensures that the points on the visual can be reached when interacting with the visual. Ele também garante que todos os pontos no conjunto de dados sejam representados no visual, fornecendo contexto para o significado dos pontos selecionados, em vez de apenas plotar uma amostra representativa.It also ensures that all points in data set are represented in the visual, providing context to the meaning of selected points, rather than just plotting a representative sample.

Por definição, os dados de alta densidade são amostrados para proporcionar visualizações que podem ser criadas com razoável rapidez e que são dinâmicas à interatividade (o excesso de pontos de dados em um visual pode sobrecarregá-lo e desviar a atenção da visibilidade das tendências).By definition, high density data is sampled to enable visualizations that can be created reasonably quickly, and are responsive to interactivity (too many data points on a visual can bog it down, and can detract from the visibility of trends). A maneira como esses dados são amostrados, para oferecer a melhor experiência de visualização e garantir que todos os dados sejam representados, é o que orienta a criação do algoritmo de amostragem.How such data is sampled, to provide the best visualization experience and ensure all data is represented, is what drives the creation of the sampling algorithm. No Power BI, o algoritmo foi aprimorado para fornecer a melhor combinação de capacidade de resposta, representação e preservação clara de pontos importantes no conjunto de dados geral.In Power BI, the algorithm has been improved to provide the best combination of responsiveness, representation, and clear preservation of important points in the overall data set.

Observação

Os gráficos de dispersão que usam o algoritmo de amostragem de alta densidade são mais bem plotados em visuais quadrados, assim como ocorre com todos os gráficos de dispersão.Scatter charts using the high density sampling algorithm are best plotted on square visuals, as with all scatter charts.

Como funciona o novo algoritmo de amostragem de gráfico de dispersãoHow the new scatter chart sampling algorithm works

O novo algoritmo de Amostragem de Alta Densidade para gráficos de dispersão utiliza métodos que capturam e representam os dados subjacentes com mais eficiência e eliminam pontos sobrepostos.The new algorithm for High Density Sampling for scatter charts employs methods that capture and represent the underlying data more effectively, and eliminate overlapping points. Ele faz isso começando com um pequeno raio em cada ponto de dados (o tamanho do círculo visual de determinado ponto na visualização).It does this by starting with a small radius for each data point (the visual circle size for a given point on the visualization). Em seguida, ele aumenta o raio de todos os pontos de dados; quando dois (ou mais) pontos de dados são sobrepostos, um único círculo (do tamanho do raio maior) representa os pontos de dados sobrepostos.It then increases the radius of all data points; when two (or more) data points overlap, a single circle (of the increased radius size) represents those overlapped data points. O algoritmo continua aumentando o raio dos pontos de dados até que o valor do raio resulte em um número razoável de pontos de dados – 3.500 – exibidos no gráfico de dispersão.The algorithm continues to increase the radius of data points, until that radius value results in a reasonable number of data points - 3,500 - being displayed in the scatter chart.

Os métodos deste algoritmo garantem que as exceções sejam representadas no visual resultante.The methods in this algorithm ensure that outliers are represented in the resulting visual. O algoritmo respeita a escala ao determinar a sobreposição também, de modo que as escalas exponenciais sejam visualizadas com fidelidade aos pontos subjacentes visualizados.The algorithm respects scale when determining overlap, too, such that exponential scales are visualized with fidelity to the underlying visualized points.

O algoritmo também preserva a forma geral do gráfico de dispersão.The algorithm also preserves the overall shape of the scatter chart.

Observação

Ao usar o algoritmo de Amostragem de Alta Densidade para gráficos de dispersão, a distribuição precisa dos dados é a meta e a densidade implícita do visual não é a meta.When using the High Density Sampling algorithm for scatter charts, accurate distribution of the data is the goal, and implied visual density is not the goal. Por exemplo, talvez você veja um gráfico de dispersão com vários círculos que se sobrepõem (densidade) em determinada área e imagine que muitos pontos de dados devem estar clusterizados nele. Como o algoritmo de Amostragem de Alta Densidade pode usar um único círculo para representar muitos pontos de dados, uma densidade implícita do visual como essa (ou “clustering”) não será mostrada.For example, you might see a scatter chart with lots of circles that overlap (density) in a certain area, and imagine many data points must be clustered there; since the High Density Sampling algorithm can use one circle to represent many data points, such implied visual density (or "clustering") will not show up. Para obter mais detalhes de determinada área, use as segmentações para ampliar.To get more detail in a given area, you can use slicers to zoom in.

Além disso, os pontos de dados que não podem ser plotados (como valores nulos ou valores de texto) são ignorados, para que outro valor que pode ser plotado seja selecionado, garantindo ainda que a forma verdadeira do gráfico de dispersão seja mantida.In addition, data points that cannot be plotted (such as nulls or text values) are ignored, so another value that can be plotted is selected, further ensuring the true shape of the scatter chart is maintained.

Quando o algoritmo padrão para gráficos de dispersão é usadoWhen the standard algorithm for scatter charts is used

Há circunstâncias em que a Amostragem de Alta Densidade não pode ser aplicada a um gráfico de dispersão e o algoritmo original é usado.There are circumstances under which High Density Sampling cannot be applied to a scatter chart, and the original algorithm is used. Essas circunstâncias são as seguintes:Those circumstances are the following:

  • Se você clicar com o botão direito do mouse em Detalhes e, em seguida, selecionar Mostrar itens sem dados no menu exibido, o gráfico de dispersão será revertido para o algoritmo original.If you right-click on Details, then select Show items with no data from the menu that appears, the scatter chart will revert to the original algorithm.

  • Os valores do eixo Reproduzir resultarão na reversão do gráfico de dispersão para o algoritmo original.Any values in the Play axis will result in the scatter chart reverting to the original algorithm.
  • Se os eixos X e Y estiverem ausentes em um gráfico de dispersão, o gráfico será revertido para o algoritmo original.If both X and Y axes are missing on a scatter chart, the chart reverts to the original algorithm.
  • O uso de uma Linha de proporção no painel Análise resulta na reversão do gráfico para o algoritmo original.Using a Ratio line in the Analytics pane results in the chart reverting to the original algorithm.

Como ativar a amostragem de alta densidade em um gráfico de dispersãoHow to turn on high density sampling for a scatter chart

Para ativar a Amostragem de Alta Densidade, selecione um gráfico de dispersão e, em seguida, acesse o painel Formatação e expanda o cartão Geral.To turn on High Density Sampling, select a scatter chart and then go to the Formatting pane, and expand the General card. Na parte inferior do cartão, um controle deslizante de alternância chamado Amostragem de Alta Densidade está disponível.Near the bottom of that card, a toggle slider called High Density Sampling is available. Para ativá-lo, deslize-o para Ativado.To turn it on, slide it to On.

Observação

Depois que o controle deslizante for ativado, o Power BI tentará usar o algoritmo de Amostragem de Alta Densidade sempre que possível.Once the slider is turned on, Power BI will attempt to use the High Density Sampling algorithm whenever possible. Quando o algoritmo não puder ser usado (por exemplo, você coloca um valor no eixo Reproduzir), o controle deslizante permanecerá na posição Ativado mesmo que o gráfico tenha sido revertido para o algoritmo padrão.When the algorithm cannot be used (for example, you place a value in the Play axis), the slider stays in the On position even though the chart has reverted to the standard algorithm. Se, em seguida, você remover um valor do eixo Reproduzir (ou as condições forem mudadas para habilitar o uso do algoritmo de amostragem de alta densidade), como o controle deslizante está ativado, o gráfico usará a amostragem de alta densidade automaticamente neste gráfico.If you then remove a value from the Play axis (or conditions change to enable use of the high density sampling algorithm), since the slider is on the chart will automatically use high density sampling for that chart.

Observação

Os pontos de dados são agrupados e/ou selecionados pelo índice.Data points are grouped and/or selected by the index. Ter uma legenda não afeta a amostragem do algoritmo, somente a ordenação do visual.Having a legend does not affect sampling for the algorithm, it only affects the ordering of the visual.

Considerações e limitaçõesConsiderations and limitations

O algoritmo de amostragem de alta densidade é uma melhoria importante no Power BI, mas há algumas considerações que você precisa saber ao trabalhar com valores de alta densidade e gráficos de dispersão.The high density sampling algorithm is an important improvement to Power BI, but there are a few considerations you need to know when working with high density values and scatter charts.

  • O algoritmo de Amostragem de Alta Densidade funciona apenas com conexões dinâmicas em modelos baseados no serviço do Power BI, modelos importados ou o DirectQuery.The High Density Sampling algorithm only works with live connections to Power BI service-based models, imported models, or DirectQuery.

Próximas etapasNext steps

Para obter mais informações sobre a amostragem de alta densidade em outros gráficos, consulte o artigo a seguir.For more information about high density sampling in other charts, see the following article.