Identificar valores atípicos com elementos visuais do Power BI

Concluído

Um valor atípico é um tipo de anomalia nos seus dados, algo inesperado ou que o surpreendeu, com base nos resultados ou médias históricas. Irá querer identificar valores atípicos para isolar pontos de dados significativamente diferentes de outros pontos de dados e tomar medidas para investigar os motivos para as diferenças. Os resultados desta análise podem ter um impacto significativo na tomada de decisões empresariais.

Imagine um cenário em que está a analisar os dados do armazém de uma transportadora. Repara que o número de encomendas está acima da média para uma categoria de produtos específica. Primeiro, irá identificar a categoria de produtos. Em seguida, irá fazer perguntas acerca do valor atípico:

  • Houve uma média de entregas superior nesse dia?

  • A anomalia ocorreu num armazém específico?

  • Foi um único evento que determinou o aumento de encomendas para essa categoria específica?

  • Este evento ocorreu noutros dias no último mês, trimestre, ano ou ano passado?

O Power BI permite-lhe identificar valores atípicos nos seus dados, mas, primeiro, precisa de determinar a lógica do que dá origem a um valor atípico. Pode utilizar pontos acionadores, como cálculos, em volta daquilo que considera um valor atípico.

O processo de identificação de valores atípicos envolve a segmentação dos dados em dois grupos: um grupo que corresponde aos dados de valores atípicos e outro grupo que não corresponde a valores a típicos. Pode utilizar colunas calculadas para identificar valores atípicos, mas os resultados seriam estáticos até atualizar os dados. Uma melhor forma de identificar valores atípicos é utilizar uma visualização ou fórmula DAX, porque estes métodos garantem que os seus resultados são dinâmicos.

Após identificar os valores atípicos nos seus dados, pode utilizar segmentações de dados ou filtros para destacar os mesmos. Além disso, pode adicionar uma legenda aos elementos visuais, para que se possam identificar valores atípicos entre outros dados. Em seguida, pode pesquisar os dados atípicos para obter uma análise mais detalhada.

Utilizar um elemento visual para identificar valores atípicos

O melhor elemento visual a utilizar para identificar valores atípicos é o gráfico de dispersão, que mostra a relação entre dois valores numéricos. Os gráficos de dispersão mostram padrões em grandes conjuntos de dados e são, portanto, ideais para mostrar valores atípicos.

Ao adicionar um gráfico de dispersão ao seu relatório do Power BI, coloca os campos relevantes nas secções Eixo X e Eixo Y, respetivamente. Neste caso, o campo Encomendas Enviadas é o eixo X e o campo Quantidade de Encomendas é o eixo Y.

Captura de ecrã a mostrar a adição de campos para preencher um gráfico de dispersão.

O elemento visual será atualizado para mostrar os dados de acordo com os campos selecionados e poderá identificar claramente os valores atípicos nos dados. São os itens isolados que estão afastados da maioria dos dados.

Captura de ecrã a mostrar um gráfico de dispersão com valores atípicos.

Agora que consegue identificar os valores atípicos nos seus dados, pode investigar os motivos para a sua existência e tomar medidas de correção.

Utilizar DAX para identificar valores atípicos

Pode utilizar DAX para criar uma medida que irá identificar os valores atípicos nos seus dados, como na seguinte fórmula:

Outliers =
CALCULATE (
    [Order Qty],
    FILTER (
        VALUES ( Product[Product Name] ),
        COUNTROWS ( FILTER ( Sales, [Order Qty] >= [Min Qty] ) ) > 0
    )
)

Order Qty é uma medida na tabela Vendas e Min Qty refere-se à quantidade de encomendas mais baixa na tabela Vendas

Após criar uma nova medida de valor atípico, pode agrupar os seus produtos em categorias com a funcionalidade de agrupamento, como fez anteriormente ao criar um histograma. Em seguida, tem de adicionar um elemento visual de gráfico de dispersão, como fez na secção anterior, uma vez que esta é a melhor opção de visualização para apresentar valores atípicos. Após adicionar o gráfico de dispersão, irá preenchê-lo com os campos associados à sua fórmula DAX e medida de valor atípico.

Captura de ecrã a mostrar a seleção de campos lógicos atípicos a utilizar num gráfico de dispersão.

No gráfico de dispersão, poderá identificar os valores atípicos nos seus dados. Em seguida, pode investigar os motivos para a sua existência e tomar medidas de correção.

Captura de ecrã a mostrar um gráfico de dispersão para preencher valores atípicos.