Tutorial: Formatar e combinar dados no Power BI Desktop

Com o Power BI Desktop, você pode se conectar a muitos tipos diferentes de fontes de dados e, em seguida, formatar esses dados de acordo com suas necessidades, possibilitando a criação de relatórios visuais para compartilhar com outras pessoas. Formatar dados significa transformá-los: renomear colunas ou tabelas, converter texto em números, remover linhas, definir a primeira linha como títulos etc. Combinar dados significa conectar-se a duas ou mais fontes de dados, formatá-las conforme necessário e, em seguida, consolidá-las em uma consulta útil.

Neste tutorial, você aprenderá como:

  • Formatar dados usando o Editor do Power Query.
  • Conectar-se a diferentes fontes de dados.
  • Combinar essas fontes de dados e criar um modelo de dados a ser usado em relatórios.

Este tutorial demonstra como formatar uma consulta usando o Power BI Desktop, destacando as tarefas mais comuns. A consulta usada aqui é descrita mais detalhadamente, incluindo como criar a consulta do zero, em Introdução ao Power BI Desktop.

O Editor do Power Query no Power BI Desktop faz uso abundante de menus acionados por clique com o botão direito do mouse, bem como da faixa de opções Transformar. A maioria das opções que você pode selecionar na faixa de opções também está disponível com um clique do botão direito do mouse em um item, como uma coluna, e com a seleção de uma opção no menu que é exibido.

Formatar dados

Ao formatar dados no Editor do Power Query, você fornece instruções passo a passo para que o Editor do Power Query realize o ajuste dos dados conforme eles são carregados e apresentados. A fonte de dados original não é afetada; apenas essa exibição específica dos dados é ajustada ou formatada.

As etapas especificadas (como renomear uma tabela, transformar um tipo de dados ou excluir uma coluna) são registradas pelo Editor do Power Query. Toda vez que essa consulta se conecta à fonte de dados, o Editor do Power Query executa essas etapas para que os dados sempre sejam formatados da maneira que você especificar. Esse processo ocorre sempre que você usa o Editor do Power Query ou para qualquer pessoa que usa a sua consulta compartilhada, como no serviço do Power BI. Essas etapas são capturadas sequencialmente no painel Configurações de Consulta, em Etapas Aplicadas. Veremos cada uma dessas etapas nos próximos parágrafos.

Etapas aplicadas nas Configurações de Consulta

Em Introdução ao Power BI Desktop, vamos usar os dados de aposentadoria, que encontramos ao nos conectarmos a uma fonte de dados da Web, para formatá-los de acordo com nossas necessidades. Adicionaremos uma coluna personalizada para calcular a classificação com base em todos os dados sendo fatores iguais e compararemos essa coluna com a coluna existente, Classificação.

  1. Na faixa de opções Adicionar Coluna, selecione Coluna Personalizada, que permite adicionar uma coluna personalizada.

    Selecionar Coluna Personalizada

  2. Na janela Coluna Personalizada, em Nome da nova coluna, insira Nova Classificação. Em Fórmula de coluna personalizada, insira os seguintes dados:

    ([Cost of living] + [Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 8
    
  3. Verifique se a mensagem de status indica Nenhum erro de sintaxe foi detectado e selecione OK.

    Página Coluna Personalizada sem erros de sintaxe

  4. Para manter os dados da coluna consistentes, transforme os valores da nova coluna em números inteiros. Para alterá-los, clique com o botão direito do mouse no título da coluna e, em seguida, selecione Alterar Tipo > Número Inteiro.

    Caso precise escolher mais de uma coluna, selecione uma coluna, mantenha pressionada a tecla SHIFT, selecione colunas adjacentes adicionais e, em seguida, clique com o botão direito do mouse em um título de coluna. Você também pode usar a tecla CTRL para escolher colunas não adjacentes.

    Selecionar os dados da coluna Número Inteiro

  5. Para transformar tipos de dados de coluna, nos quais você transforma o tipo de dados atual em outro, selecione Tipo de Dados Texto na faixa de opções Transformar.

    Selecionar Tipo de Dados Texto

  6. Em Configurações de Consulta, a lista Etapas Aplicadas reflete todas as etapas de formatação aplicadas aos dados. Para remover uma etapa do processo de formatação, selecione o X à esquerda da etapa.

    Na seguinte imagem, a lista Etapas Aplicadas reflete as etapas adicionadas até o momento:

    • Fonte: conexão ao site.

    • Tabela Extraída do HTML: seleção da tabela.

    • Tipo Alterado: alteração das colunas de número baseadas em texto de Texto para Número Inteiro.

    • Personalização Adicionada: adição de uma coluna personalizada.

    • Tipo Alterado 1: a última etapa aplicada.

      Lista de etapas aplicadas

Ajustar os dados

Antes de trabalharmos com essa consulta, precisamos fazer algumas alterações para ajustar os dados:

  • Ajustar as classificações removendo uma coluna.

    Decidimos que o Custo de vida é um não fator em nossos resultados. Depois de remover essa coluna, descobrimos que os dados permanecem inalterados.

  • Corrigir alguns erros.

    Como removemos uma coluna, precisamos reajustar nossos cálculos na coluna Nova Classificação, que envolve a alteração de uma fórmula.

  • Classificar os dados.

    Classifique os dados com base nas colunas Nova Classificação e Classificação.

  • Substituir os dados.

    Destacaremos como substituir um valor específico e a necessidade de inserir uma Etapa Aplicada.

  • Alterar o nome da tabela.

    Como a Tabela 0 não é um descritor útil para a tabela, alteraremos o nome dela.

  1. Para remover a coluna Custo de vida, selecione a coluna, escolha a guia Página Inicial na faixa de opções e, em seguida, selecione Remover Colunas.

    Selecionar Remover Colunas

    Observe que os valores de Nova Classificação não foram alterados devido à ordenação das etapas. Como o Editor do Power Query registra as etapas sequencialmente e de modo independente uma da outra, você pode mover cada Etapa Aplicada para cima ou para baixo da sequência.

  2. Clicar com o botão direito do mouse em uma etapa. O Editor do Power Query fornece um menu que permite executar as seguintes tarefas:

    • Renomear: renomeie a etapa.
    • Excluir: exclua a etapa.
    • Excluir Até o Fim: remova a etapa atual e todas as etapas seguintes.
    • Mover para antes: mova a etapa para cima na lista.
    • Mover para depois: mova a etapa para baixo na lista.
  3. Mova a última etapa, Colunas Removidas, para logo cima da etapa Personalização Adicionada.

    Mover uma etapa para cima em Etapas Aplicadas

  4. Selecione a etapa Personalização Adicionada.

    Observe que agora os dados mostram Erro, o qual precisaremos resolver.

    Resultado de erro nos dados da coluna

    Existem algumas maneiras de obter mais informações sobre cada erro. Se você selecionar a célula sem clicar na palavra Erro, o Editor do Power Query exibirá as informações de erro.

    Informações de erro no Editor do Power Query

    Se você selecionar a palavra Erro diretamente, o Editor do Power Query criará uma Etapa Aplicada no painel Configurações de Consulta e exibirá as informações sobre o erro.

  5. Como não precisamos exibir informações sobre os erros, selecione Cancelar.

  6. Para corrigir os erros, selecione a coluna Nova Classificação e, em seguida, exiba a fórmula de dados da coluna selecionando a caixa de seleção Barra de Fórmulas na guia Exibir.

    Selecionar Barra de Fórmulas

  7. Remova o parâmetro Custo de vida e diminuir o divisor alterando a fórmula da seguinte maneira:

     Table.AddColumn(#"Removed Columns", "New Rank", each ([Weather] + [Health care quality] + [Crime] + [Tax] + [Culture] + [Senior] + [#"Well-being"]) / 7)
    
  8. Marque a marca de seleção verde à esquerda da caixa da fórmula ou pressione Enter.

O Editor do Power Query substitui os dados pelos valores revisados e a etapa Personalização Adicionada é concluída sem erros.

Observação

Selecione também Remover Erros usando a faixa de opções ou o menu de atalho, que remove as linhas com erros. No entanto, não queremos fazer isso neste tutorial porque queríamos preservar os dados na tabela.

  1. Classifique os dados com base na coluna Nova Classificação. Primeiro, selecione a última etapa aplicada, Tipo Alterado1, para exibir os dados mais recentes. Em seguida, selecione a lista suspensa localizada ao lado do cabeçalho de coluna Nova Classificação e selecione Classificar em Ordem Crescente.

    Classificar os dados na coluna Nova Classificação

    Agora os dados estão classificados de acordo com a Nova Classificação. No entanto, se você examinar a coluna Classificação, perceberá que os dados não estão classificados corretamente em casos nos quais o valor de Nova Classificação é um empate. Corrigiremos isso na próxima etapa.

  2. Para corrigir o problema de classificação de dados, selecione a coluna Nova Classificação e altere a fórmula na Barra de Fórmulas para a seguinte fórmula:

     = Table.Sort(#"Changed Type1",{{"New Rank", Order.Ascending},{"Rank", Order.Ascending}})
    
  3. Marque a marca de seleção verde à esquerda da caixa da fórmula ou pressione Enter.

    Agora as linhas estão ordenadas de acordo com as colunas Nova Classificação e Classificação. Além disso, é possível selecionar uma Etapa Aplicada em qualquer lugar na lista e continuar formatando os dados nesse ponto na sequência. O Editor do Power Query insere de maneira automática uma nova etapa diretamente após a Etapa Aplicada selecionada no momento.

  4. Em Etapa Aplicada, selecione a etapa que precede a coluna personalizada, que é a etapa Colunas Removidas. Aqui, substituiremos o valor da classificação Clima no Arizona. Clique com o botão direito na célula apropriada que contém a classificação Clima do Arizona e, em seguida, selecione Substituir Valores. Observe qual Etapa Aplicada está selecionada no momento.

    Selecionar Substituir Valores na coluna

  5. Selecione Inserir.

    Como estamos inserindo uma etapa, o Editor do Power Query nos alerta sobre o perigo de fazer isso, pois as etapas seguintes podem causar uma interrupção na consulta.

    Verificação de Inserir Etapa

  6. Altere o valor dos dados para 51.

    O Editor do Power Query substitui os dados do Arizona. Quando você cria uma Etapa Aplicada, o Editor do Power Query a nomeia com base na ação; nesse caso, Valor Substituído. Se você tiver mais de uma etapa com o mesmo nome na consulta, o Editor do Power Query adicionará um número (em sequência) a cada Etapa Aplicada seguinte, para diferenciá-las.

  7. Selecione a última Etapa Aplicada, Linhas Classificadas.

    Observe que os dados foram alterados em relação à nova classificação do Arizona. Essa alteração ocorre porque inserimos a etapa Valor Substituído na localização correta, antes da etapa Personalização Adicionada.

  8. Por fim, desejamos alterar o nome dessa tabela para algo descritivo. No painel Configurações de Consulta, em Propriedades, insira o novo nome da tabela e, em seguida, selecione Enter. Nomeie essa tabela RetirementStats.

    Renomear tabela em Configurações de Consulta

    Quando começamos a criar relatórios, é útil ter nomes de tabelas descritivos, especialmente quando nos conectamos a várias fontes de dados, que estão listadas no painel Campos da exibição Relatório.

    Agora formatamos nossos dados na medida necessária. Em seguida, vamos nos conectar a outra fonte de dados e combinar dados.

Combinar dados

Os dados sobre vários estados são interessantes e serão úteis para a criação de consultas e esforços de análise adicionais. Mas há um problema: a maioria dos dados usam uma abreviação de duas letras para códigos de estado, em vez de utilizar o nome completo do estado. Precisamos de uma maneira de associar os nomes de estados às respectivas abreviações.

Estamos com sorte: há outra fonte de dados pública que faz exatamente isso, mas ela precisa de uma quantidade razoável de formatação antes que possamos conectá-la à nossa tabela de aposentadoria. Para formatar os dados, siga estas etapas:

  1. Na faixa de opções Página Inicial no Editor do Power Query, selecione Nova Fonte > Web.

  2. Insira o endereço do site de abreviações de estados, https://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations , e, em seguida, selecione Conectar.

    O Navegador exibirá o conteúdo do site.

    Página do Navegador

  3. Selecione Códigos e abreviações.

    Dica

    Será necessário um pouco de formatação para reduzir os dados dessa tabela até o que desejamos. Há uma maneira mais rápida ou mais fácil de realizar as etapas abaixo? Sim, podemos criar uma relação entre as duas tabelas e formatar os dados com base nessa relação. As etapas a seguir ainda são úteis para aprender a trabalhar com tabelas; no entanto, as relações podem ajudar você rapidamente a usar os dados de várias tabelas.

Para colocar os dados em forma, siga estas etapas:

  1. Remova a linha superior. Como ela é o resultado do modo como a tabela da página Web foi criada, não precisamos dela. Na faixa de opções Página Inicial, selecione Remover Linhas > Remover Primeiras Linhas.

    Selecionar Remover Linhas Superiores

    A janela Remover Primeiras Linhas é exibida, permitindo que você especifique o número de linhas que deseja remover.

    Observação

    Se, acidentalmente, o Power BI importar os cabeçalhos de tabela como uma linha em sua tabela de dados, você pode selecionar Usar Primeira Linha como Cabeçalho da guia Página Inicial, ou na guia Transformar na faixa de opções, para corrigir a tabela.

  2. Remova as últimas 26 linhas. Essas linhas são territórios dos EUA, que não precisamos incluir. Na faixa de opções Página Inicial, selecione Remover Linhas > Remover Últimas Linhas.

    Selecionar Remover Linhas Inferiores

  3. Como a tabela RetirementStats não contém informações de Washington D.C., precisamos filtrá-la de nossa lista. Selecione a lista suspensa Status da Região e, em seguida, desmarque a caixa de seleção ao lado de Distrito federal.

    Limpar caixa de seleção Distrito federal

  4. Remova algumas colunas desnecessárias. Como precisamos apenas do mapeamento de cada estado para a respectiva abreviação oficial de duas letras, podemos remover diversas colunas. Primeiro, selecione uma coluna, mantenha a tecla CTRL pressionada e selecione cada uma das outras colunas a serem removidas. Na guia Página Inicial da faixa de opções, selecione Remover Colunas > Remover Colunas.

    Remover coluna

    Observação

    Agora é um bom momento para salientar que a sequência de etapas aplicadas no Editor do Power Query é importante e pode afetar a maneira como os dados são moldados. Também é importante considerar como uma etapa pode afetar outra etapa subsequente; se você remover uma etapa das Etapas Aplicadas, as etapas subsequentes podem não se comportar como pretendido originalmente, devido ao impacto da sequência de etapas da consulta.

    Observação

    Ao redimensionar a janela do Editor do Power Query para diminuir a largura, alguns itens de faixa de opções são condensados para fazer o melhor uso do espaço visível. Ao aumentar a largura da janela do Editor do Power Query, os itens da faixa de opções são expandidos para fazer o melhor uso da área aumentada da faixa de opções.

  5. Renomeie as colunas e a tabela. Há algumas maneiras de renomear uma coluna: primeiro selecione a coluna e depois selecione Renomear na guia Transformar na faixa de opções ou clique com o botão direito do mouse e selecione Renomear. A imagem a seguir tem setas apontando para ambas as opções; você precisa escolher apenas uma.

    Renomear coluna no Editor do Power Query

  6. Renomeie as colunas para State Name e State Code. Para renomear a tabela, insira o Nome no painel Configurações de Consulta. Nomeie essa tabela StateCodes.

Combinar consultas

Agora que formatamos a tabela StateCodes da maneira que desejamos, vamos combinar essas duas tabelas, ou consultas, em uma só. Como as tabelas que temos agora são o resultado das consultas que aplicamos aos dados, elas são geralmente chamadas de consultas.

Há duas maneiras principais de combinar consultas: mesclando e acrescentando.

  • Quando você tem uma ou mais colunas que deseja adicionar a outra consulta, você mescla as consultas.
  • Quando você tem linhas adicionais de dados que deseja adicionar a uma consulta existente, você acrescenta a consulta.

Nesse caso, queremos mesclar as consultas. Para fazer isso, siga estas etapas:

  1. No painel esquerdo do Editor do Power Query, selecione a consulta na qual deseja mesclar a outra consulta. Nesse caso, RetirementStats.

  2. Selecione Mesclar Consultas > Mesclar Consultas na guia Página Inicial na faixa de opções.

    Selecionar Mesclar Consultas

    Talvez você precise definir os níveis de privacidade, a fim de garantir que os dados sejam combinados sem incluir nem transferir dados que você não deseja transferir.

    A janela Mesclar será exibida. Ela solicita a seleção da tabela que você deseja mesclar com a tabela selecionada e as colunas correspondentes a serem usadas para a mesclagem.

  3. Selecione State na tabela RetirementStats e, em seguida, a consulta StateCodes.

    Quando você seleciona as colunas correspondentes corretas, o botão OK é habilitado.

    Janela Mesclar

  4. Selecione OK.

    O Editor do Power Query cria uma coluna ao final da consulta, que consiste no conteúdo da tabela (consulta) que foi mesclada com a consulta existente. Todas as colunas da consulta mesclada são condensadas na coluna, mas você pode Expandir a tabela e incluir todas as colunas que quiser.

    Coluna NewColumn

  5. Para expandir a tabela mesclada e selecionar as colunas a serem incluídas, selecione o ícone de expansão (ícone Expandir).

    A janela Expandir é exibida.

    NewColumn na consulta

  6. Nesse caso, queremos apenas a coluna State Code. Selecione essa coluna, desmarque Usar nome da coluna original como prefixo e, em seguida, selecione OK.

    Se tivéssemos deixado a caixa de seleção marcada para Usar o nome da coluna original como prefixo, a coluna mesclada seria nomeada NewColumn.State Code.

    Observação

    Deseja explorar como inserir a tabela NewColumn? Você pode experimentar um pouco e, se não gostar dos resultados, basta excluir essa etapa da lista Etapas Aplicadas no painel Configurações de Consulta; sua consulta retornará ao estado anterior à aplicação dessa etapa Expandir. Você pode fazer isso quantas vezes quiser, até que o processo de expansão tenha a aparência desejada.

    Agora temos uma única consulta (tabela) que combina duas fontes de dados, cada uma moldada para atender às nossas necessidades. Essa consulta pode servir como base para muitas conexões de dados adicionais e interessantes, como estatísticas de custo de moradia, dados demográficos ou oportunidades de trabalho em qualquer estado.

  7. Para aplicar as alterações e fechar o Editor do Power Query, selecione Fechar e Aplicar na guia de faixa de opções Página Inicial.

    O conjunto de dados transformado aparece no Power BI Desktop, pronto para ser usado para a criação de relatórios.

    Selecionar Fechar e Aplicar

Próximas etapas

Para obter mais informações sobre o Power BI Desktop e as funcionalidades dele, confira os seguintes recursos: