analisar dados em Azure Data Lake Storage Gen2 usando Power BI

neste artigo, você aprenderá a usar Power BI Desktop para analisar e visualizar dados armazenados em uma conta de armazenamento que tem um namespace hierárquico (Azure Data Lake Storage Gen2).

Pré-requisitos

Antes de iniciar este tutorial, você deverá ter os seguintes pré-requisitos:

  • Uma assinatura do Azure. Consulte Obter a avaliação gratuita do Azure.
  • Uma conta de armazenamento que tem um namespace hierárquico. Siga estas instruções para criar um. Este artigo pressupõe que você criou uma conta de armazenamento denominada myadlsg2 .
  • Você recebe uma das seguintes funções para a conta de armazenamento: leitor de dados de blob, colaborador de dados de blob ou proprietário de dados de blob.
  • Um arquivo de dados de exemplo chamado Drivers.txt localizado na sua conta de armazenamento. Você pode baixar esse exemplo de Azure data Lake repositório gite, em seguida, carregar esse arquivo em sua conta de armazenamento.
  • Power BI Desktop. Você pode baixá-lo pelo Centro de Download da Microsoft.

Criar um relatório no Power BI Desktop

  1. Inicie o Power BI Desktop em seu computador.

  2. Na guia início da faixa de opções, selecione obter dados e, em seguida, selecione mais.

  3. na caixa de diálogo obter dados , selecione Azure > Azure Data Lake Store Gen2 e, em seguida, selecione Conexão.

    Página obter dados.

  4. na caixa de diálogo Azure Data Lake Storage Gen2 , você pode fornecer a URL para sua conta de Azure Data Lake Storage Gen2, sistema de arquivos ou subpasta usando o formato de ponto de extremidade do contêiner. as URLs para Data Lake Storage Gen2 têm o seguinte padrão:

    https://<accountname>.dfs.core.windows.net/<filesystemname>/<subfolder>

    Você também pode selecionar se deseja usar a exibição do sistema de arquivos ou a exibição de pasta do modelo de dados comum.

    Selecione OK para continuar.

    URL.

  5. Se esta for a primeira vez que você está usando esse endereço de URL, você será solicitado a selecionar o método de autenticação.

    Se você selecionar o método de conta organizacional, selecione entrar para entrar na sua conta de armazenamento. Você será redirecionado para a página de entrada da sua organização. Siga os prompts para entrar na conta. Depois de entrar, selecione Conectar.

    se você selecionar o método de chave de conta, insira sua chave de conta e, em seguida, selecione Conexão.

    Página de entrada.

  6. A próxima caixa de diálogo mostra todos os arquivos sob a URL fornecida na etapa 4 acima, incluindo o arquivo que você carregou em sua conta de armazenamento. Verifique as informações e, em seguida, selecione carregar.

    Sistemas de arquivos.

  7. depois que os dados tiverem sido carregados com êxito no Power BI, você verá os campos a seguir na guia campos .

    Guia campos.

    No entanto, para visualizar e analisar os dados, você pode preferir que os dados estejam disponíveis usando os campos a seguir.

    Campos.

    Nas próximas etapas, você atualizará a consulta para converter os dados importados no formato desejado.

  8. Na guia início da faixa de opções, selecione editar consultas.

    Selecione Editar consultas.

  9. No Editor de consultas, na coluna conteúdo , selecione binário. O arquivo será detectado automaticamente como CSV e você deverá ver uma saída, conforme mostrado abaixo. Os dados agora estão disponíveis em um formato que você pode usar para criar visualizações.

    Saída.

  10. Na guia início da faixa de opções, selecione fechar & aplicar.

    Fechar e aplicar.

  11. Depois que a consulta for atualizada, a guia Campos mostrará os novos campos disponíveis para visualização.

    Novos campos.

  12. Agora você pode criar um gráfico de pizza para representar os drivers em cada cidade para um determinado país. Para fazer isso, faça as seleções a seguir.

    Na guia visualizações , selecione o símbolo de um gráfico de pizza.

    Selecione o símbolo do gráfico de pizza em visualizações.

    Neste exemplo, as colunas que você pretende usar são a coluna 4 (nome da cidade) e a coluna 7 (nome do país). Arraste essas colunas da guia campos para a guia visualizações , conforme mostrado abaixo.

    Arraste campos.

    O gráfico de pizza agora deve ser semelhante ao mostrado abaixo.

    Gráfico de pizza.

  13. Ao selecionar um país específico nos filtros de nível de página, você poderá ver o número de drivers em cada cidade do país selecionado. Por exemplo, na guia Visualizações, em Filtros de nível de página, escolha Brasil.

    Filtros de página.

  14. O gráfico de pizza é atualizado automaticamente para exibir os drivers em cidades do Brasil.

    Brasil.

  15. no menu arquivo , selecione salvar para salvar a visualização como um arquivo de Power BI Desktop.

Publicar o relatório no serviço Power BI

depois de criar as visualizações no Power BI Desktop, você pode compartilhá-las com outras pessoas publicando-as no serviço Power BI. Para obter instruções sobre como fazer isso, confira Publicar a partir do Power BI Desktop.

Solução de problemas

atualmente, no Power Query Online, o conector de Azure Data Lake Storage Gen2 dá suporte apenas a caminhos com contêiner e não subpasta ou arquivo.

https:// <accountname> . DFS.Core.Windows.NET/ <container> funcionará, enquanto https:// <accountname> . DFS.Core.Windows.NET/ <container> / <filename> ou https:// <accountname> . DFS.Core.Windows.NET/ <container> / <subfolder> falhará.