Comece a usar: Consultar e visualizar os dados de um notebook

Este artigo de introdução orienta você no uso de um notebook do Azure Databricks para consultar dados de amostra armazenados no Catálogo do Unity usando SQL, Python, Scala e R e, em seguida, visualizar os resultados da consulta no notebook.

Requisitos

Para concluir as tarefas nesse artigo, você deve atender aos seguintes requisitos:

Etapa 1: Criar um notebook

Para criar um notebook em seu espaço de trabalho:

  1. Clique no ícone NovoNovo na barra lateral e clique em Notebook.
  2. Na página Criar Notebook:
    • Especifique um nome exclusivo para seu notebook.
    • Defina o idioma padrão do notebook e clique em Confirmar se solicitado.
    • Use o menu suspenso Conectar para selecionar um recurso de computação. Para criar um recurso de computação, consulte Usar computação.

Para saber mais sobre como criar e gerenciar notebooks, consulte Gerenciar notebooks.

Etapa 2: Consultar uma tabela

Consulte a tabela samples.nyctaxi.trips no Catálogo do Unity usando o idioma de sua preferência.

SQL

  1. Copie e cole o código a seguir na nova célula vazia do notebook. Esse código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Catálogo do Unity.
SELECT * FROM samples.nyctaxi.trips

Python

  1. Copie e cole o código a seguir na nova célula vazia do notebook. Esse código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Catálogo do Unity.
display(spark.read.table("samples.nyctaxi.trips"))

Scala

  1. Copie e cole o código a seguir na nova célula vazia do notebook. Esse código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Catálogo do Unity.
display(spark.read.table("samples.nyctaxi.trips"))

R

  1. Copie e cole o código a seguir na nova célula vazia do notebook. Esse código exibe os resultados da consulta da tabela samples.nyctaxi.trips no Catálogo do Unity.
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Pressione Shift+Enter para executar a célula e depois mova para a próxima célula.

    Os resultados da consulta aparecem no notebook.

Etapa 3: Exibir os dados

Exiba o valor da tarifa média por distância de viagem, agrupada pelo código postal da coleta.

  1. Ao lado da guia Tabela, clique + e, em seguida, clique em Visualização.

    O editor de visualização é exibido.

  2. Na lista suspensa Tipo de Visualização, verifique se a Barra está selecionada.

  3. Selecione fare_amount para a coluna X.

  4. Selecione trip_distance para a coluna Y.

  5. Selecione Average como o tipo de agregação.

  6. Selecione pickup_zip como a coluna Agrupar por.

    Gráfico de barras

  7. Clique em Save (Salvar).

Próximas etapas