Introducción: Consulta y visualización de datos desde un cuaderno

Este artículo de introducción le guía por el uso de un cuaderno de Azure Databricks para consultar datos de ejemplo almacenados en Unity Catalog mediante SQL, Python, Scala y R y, a continuación, visualizar los resultados de la consulta en el cuaderno.

Requisitos

Para completar las tareas de este artículo, debe cumplir los siguientes requisitos:

Paso 1: Crear un nuevo cuaderno

Para crear un cuaderno en el área de trabajo:

  1. Haga clic en Icono NuevoNuevo en la barra lateral y, luego, en Cuaderno.
  2. En la página Crear cuaderno:
    • Especifique un nombre único para el cuaderno.
    • Establezca el idioma predeterminado del cuaderno y haga clic en Confirmar si se le solicita.
    • Use el menú desplegable Conectar para seleccionar un recurso de proceso. Para crear un nuevo recurso de proceso, vea Use compute.

Para obtener más información sobre cómo crear y administrar cuadernos, consulte Administración de cuadernos.

Paso 2: Consultar una tabla

Consulte la tabla samples.nyctaxi.trips en Unity Catalog con el idioma que prefiera.

SQL

  1. Copie y pegue el código siguiente en la nueva celda del cuaderno vacío. Este código muestra los resultados de consultar la tabla samples.nyctaxi.trips en Unity Catalog.
SELECT * FROM samples.nyctaxi.trips

Python

  1. Copie y pegue el código siguiente en la nueva celda del cuaderno vacío. Este código muestra los resultados de consultar la tabla samples.nyctaxi.trips en Unity Catalog.
display(spark.read.table("samples.nyctaxi.trips"))

Scala

  1. Copie y pegue el código siguiente en la nueva celda del cuaderno vacío. Este código muestra los resultados de consultar la tabla samples.nyctaxi.trips en Unity Catalog.
display(spark.read.table("samples.nyctaxi.trips"))

R

  1. Copie y pegue el código siguiente en la nueva celda del cuaderno vacío. Este código muestra los resultados de consultar la tabla samples.nyctaxi.trips en Unity Catalog.
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Presione Shift+Enter para ejecutar la celda y, a continuación, vaya a la celda siguiente.

    Los resultados de la consulta aparecen en el cuaderno.

Paso 3: Mostrar los datos

Muestra la cantidad promedio de tarifas por distancia de viaje, agrupada por el código postal de recogida.

  1. Junto a la pestaña Tabla, haga clic + y, a continuación, haga clic en Visualización.

    Se muestra el editor de visualización.

  2. En la lista desplegable Tipo de visualización, compruebe que la Barra está seleccionada.

  3. Seleccione fare_amount para la columna X.

  4. Seleccione trip_distance para la columna Y.

  5. Seleccione Average como tipo de agregación.

  6. Seleccione pickup_zip como columna Agrupar por.

    Gráfico de barras

  7. Haga clic en Save(Guardar).

Pasos siguientes