Resultados y salidas del cuaderno

Después de asociar un cuaderno a un clúster y ejecutar una o varias celdas, el cuaderno tiene estado y muestra las salidas. En esta sección se describe cómo administrar el estado y las salidas del cuaderno.

Borrado del estado y las salidas de los cuadernos

Para borrar el estado y las salidas del cuaderno, seleccione una de las opciones en Borrar situadas en la parte inferior del menú Ejecutar.

Opción de menú Descripción
Borrado de todas las salidas de celda Borra las salidas de la celda. Esto resulta útil si comparte el cuaderno y no quiere incluir en él ningún resultado.
Borrado del estado Borra el estado del cuaderno, incluidas las definiciones de función y variable, los datos y las bibliotecas importadas.
Borrado del estado y las salidas Borra las salidas de celda y el estado del cuaderno.
Borrado del estado y ejecución de todo Borra el estado del cuaderno e inicia una nueva ejecución.

Mostrar resultados

Cuando se ejecuta una celda, los resultados de la tabla devuelven un máximo de 10 000 filas o 2 MB, lo que sea menor.

De forma predeterminada, los resultados de texto devuelven un máximo de 50 000 caracteres. Con Databricks Runtime 12.2 LTS y versiones posteriores, es posible aumentar este límite estableciendo la propiedad de configuración de Spark spark.databricks.driver.maxReplOutputLength.

Exploración de los resultados de las celdas de SQL en cuadernos de Python de forma nativa mediante Python

Puede cargar datos mediante SQL y explorarlos mediante Python. En un cuaderno de Python en Databricks, los resultados de una tabla de celdas de lenguaje SQL se ponen automáticamente a disposición como DataFrame de Python. Para obtener más información, consulte Exploración de los resultados de las celdas SQL en cuadernos de Python.

Nueva tabla de resultados de celda

Importante

Esta característica está en versión preliminar pública.

Ahora puede seleccionar una nueva representación de la tabla de resultados de celdas. Con la nueva tabla de resultados, puede hacer lo siguiente:

  • Copie una columna u otro subconjunto de resultados tabulares en el portapapeles.
  • Realice una búsqueda de texto sobre la tabla de resultados.
  • Ordenar y filtrar datos.
  • Navegue entre las celdas de la tabla mediante las teclas de dirección del teclado.
  • Seleccione parte de un nombre de columna o valor de celda haciendo doble clic y arrastrándolo para seleccionar el texto deseado.

Para habilitar la nueva tabla de resultados, haga clic en Nueva tabla de resultados en la esquina superior derecha de los resultados de la celda y cambie el selector de alternancia de OFF a ON.

nuevo selector de visualización de resultados

Cuando la característica está activada, puede hacer clic en encabezados de columna o fila para seleccionar columnas o filas completas y puede hacer clic en la celda superior izquierda de la tabla para seleccionar toda la tabla. Puede arrastrar el cursor a cualquier conjunto rectangular de celdas para seleccionarlos.

Para copiar los datos seleccionados en el Portapapeles, presione enCmd + c MacOS Ctrl + c o en Windows, o haga clic con el botón derecho y seleccione Copiar en el menú desplegable.

Para buscar texto en la tabla de resultados, escriba el texto en el cuadro Buscar. Las celdas coincidentes están resaltadas.

Para abrir un panel lateral que muestre información sobre la selección, haga clic en el icono del panel icono del panel icono de la esquina superior derecha, junto al cuadro Buscar.

ubicación del icono del panel

Los encabezados de columna indican el tipo de datos de la columna. Por ejemplo, indicador de la columna de tipo entero indica el tipo de datos entero. Mantenga el puntero sobre el indicador para ver el tipo de datos.

Ordenar y filtrar los resultados

Al usar la nueva representación de la tabla de resultados de celdas, puede ordenar y filtrar los resultados.

Para ordenar la tabla por los valores de una columna, mantenga el cursor sobre el nombre de la columna. A la derecha de la celda que contiene el nombre de columna, aparece un icono. Haga clic en la flecha para ordenar la columna. Los clics sucesivos se alternan a través de la ordenación en orden ascendente, orden descendente o sin ordenar.

cómo ordenar una columna

Para ordenar por varias columnas, mantenga presionada la tecla Mayús mientras hace clic en la flecha de ordenación de las columnas.

Para crear un filtro, haga clic icono de filtro en la esquina superior derecha de los resultados de la celda. En el cuadro de diálogo que aparece, seleccione la columna en la que se va a filtrar y la regla de filtro y el valor que se va a aplicar. Por ejemplo:

ejemplo de filtro

Para agregar otro filtro, haga clic en botón agregar filtro.

Para habilitar o deshabilitar temporalmente un filtro, active el botón Habilitado/Deshabilitado en el cuadro de diálogo. Para eliminar un filtro, haga clic en la X junto al nombre del filtro eliminar un filtro X.

Para filtrar por un valor específico, haga clic con el botón derecho en una celda con ese valor y seleccione Filtrar por este valor en el menú desplegable.

valor específico

También puede crear un filtro desde el menú kebab en el nombre de columna:

menú de kebab de filtro

Los filtros solo se aplican a los resultados que se muestran en la tabla de resultados. Si los datos devueltos se truncan (por ejemplo, cuando una consulta devuelve más de 64 000 filas), el filtro solo se aplica a las filas devueltas.

Descarga de resultados

De manera predeterminada, la descarga de los resultados está habilitada. Para alternar esta configuración, consulte Administración de la capacidad de descargar resultados de cuadernos.

Puede descargar en el equipo local el resultado de una celda que contenga una salida tabular. Haga clic en la flecha que apunta hacia abajo situada junto al título de la pestaña. Las opciones de menú dependen del número de filas del resultado y de la versión de Databricks Runtime. Los resultados descargados se guardan en la máquina local como un archivo CSV denominado export.csv.

Descargar resultados de celdas

Visualización de varias salidas por celda.

Los cuadernos de Python y las celdas con %python en cuadernos que no son de Python admiten varias salidas por celda. Por ejemplo, la salida del código siguiente incluye tanto el trazado como la tabla:

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Confirmar los resultados de los cuadernos en las carpetas Git de Databricks

Para obtener más información sobre la consignación de salidas de cuaderno .ipynb, consulte Permitir la consignación de salidas de cuaderno .ipynb.

  • El bloc de notas debe ser un archivo .ipynb
  • La configuración del administrador del área de trabajo debe permitir que se consignen las salidas de bloc de notas.