¿Qué es Databricks Assistant?

Importante

Esta característica está actualmente en versión preliminar pública. El uso de la característica durante la versión preliminar es gratuito. Los precios finales se establecerán y comunicarán antes de la disponibilidad general (GA).

Databricks Assistant funciona como un complemento de programador en pareja basado en IA para hacerlo más eficaz al crear cuadernos, consultas y archivos. Puede ayudarle a responder rápidamente a preguntas mediante la generación, optimización, finalización, explicación y corrección del código y las consultas.

En esta página se proporciona información general sobre el asistente en forma de preguntas más frecuentes. Para responder preguntas sobre privacidad y seguridad, consulte Privacidad y seguridad.

Habilitar o deshabilitar Databricks Assistant

Databricks Assistant está habilitado de forma predeterminada.

Para habilitar todas las áreas de trabajo de una cuenta para el asistente de Databricks, siga estas instrucciones:

  1. Como administrador de la cuenta, inicie sesión en la consola de la cuenta.

    Importante

    Si ningún usuario del inquilino de Microsoft Entra ID (anteriormente Azure Active Directory) ha iniciado sesión aún en la consola de la cuenta, usted, o cualquier otro usuario del inquilino, deben iniciar sesión como primer administrador de la cuenta. Para ello, debe ser administrador global de Microsoft Entra ID, pero solo la primera vez que inicie sesión en la consola de cuenta de Azure Databricks. Tras el primer inicio de sesión, se convertirá en administrador de cuentas de Azure Databricks, por lo que dejará de necesitar el rol de administrador global de Microsoft Entra ID para acceder a la cuenta de Azure Databricks. Como primer administrador de la cuenta, puede asignar usuarios del inquilino de Microsoft Entra ID como administradores de cuenta adicionales (que a su vez pueden asignar más administradores de cuentas). Los administradores de cuentas adicionales no requieren roles específicos en Microsoft Entra ID. Consulte Administración de usuarios, entidades de servicio y grupos.

  2. Haga clic en ConfiguraciónIcono Configuración.

  3. Haga clic en la pestaña Habilitación de funcionalidades.

  4. En la sección Características de asistencia de IA con tecnología de asociado, seleccione Habilitado o Deshabilitado y, a continuación, haga clic en Guardar. Puede evitar invalidaciones de configuración del área de trabajo para esta característica estableciendo el botón de alternancia Aplicar en activado.

Si la configuración de la cuenta permite invalidaciones de configuración del área de trabajo, los administradores del área de trabajo pueden habilitar o deshabilitar áreas de trabajo específicas. Para ello, use una configuración del área de trabajo para invalidar la configuración predeterminada en la consola de la cuenta de la siguiente manera:

  1. Ve a la página de configuración del administrador del área de trabajo.
  2. Haga clic en la pestaña Opciones avanzadas.
  3. Use las características de asistencia de inteligencia artificial con tecnología de inteligencia artificial menú desplegable para realizar la selección.
  4. Haga clic en Save(Guardar).

Uso de Databricks Assistant para codificar sugerencias y ayuda

Para acceder al Asistente de Databricks, haga clic en el icono Asistente Databricks Assistant en la barra lateral izquierda del cuaderno, el editor de archivos, el Editor de SQL o la pestaña del panel Datos.

Ubicación del icono del asistente de Databricks

El panel del asistente se abre en el lado izquierdo de la pantalla.

Panel de Databricks Assistant

Algunas funcionalidades de Databricks Assistant son las siguientes:

  • Generar: Use un lenguaje natural para generar consultas de SQL.
  • Explicar: Resalte una consulta o un bloque de código y haga que Databricks Assistant recorra la lógica en un inglés claro y conciso.
  • Corregir: Explique y corrija la sintaxis y los errores en tiempo de ejecución con un solo clic.
  • Transformación y optimización: Convierta código de Pandas en PySpark para una ejecución más rápida.

Cualquier código generado por el asistente de Databricks está pensado para su ejecución en un entorno de proceso de Databricks. Está optimizado para crear código en lenguajes de programación, marcos y dialectos compatibles con Databricks. No está pensado como asistente de programación de uso general. El Asistente a menudo usará información de las bases de conocimiento de Databricks, como la documentación, para responder mejor a las consultas de usuario. Funciona mejor cuando la pregunta del usuario está relacionada con las preguntas que se pueden responder con conocimientos de la documentación de Databricks, el catálogo de Unity y el código de usuario en el área de trabajo.

Los usuarios siempre deben revisar cualquier código generado por el Asistente antes de la ejecución, ya que a veces puede cometer errores.

Creación de visualizaciones mediante Databricks Assistant para paneles

Puede usar Databricks Assistant al redactar paneles. Al crear visualizaciones en un conjunto de datos de panel existente, solicite al Asistente preguntas para recibir respuestas en forma de gráficos generados. Para usar el Asistente en un panel, cree primero uno o varios conjuntos de datos y a continuación, agregue un widget de visualización al lienzo. El widget de visualización incluye un mensaje para describir el nuevo gráfico. Escriba una descripción del gráfico que quiere ver y el asistente lo generará. Puede aprobar o rechazar el gráfico, o bien modificar la descripción para generar algo nuevo. Para más información y ejemplos de uso del Asistente con paneles, consulte Creación de visualizaciones con Databricks Assistant.

Servicios usados por Databricks Assistant

Databricks Assistant usa servicios de Azure OpenAI para proporcionar respuestas. Microsoft, no OpenAI, opera el servicio Azure OpenAI y está sujeto a sus respectivas directivas de administración de datos. Los datos enviados a este servicio no se usan para ningún entrenamiento del modelo. Para Azure OpenAI, Azure Databricks ha optado por no realizar la supervisión de abusos, por lo que no se almacenan solicitudes ni respuestas con Azure OpenAI. Para más información, consulte Directiva de administración de datos de Azure.

Sugerencias para mejorar la precisión de los resultados devueltos

  • Sea lo más específico posible. Especifique las tablas y dé ejemplos del aspecto de los datos.
  • Databricks Assistant conoce el esquema de tabla y columna, además de los metadatos. Esto le permite usar lenguaje natural y generar consultas bastante precisas. Por ejemplo, si la tabla tuviera columnas las userID y State, podría pedir a Databricks Assistant que genere una lista de usuarios que vivan en Washington.
  • Databricks Assistant solo tiene acceso a los metadatos de tabla y columna, y no a los datos de nivel de fila. Por lo tanto, puede que no escriba consultas correctamente si los datos reales tienen formas únicas. Por ejemplo, si tuviera una columna Price y cada valor anexa una denominación de país (por ejemplo: 10,99 USD, 5,99 CAD), la consulta devuelta podría tener problemas para sumar esa columna, ya que no es DECIMAL. Intente proporcionar instrucciones específicas a Databricks Assistant para analizar esa columna. Por ejemplo: "Suma los ingresos totales de galletas. Precio es una columna de cadena que tiene una denominación de país anexada a cada valor de divisa, como '10,99 USD'".

Databricks Assistant tiene en cuenta el historial de la conversación para que pueda refinar sus preguntas a medida que avanza.

Proporcionar comentarios

La mejor manera de enviar comentarios es a través de los vínculos de "Proporcionar comentarios" del cuaderno y del editor de SQL. También puede enviar un correo electrónico a assistant-feedback@databricks.com o a su equipo de cuenta.

Estamos interesados principalmente en recibir sugerencias de mejora del producto y problemas de la experiencia de usuario en lugar de solicitar precisión. Si recibiera una sugerencia del asistente que no le resulta útil, haga clic en el botón "No es útil" con el pulgar abajo para que podamos capturar esos comentarios.

Privacidad y seguridad

P: ¿Qué datos se envían a los modelos?

Databricks Assistant envía código y metadatos a los modelos en cada solicitud de API. Esto ayuda a devolver resultados más relevantes para los datos. Algunos ejemplos son:

  • Código o consultas de la celda del cuaderno actual o en la pestaña del Editor de SQL
  • Nombres y descripciones de tablas y columnas
  • Preguntas anteriores
  • Tablas favoritas

P: ¿Respetan los metadatos enviados a los modelos los permisos de Unity Catalog del usuario?

Sí, todos los datos enviados al modelo respetan los permisos de Unity Catalog del usuario, por lo que no envía metadatos relacionados con las tablas que el usuario no tiene permiso para ver.

P: Si se ejecuta una consulta con resultados y, a continuación, se formula una pregunta, ¿se enviarán los resultados de la consulta al modelo?

No, solo el contenido del código en las celdas, los metadatos sobre tablas y el texto escrito por el usuario se comparten con el modelo. En cuanto a la característica "corregir el error", Databricks también comparte el seguimiento de la pila de la salida del error.

P: ¿Databricks Assistant ejecuta código peligroso?

No. Databricks Assistant no ejecuta código automáticamente por usted. Los modelos de inteligencia artificial podrían cometer errores, malinterpretar las intenciones y delirar, o bien, dar respuestas incorrectas. Asegúrese de revisar el código generado por la IA antes de ejecutarlo.

P: ¿Databricks ha realizado alguna evaluación para evaluar la precisión y la idoneidad de las respuestas del Asistente?

Sí. Databricks tiene mitigaciones para evitar que Assistant genere respuestas perjudiciales, como discurso de odio, código inseguro, comandos de jailbreaks y contenido de terceros protegido por derechos de autor. Databricks ha realizado pruebas exhaustivas de todas nuestras características de asistencia de IA con miles de entradas de usuario simuladas para evaluar la solidez de las mitigaciones. Estas evaluaciones se centraron en los casos de uso esperados para el Asistente, como la generación de código en los lenguajes Python, Databricks SQL, R y Scala.

P: ¿Puedo usar Databricks Assistant con tablas que procesan datos regulados (PHI, PCI, IRAP, FedRAMP)?

Sí. Para ello, deberá cumplir una serie de requisitos, como habilitar el perfil de seguridad de conformidad, y agregar la norma de conformidad pertinente como parte de la configuración del perfil de seguridad de conformidad.