Preguntas más frecuentes sobre Azure Databricks

Este artículo muestra las principales preguntas que pueden surgir en relación con Azure Databricks. También se muestran algunos problemas comunes que puede encontrar al usar Databricks. Para más información, consulte ¿Qué es Azure Databricks?

¿Puedo usar Azure Key Vault para almacenar claves o secretos que se usarán en Azure Databricks?

Sí. Puede usar Azure Key Vault para almacenar claves o secretos que se usarán en Azure Databricks. Para más información, consulte el artículo sobre los ámbitos respaldados por Azure Key Vault.

¿Puedo usar Azure Virtual Networks con Databricks?

Sí. Puede usar una instancia de Azure Virtual Network (red virtual) con Azure Databricks. Para más información, consulte el artículo sobre la implementación de Azure Databricks en Azure Virtual Network.

¿Cómo accedo a Azure Data Lake Storage desde un cuaderno?

Siga estos pasos:

  1. En Microsoft Entra ID (anteriormente Azure Active Directory), aprovisione una entidad de servicio y registre su clave.
  2. Asigne los permisos necesarios a la entidad de servicio en Data Lake Storage.
  3. Para acceder a un archivo en Data Lake Storage, use las credenciales de la entidad de servicio en Notebook.

Para más información, consulte Use Azure Data Lake Storage with Azure Databricks (Uso de Azure Data Lake Storage con Azure Databricks).

Corrección de problemas comunes

Estos son algunos de los problemas que podría encontrar con Databricks.

Problema: esta suscripción no está registrada para usar el espacio de nombres "Microsoft.Databricks"

Mensaje de error

"Esta suscripción no está registrada para usar el espacio de nombres Microsoft.Databricks". Consulte https://aka.ms/rps-not-found para saber cómo registrar las suscripciones. (Código: MissingSubscriptionRegistration)"

Solución

  1. Vaya a Azure Portal.
  2. Seleccione Suscripciones, la suscripción que usa y, a continuación, Proveedores de recursos.
  3. En la lista de proveedores de recursos, en Microsoft.Databricks, seleccione Registrar. Debe tener el rol colaborador o propietario de la suscripción para registrar el proveedor de recursos.

Problema: La cuenta {correo electrónico} no tiene el rol Propietario o Colaborador en el recurso de área de trabajo de Databricks en Azure Portal

Mensaje de error

"La cuenta {correo electrónico} no tiene el rol Propietario o Colaborador en el recurso de área de trabajo de Databricks en Azure Portal. Este error puede producirse también si es un usuario invitado en el inquilino. Pida al administrador que le conceda acceso o le agregue como un usuario directamente en el área de trabajo de Databricks (Código: AADSTS90015)

Solución

A continuación, se muestran algunas soluciones para este problema:

Si es un usuario de Azure Databricks sin el rol Propietario o Colaborador en el recurso del área de trabajo de Databricks y simplemente desea acceder al área de trabajo:

  • Debe acceder a ella directamente mediante la dirección URL (por ejemplo, https://adb-5555555555555555.19.azuredatabricks.net). No use el botón Iniciar área de trabajo en Azure Portal.

Si esperaba que se le reconozca como Propietario o Colaborador en el recurso del área de trabajo:

  • Para inicializar el inquilino, debe haber iniciado sesión como un usuario normal del inquilino, no como un usuario invitado. También debe tener el rol Colaborador o Propietario en el recurso de área de trabajo de Databricks. Un administrador puede conceder a un usuario un rol desde la pestaña Control de acceso (IAM) dentro del área de trabajo de Azure Databricks en Azure Portal.

  • Este error también puede producirse si el nombre de dominio de correo electrónico se asigna a varios directorios de Microsoft Entra ID (anteriormente Azure Active Directory). Para solucionar este problema, cree un nuevo usuario en el directorio que contiene la suscripción al área de trabajo de Databricks.

    a. En Azure Portal, vaya a Microsoft Entra ID (anteriormente Azure Active Directory). Seleccione Usuarios y grupos>Agregar un usuario.

    b. Agregue un usuario con un correo electrónico de @<tenant-name>.onmicrosoft.com en lugar de @<your-domain>. Puede encontrar esta opción en Dominios personalizados, en Microsoft Entra ID (anteriormente Azure Active Directory) en Azure Portal.

    c. Conceda a este nuevo usuario el rol Colaborador en el recurso del área de trabajo de Databricks.

    d. Inicie sesión en Azure Portal con el nuevo usuario y busque el área de trabajo de Databricks.

    e. Inicie el área de trabajo de Databricks con este usuario.

Problema: La cuenta {correo electrónico} no se ha registrado en Databricks

Solución

Si no creó el área de trabajo y se le agrega como usuario, póngase en contacto con la persona que creó el área de trabajo. Pídale a esa persona que lo agregue mediante la Consola de administración de Azure Databricks. Para obtener instrucciones, vea Adding and managing users (Adición y administración de usuarios). Si creó el área de trabajo y sigue recibiendo este error, intente volver a seleccionar Inicializar área de trabajo en Azure Portal.

Problema: Error de inicio del proveedor de nube al configurar el clúster (PublicIPCountLimitReached)

Mensaje de error

"Error de inicio de proveedor en la nube: Se detectó un error de proveedor en la nube al configurar el clúster. Para más información, vea la guía de Databricks. Código de error de Azure: PublicIPCountLimitReached. Mensaje de error de Azure: No se pueden crear más de 10 direcciones IP públicas para esta suscripción en esta región".

Información previa

Los clústeres de Databricks usan una dirección IP pública por nodo (incluido el nodo del controlador). Las suscripciones de Azure tienen límites de direcciones IP públicas por región. Por lo tanto, se puede producir un error en las operaciones de creación de clústeres y de escalado vertical si provocan que el número de direcciones IP públicas asignadas a esa suscripción en esa región supere el límite. Este límite también incluye las direcciones IP públicas asignadas para uso que no sea de Databricks, por ejemplo las máquinas virtuales personalizadas definidas por el usuario.

En general, los clústeres solo consumen direcciones IP públicas mientras están activas. Sin embargo, es posible que se produzcan errores de PublicIPCountLimitReached durante un breve período de tiempo incluso después de que se terminen otros clústeres. Esto se debe a que los Databricks almacenan temporalmente en memoria caché los recursos de Azure cuando se termina un clúster. El almacenamiento en caché de recursos es por diseño, ya que reduce significativamente la latencia del inicio del clúster y el escalado automático en muchos escenarios comunes.

Solución

Si su suscripción ya ha alcanzado su límite de direcciones IP públicas para una región determinada, debe realizar una de las siguientes acciones.

  • Cree nuevos clústeres en otro área de trabajo de Databricks. El otro área de trabajo debe estar ubicada en una región en la que no haya alcanzado el límite de direcciones IP públicas de su suscripción.
  • Solicite el aumento del límite de direcciones IP públicas. Elija Cuota como el Tipo de problema y Redes: ARM como el Tipo de cuota. En Details, solicite un aumento de la cuota de la dirección IP pública. Por ejemplo, si el límite es actualmente 60 y desea crear un clúster de 100 nodos, solicite un aumento del límite hasta 160.

Problema: Un segundo tipo de error al iniciar el proveedor de nube al configurar el clúster (MissingSubscriptionRegistration)

Mensaje de error

"Error de inicio de proveedor en la nube: Se detectó un error de proveedor en la nube al configurar el clúster. Para más información, vea la guía de Databricks. Código de error de Azure: mensaje de error de Azure MissingSubscriptionRegistration: La suscripción no está registrada para usar el espacio de nombres "Microsoft.Compute". Consulte https://aka.ms/rps-not-found para saber cómo registrar las suscripciones".

Solución

  1. Vaya a Azure Portal.
  2. Seleccione Suscripciones, la suscripción que usa y, a continuación, Proveedores de recursos.
  3. En la lista de proveedores de recursos, en Microsoft.Compute, seleccione Registrar. Debe tener el rol colaborador o propietario de la suscripción para registrar el proveedor de recursos.

Para instrucciones más detalladas, consulte Tipos y proveedores de recursos.

Problema: Azure Databricks necesita permisos para acceder a recursos de su organización que solo un administrador puede conceder

Fondo

Azure Databricks se ha integrado con Microsoft Entra ID (anteriormente Azure Active Directory). Se pueden establecer permisos dentro de Azure Databricks (por ejemplo, en cuadernos o clústeres) mediante la especificación de los usuarios de Microsoft Entra ID (anteriormente Azure Active Directory). Para que Azure Databricks pueda generar una lista de los nombres de los usuarios de Microsoft Entra ID (anteriormente Azure Active Directory), necesita permisos de lectura de esta información, además de consentimiento. Si la autorización no está disponible aún, aparecerá el error.

Solución

Inicie sesión en Azure Portal como administrador global. En Microsoft Entra ID (anteriormente Azure Active Directory), vaya a la pestaña Configuración de usuario y asegúrese de que la opción Los usuarios pueden permitir que las aplicaciones accedan a los datos de la compañía en su nombre está establecida en .

Problema: Azure Databricks no admite la creación del área de trabajo en grupos de recursos de Azure, que se crean con caracteres chinos.

Solución

La compatibilidad con la validación de este escenario como parte de la creación del área de trabajo se agregará en la versión posterior.

Pasos siguientes