Conexión a Dataiku

Dataiku es una plataforma de inteligencia artificial integral para la preparación de datos, AutoML y MLOps. Puede integrar los almacenes de Databricks SQL y los clústeres de Azure Databricks con Dataiku.

Conectarse a Dataiku mediante Partner Connect

Nota:

Partner Connect solo admite el uso de almacenes SQL para Dataiku. Para conectar un clúster a Dataiku, conéctese a Dataiku manualmente.

Para conectar el área de trabajo de Azure Databricks a Dataiku mediante Partner Connect, haga lo siguiente:

  1. En la barra lateral, haga clic en el Botón Partner ConnectPartner Connect.

  2. Haga clic en el icono de asociado.

    Nota:

    Si el icono de Dataiku tiene una marca de verificación dentro, significa que un administrador ya ha usado Partner Connect para conectar Dataiku al área de trabajo. Vaya al paso 5. El partner usa la dirección de correo electrónico de la cuenta de Azure Databricks para solicitarle que inicie sesión en su cuenta de Dataiku existente.

  3. Seleccione un catálogo en la lista desplegable y, después, haga clic en Siguiente.

    Nota:

    Si el área de trabajo está habilitada para Unity Catalog, pero el asociado no admite Unity Catalog con Partner Connect, se usa el catálogo predeterminado del área de trabajo. Si el área de trabajo no está habilitada para Unity Catalog, se usa hive_metastore.

  4. Seleccione un esquema en la lista desplegable y, a continuación, haga clic en Agregar. Puede repetir este paso para agregar varios esquemas.

  5. Haga clic en Next.

    Partner Connect crea los siguientes recursos en el área de trabajo:

    Partner Connect también concede los siguientes privilegios a la entidad de servicio <PARTNER>_USER:

    • (Catálogo de Unity)USE CATALOG: necesario para interactuar con objetos dentro del catálogo seleccionado.
    • (Catálogo de Unity) USE SCHEMA: concede la capacidad de leer los esquemas seleccionados.
    • (Catálogo de Unity)CREATE SCHEMA: concede la capacidad de crear esquemas en el catálogo seleccionado.
    • (Metastore de Hive heredado) USAGE: necesario para interactuar con objetos dentro de hive_metastore y los esquemas seleccionados.
    • (Metastore de Hive heredado) CREATE: concede la capacidad de crear un esquema en hive_metastore.
    • (Metastore de Hive heredado) READ_METADATA: Concede la capacidad de leer metadatos en los esquemas seleccionados.
    • (Metastore de Hive heredado) SELECT: concede la capacidad de leer los esquemas seleccionados.
  6. Haga clic en Next.

    En el cuadro Correo electrónico se muestra la dirección de correo electrónico de su cuenta en Azure Databricks. Dataiku usará esta dirección de correo electrónico para solicitarle que cree una nueva cuenta de asociado o que inicie sesión en su cuenta de asociado existente.

  7. Haga clic en Conectar a Dataiku o Iniciar sesión.

    Se abre una nueva pestaña en el explorador web, que muestra el sitio web de Dataiku.

  8. Complete las instrucciones en pantalla del sitio web de Dataiku para crear su cuenta de prueba de Dataiku o iniciar sesión en su cuenta de Dataiku existente.

Conexión manual a Dataiku

En esta sección, se describe cómo conectar manualmente un clúster o un almacén SQL existente del área de trabajo de Azure Databricks con Dataiku.

Nota:

Los almacenes de Databricks SQL pueden conectarse con Dataiku mediante Partner Connect para una experiencia más sencilla.

Requisitos

Para conectarse a Dataiku manualmente, deberá cumplir los siguientes requisitos:

  • Un clúster o almacén SQL en el área de trabajo de Azure Databricks.

  • Los detalles de la conexión del clúster o almacén SQL, concretamente los valores Nombre de host del servidor, Puerto y Ruta de acceso HTTP.

  • Un token de acceso personal de Azure Databricks o un token de Microsoft Entra ID (anteriormente, Azure Active Directory). Para crear un token de acceso personal, haga lo siguiente:

    1. En el área de trabajo de Azure Databricks, haga clic en el nombre de usuario de Azure Databricks de la barra superior y, a continuación, seleccione Configuración en la lista desplegable.
    2. Haga clic en Desarrollador.
    3. Junto a Tokens de acceso, haga clic en Administrar.
    4. Haga clic en Generate new token (Generar nuevo token).
    5. (Opcional) Escriba un comentario que le ayude a identificar este token en el futuro y cambie la duración predeterminada del token de 90 días. Para crear un token sin duración (no recomendado), deje el cuadro Duración (días) vacío (en blanco).
    6. Haga clic en Generar.
    7. Copie el token mostrado en una ubicación segura y, a continuación, haga clic en Listo.

    Nota:

    Asegúrese de guardar el token copiado en una ubicación segura. No comparta el token copiado con otros usuarios. Si pierde el token copiado, no podrá volver a generar ese mismo token. Debe repetir el procedimiento para crear un nuevo token. Si pierde el token copiado o cree que el token se ha visto comprometido, Databricks recomienda eliminar inmediatamente ese token del área de trabajo haciendo clic en el icono de papelera (Revocar) situado junto al token en la página Tokens de acceso.

    Si no puede crear o usar tokens en el área de trabajo, puede deberse a que el administrador del área de trabajo tiene tokens deshabilitados o no le ha concedido permiso para crear o usar tokens. Consulte el administrador del área de trabajo o lo siguiente:

    Nota:

    Como procedimiento recomendado de seguridad, cuando se autentique con herramientas, sistemas, scripts y aplicaciones automatizados, Databricks recomienda usar los tokens de acceso personal pertenecientes a las entidades de servicio en lugar de a los usuarios del área de trabajo. Para crear tókenes para entidades de servicio, consulte Administración de tokens de acceso para una entidad de servicio.

Pasos para establecer la conexión

Para conectarse manualmente a Dataiku, siga Databricks en la documentación de Dataiku.

Recursos adicionales

Explore los siguientes recursos de Dataiku: