Conexión a Azure Data Explorer con Apache Spark para Azure Synapse Analytics

En este artículo se describe cómo acceder a la base de datos de Azure Data Explorer desde Synapse Studio con Apache Spark para Azure Synapse Analytics.

Requisitos previos

Ir a Synapse Studio

En un área de trabajo de Azure Synapse, seleccione Iniciar Synapse Studio. En la página principal de Synapse Studio, seleccione Datos para ir a Data Object Explorer (Explorador de objetos de datos).

Conexión de una base de datos de Azure Data Explorer a un área de trabajo de Azure Synapse

La conexión de una base de datos de Azure Data Explorer a un área de trabajo se realiza mediante un servicio vinculado. Con un servicio vinculado de Azure Data Explorer, puede examinar y explorar datos y leer y escribir en Apache Spark para Azure Synapse. También puede ejecutar trabajos de integración en una canalización.

En Azure Data Explorer, siga estos pasos para conectar directamente un clúster de Azure Data Explorer:

  1. Seleccione el icono + junto a Datos.

  2. Seleccione Conectar para conectarse a datos externos.

  3. Seleccione Azure Data Explorer (Kusto) .

  4. Seleccione Continuar.

  5. Use un nombre descriptivo para designar al servicio vinculado. El nombre aparecerá en Data Object Explorer (Explorador de objetos de datos) y se usará en los entornos de ejecución de Azure Synapse para conectarse a la base de datos.

  6. Seleccione el clúster de Azure Data Explorer desde su suscripción o escriba el URI.

  7. Escriba el identificador de la entidad de servicio y la clave de la entidad de servicio. Asegúrese de que esta entidad de servicio tenga acceso de vista en la base de datos para la operación de lectura y acceso de ingesta para la ingesta de datos.

  8. Escriba el nombre de la base de datos de Azure Data Explorer.

  9. Seleccione Probar conexión para asegurarse de que tiene los permisos adecuados

  10. Seleccione Crear.

    Screenshot that shows a new linked service.

    Nota:

    (Opcional) La opción Probar conexión no valida el acceso de escritura. Asegúrese de que el identificador de la entidad de servicio tenga acceso de escritura a la base de datos de Azure Data Explorer.

  11. Los clústeres y las bases de datos de Azure Data Explorer aparecen en la pestaña Vinculado de la sección Azure Data Explorer.

    Screenshot that shows browsing for clusters.

  12. Para poder interactuar con el servicio vinculado desde un cuaderno, debe publicarse en el área de trabajo. Haga clic en Publicar en la barra de herramientas, revise los cambios pendientes y haga clic Aceptar.

    Nota:

    En la versión actual, los objetos de base de datos se rellenan en función de los permisos de las cuentas de Microsoft Entra en las bases de datos de Azure Data Explorer. Al ejecutar los cuadernos o los trabajos de integración de Apache Spark, se usará la credencial del servicio de vínculo (por ejemplo, la entidad de servicio).

Interacción rápida con las acciones generadas por el código

Al hacer clic con el botón derecho en una base de datos o en una tabla, aparece una lista de cuadernos de Spark de ejemplo. Seleccione una opción para leer o escribir datos en Azure Data Explorer o transmitirlos ahí.

Screenshot that shows new sample notebooks.

A continuación, se muestra un ejemplo de lectura de datos. Asocie el cuaderno al grupo de Spark y ejecute la celda.

Screenshot that shows a new read notebook.

Nota:

La primera ejecución puede tardar más de tres minutos en iniciar la sesión de Spark, pero las siguientes serán mucho más rápidas.

Limitaciones

Actualmente, el conector de Azure Data Explorer no es compatible con redes virtuales de Azure Synapse.

Pasos siguientes