Подключение к Azure Data Explorer с помощью Apache Spark для Azure Synapse Analytics

В этой статье описывается, как получить доступ к базам данных Azure Data Explorer из Synapse Studio с помощью Apache Spark для Azure Synapse Analytics.

Необходимые компоненты

Перейдите в Synapse Studio

В рабочей области Azure Synapse выберите Запуск Synapse Studio. На домашней странице Synapse Studio выберите Данные, чтобы открыть обозреватель объектов данных.

Подключение базы данных Azure Data Explorer к рабочей области Azure Synapse

Подключение базы данных Azure Data Explorer к рабочей области выполняется через связанную службу. С помощью связанной службы Azure Data Explorer вы можете просматривать, изучать, читать и записывать данные из Apache Spark для Azure Synapse. Вы также можете запускать задания интеграции в конвейере.

В обозревателе объектов данных выполните следующие действия, чтобы создать прямое соединение с кластером Azure Data Explorer.

  1. Выберите значок + рядом с областью Данные.

  2. Выберите Подключиться, чтобы подключиться к внешним данным.

  3. Выберите Azure Data Explorer (Kusto)

  4. Выберите Продолжить.

  5. Чтобы присвоить имя связанной службе, используйте понятное имя. Имя появится в обозревателе объектов данных и будет использоваться средами выполнения Azure Synapse для подключения к базе данных.

  6. Выберите кластер Azure Data Explorer из подписки или введите универсальный код ресурса (URI).

  7. Введите идентификатор субъекта-службы и ключ субъекта-службы. Убедитесь, что субъект-служба имеет доступ на просмотр к базе данных для чтения и получения доступа для приема данных.

  8. Введите имя базы данных Azure Data Explorer.

  9. Щелкните Проверить подключение, чтобы убедиться в наличии нужных разрешений.

  10. Выберите Создать.

    Screenshot that shows a new linked service.

    Примечание.

    (Необязательно) Проверка подключения не проверяет доступ на запись. Убедитесь, что у идентификатора субъекта-службы есть доступ на запись к базе данных Azure Data Explorer.

  11. Кластеры и базы данных Azure Data Explorer отображаются на вкладке Связанные в разделе Azure Data Explorer.

    Screenshot that shows browsing for clusters.

  12. Прежде чем можно будет взаимодействовать со связанной службой из записной книжки, ее необходимо опубликовать в рабочей области. Нажмите Опубликовать на панели инструментов, просмотрите ожидающие изменения и щелкните OK.

    Примечание.

    В текущем выпуске объекты базы данных заполняются на основе разрешений учетной записи Microsoft Entra в базах данных Обозреватель Azure. При запуске записных книжек Apache Spark или заданий интеграции будут использоваться учетные данные в службе каналов (например, субъект-служба).

Быстрое взаимодействие с созданными кодом действиями

Если щелкнуть правой кнопкой мыши базу данных или таблицу, появится список примеров записных книжек Spark. Выберите параметр для чтения, записи или потоковой передачи данных в Azure Data Explorer.

Screenshot that shows new sample notebooks.

Ниже приведен пример считывания данных. Подключите записную книжку к пулу Spark и выполните эту ячейку.

Screenshot that shows a new read notebook.

Примечание.

Первый запуск сеанса Spark может занять более трех минут. Последующие выполнения будут завершаться значительно быстрее.

Ограничения

Соединитель Azure Data Explorer в настоящее время не поддерживается в управляемых виртуальных сетях Azure Synapse.

Следующие шаги