Поделиться через


Интеграция DataGrip с Azure Databricks

Примечание.

В этой статье описывается инструмент DataGrip, который не предоставляется и не поддерживается Databricks. Чтобы связаться с поставщиком, обратитесь в службу поддержки DataGrip.

DataGrip — это интегрированная среда разработки (IDE) для разработчиков баз данных, которая предоставляет консоль запросов, навигацию по схемам, планы объяснений, интеллектуальное завершение кода, анализ в реальном времени и быстрые исправления, рефакторинг, интеграцию управления версиями и другие функции.

В этой статье описывается, как установить, настроить и использовать DataGrip на локальном компьютере разработки для работы с базами данных в Azure Databricks.

Примечание.

Эта статья была протестирована с помощью macOS, Databricks JDBC Driver версии 2.6.36 и DataGrip версии 2023.3.1.

Требования

Перед установкой DataGrip убедитесь, что локальный компьютер разработки соответствует следующим требованиям.

  • Операционная система Linux, macOS или Windows.
  • Скачайте драйвер Databricks JDBC на локальный компьютер разработки и извлеките файл DatabricksJDBC42.jar из скачанного файла DatabricksJDBC42-<version>.zip.
  • Кластер Azure Databricks или хранилище SQL для подключения к DataGrip.

Шаг 1. Установка DataGrip

Скачайте и установите DataGrip.

  • Linux. Скачайте файл .zip, извлеките его содержимое и следуйте инструкциям в файле Install-Linux-tar.txt.
  • macOS. Скачайте и запустите файл .dmg.
  • Windows. Скачайте и запустите файл .exe.

Дополнительные сведения см. в разделе Установка DataGrip на веб-сайте DataGrip.

Шаг 2. Настройка драйвера Databricks JDBC для DataGrip

Укажите в DataGrip сведения о драйвере Databricks JDBC, который вы скачали ранее.

  1. Запустите DataGrip.
  2. Щелкните Файл > Источники данных.
  3. В диалоговом окне Источники данных и драйверы перейдите на вкладку Драйверы.
  4. Нажмите кнопку + (Драйвер), чтобы добавить драйвер.
  5. Для параметра Имя введите Databricks.
  6. На вкладке Общие в списке Файлы драйверов нажмите кнопку + (Добавить).
  7. Щелкните Пользовательские файлы JAR.
  8. Найдите и выберите файл DatabricksJDBC42.jar, извлеченный ранее, и нажмите кнопку Открыть.
  9. Для параметра Класс выберите com.databricks.client.jdbc.Driver.
  10. Щелкните OK.

шаг 3. Подключение DataGrip к базам данных Azure Databricks

  1. В DataGrip щелкните Файл> Источники данных.

  2. На вкладке Источники данных нажмите кнопку + (Добавить).

  3. Выберите драйвер Databricks, добавленный на предыдущем шаге.

  4. На вкладке "Общие" введите значение поля URL-адреса JDBC для ресурса Azure Databricks. Синтаксис поля URL-адреса JDBC см. в параметрах проверки подлинности драйвера JDBC Databricks.

  5. Нажмите кнопку Проверить подключение.

    Совет

    Перед тестированием подключения необходимо запустить ресурс. В противном случае выполнение теста может занять несколько минут, принимая во внимание запуск ресурса.

  6. Если подключение выполнено успешно, на вкладке "Схемы" проверка поля для схем, к которым требуется получить доступ, например все схемы.

  7. Щелкните OK.

Повторите инструкции этого шага для каждого ресурса, который должен быть доступен для DataGrip.

Шаг 4. Использование DataGrip для просмотра таблиц

Используйте DataGrip для доступа к таблицам в рабочей области Azure Databricks.

  1. В DataGrip, в окне База данных разверните узел ресурса, затем — схему, которую необходимо просмотреть, и, наконец, — узел таблиц.
  2. Дважды щелкните таблицу. Отобразится первый набор строк из таблицы.

Повторите инструкции этого шага, чтобы получить доступ к дополнительным таблицам.

Для доступа к таблицам в других схемах на панели инструментов окна База данных щелкните значок Свойства источника данных. В диалоговом окне Источники данных и драйверы на вкладке Схемы установите флажок для каждой дополнительной схемы, к которой нужен доступ, и нажмите кнопку ОК.

Шаг 5. Использование DataGrip для выполнения инструкций SQL

Используйте DataGrip, чтобы загрузить пример trips таблицы из samples схемы каталога nyctaxi .

  1. В DataGrip щелкните файл "Создать >> SQL-файл".

  2. Укажите имя для файла, например select_trips.

  3. На вкладке "Файл" select_trips.sql введите следующую инструкцию SQL:

    SELECT * FROM samples.nyctaxi.trips;
    
  4. Выберите инструкцию SELECT.

  5. На панели инструментов на вкладке файла щелкните значок Выполнить.

Следующие шаги

Дополнительные ресурсы