Настройка кластера больших данных SQL Server

Область применения: SQL Server 2019 (15.x)

Важно!

Поддержка надстройки "Кластеры больших данных" Microsoft SQL Server 2019 будет прекращена. Мы прекратим поддержку Кластеров больших данных SQL Server 2019 28 февраля 2025 г. Все существующие пользователи SQL Server 2019 с Software Assurance будут полностью поддерживаться на платформе, и программное обеспечение будет продолжать поддерживаться с помощью накопительных обновлений SQL Server до этого времени. Дополнительные сведения см. в записи блога объявлений и в статье о параметрах больших данных на платформе Microsoft SQL Server.

Управление конфигурацией позволяет администраторам обеспечивать постоянную готовность кластера больших данных к выполнению рабочих нагрузок. С помощью этой функции администраторы кластера больших данных могут изменять или настраивать различные его компоненты во время или после развертывания, а также получать более подробные сведения о конфигурациях, используемых в кластере больших данных.

Управление конфигурацией позволяет администратору включать агент SQL, определять базовые ресурсы для заданий Spark организации и даже узнавать, какие параметры можно настроить в каждой области. Во время развертывания конфигурации можно настроить с помощью файла bdc.json, а после развертывания — с помощью интерфейса CLI azdata.

Области конфигурации

Конфигурация кластеров больших данных включает три уровня: cluster, service и resource. Иерархия параметров также следует этому порядку — от высшего к низшему. Компоненты Кластеров больших данных принимают значение параметра, определенное на самом низком уровне. Если параметр не определен в заданной области, он наследует значение из более высокой родительской области.

Например, вы можете определить число ядер по умолчанию для использования драйвером Spark в ресурсах пула носителей и Sparkhead. Чтобы определить число ядер по умолчанию, можно выполнить одно из указанных ниже действий.

  • Задайте число ядер по умолчанию в области службы Spark.

  • Задайте число ядер по умолчанию в области ресурсов storage-0 и sparkhead.

В первом сценарии все ресурсы низшей области службы Spark (пул носителей и Sparkhead) наследуют число ядер по умолчанию из значения службы Spark по умолчанию.

Во втором сценарии каждый ресурс будет использовать значение, определенное в соответствующей области.

Если число ядер по умолчанию настроено как в области службы, так и в области ресурсов, значение из области ресурсов будет переопределять значение из области службы, так как это самая низкая настроенная пользователем область для заданного параметра.

Следующие шаги

Конкретные сведения о конфигурации см. в соответствующих статьях:

Справка: