Масштабирование параллельного выполнения внешних сценариев в Службах машинного обучения SQL Server

Применимо к: SQL Server 2016 (13.x) и более поздних версий

Узнайте о рабочих учетных записях для Служб машинного обучения SQL Server и о том, как изменить конфигурацию по умолчанию, чтобы масштабировать количество параллельных выполнений внешних сценариев.

Чтобы могла выполнять задачи, в процессе установки Служб машинного обучения создается новыйпул учетных записей пользователейПанель запуска SQL Server Windows. Эти рабочие учетные записи предназначены для того, чтобы изолировать работу пользователей SQL Server, которые одновременно выполняют внешние сценарии.

Примечание

В SQL Server 2019 в группе SQLRUserGroup теперь содержится только один член, которым является единственная учетная запись службы панели запуска SQL Server, а не несколько рабочих учетных записей. В этой статье описываются рабочие учетные записи для SQL Server 2016 и 2017.

Группа рабочих учетных записей

Группа учетных записей Windows создается при установке SQL Server для каждого экземпляра, на котором установлены и включены службы машинного обучения.

  • В экземпляре по умолчанию именем группы будет SQLRUserGroup. Это имя не зависит от того, используется ли Python, R или они оба.
  • В именованном экземпляре имя группы по умолчанию имеет в качестве суффикса имя экземпляра, например SQLRUserGroupИмя_экземпляра.

По умолчанию пул учетных записей пользователей содержит 20 учетных записей. В большинстве случаев 20 учетных записей более, чем достаточно для поддержки задач машинного обучения, но при необходимости это количество можно изменить. Максимальное число учетных записей — 100.

  • В экземпляре по умолчанию отдельным учетным записям присваиваются имена от MSSQLSERVER01 и до MSSQLSERVER20.
  • Для именованного экземпляра отдельным учетным записям присваиваются имена на основе экземпляра: например, Имя_экземпляра01 и до Имя_экземпляра20.

Если в нескольких экземплярах используется машинное обучение, компьютер будет иметь несколько групп пользователей. Группы не могут совместно использоваться разными экземплярами.

Число рабочих учетных записей

Чтобы изменить число пользователей в пуле учетных записей, необходимо изменить свойства службы Панель запуска SQL Server, как описано ниже.

Пароли, связанные с каждой учетной записью пользователя, генерируются случайным образом, но при необходимости после создания учетных записей их можно изменить.

  1. Откройте диспетчер конфигурации SQL Server и выберите Службы SQL Server.
  2. Дважды щелкните службу панели запуска SQL Server и остановите службу, если она запущена.
  3. Убедитесь, что на вкладке Служба установлен автоматический режим запуска. Внешние сценарии нельзя запустить, если панель запуска не запущена.
  4. Щелкните вкладку Дополнительно и при необходимости измените значение параметра Число внешних пользователей. Этот параметр определяет, сколько различных пользователей SQL могут запускать сеансы внешних сценариев одновременно. Значение по умолчанию — 20 учетных записей. Максимальное число пользователей — 100.
  5. При необходимости можно задать для параметра Сбросить пароль внешних пользователей значение Да, если политика вашей организации требует регулярной смены паролей. Это приведет к повторному созданию зашифрованных паролей, которые хранит панель запуска для учетных записей пользователей. Дополнительные сведения см. в разделе Применение политики паролей.
  6. Перезапустите службу панели запуска.

Управление рабочими нагрузками

Количество учетных записей в этом пуле определяет, сколько может быть одновременно активных сеансов внешних сценариев. По умолчанию создаются 20 учетных записей. Это означает, что 20 разных пользователей могут одновременно работать в активных сеансах Python или R. Можно увеличить число рабочих учетных записей, если предполагается выполнение более 20 параллельных сценариев.

Если один и тот же пользователь одновременно выполняет несколько внешних сценариев, все сеансы будут использовать одну и ту же рабочую учетную запись. Например, один пользователь может выполнять 100 различных сценариев Python или R одновременно, пока это позволяют ресурсы, но при этом все сценарии будут использовать одну рабочую учетную запись.

Число поддерживаемых рабочих учетных записей и количество одновременных сеансов, которые могут выполнять пользователи, ограничивается только ресурсами сервера. Как правило, память является первым узким местом при использовании среды выполнения Python или R.

Ресурсами, которые могут использоваться сценариями Python или R, управляет SQL Server. Мы советуем отслеживать использование ресурсов с помощью динамических административных представлений SQL Server или следить за счетчиками производительности для связанного объекта задания Windows и соответствующим образом настраивать использование памяти сервера. При работе с SQL Server Enterprise Edition вы можете выделить ресурсы для выполнения внешних скриптов, настроив пул внешних ресурсов.

Дальнейшие действия