Что такое AutoML?

Databricks AutoML помогает автоматически применять машинное обучение к набору данных. Вы предоставляете набор данных и определяете целевой объект прогнозирования, а AutoML подготавливает набор данных для обучения модели. Затем AutoML выполняет и записывает набор пробных версий, которые создают, настраивают и оценивают несколько моделей. После оценки модели AutoML отображает результаты и предоставляет записную книжку Python с исходным кодом для каждого пробного запуска, чтобы можно было просматривать, воспроизводить и изменять код. AutoML также рассчитывает сводные статистические данные по вашему набору данных и сохраняет эту информацию в записной книжке, которую вы можете просмотреть позже.

Databricks AutoML можно использовать для задач регрессии, классификации и прогнозирования. Узнайте больше о работе Azure Databricks AutoML.

Требования

  • Databricks Runtime 9.1 ML или более поздней версии. Для общедоступной версии Databricks Runtime 10.4 LTS ML или более поздней.
    • Для прогнозирования временных рядов используйте Databricks Runtime 10.0 ML или более поздней версии.
    • В Databricks Runtime 9.1 LTS ML и более поздних версий AutoML зависит от пакета databricks-automl-runtime, который содержит компоненты, полезные вне AutoML, а также помогает упростить записные книжки, созданные в ходе обучения AutoML. databricks-automl-runtime доступен в PyPI.
  • Дополнительные библиотеки, отличные от предварительно установленных в Databricks Runtime для Машинное обучение, должны быть установлены в кластере.
    • Любое изменение (удаление, обновление или понижение) до существующих версий библиотек приводит к сбоям при выполнении из-за несовместимости.
  • AutoML несовместим с кластерами режима общего доступа.
  • Чтобы использовать каталог Unity с AutoML, режим доступа к кластеру должен быть одним пользователем, и вы должны быть назначенным одним пользователем кластера.

Следующие шаги