Что такое AutoML?
Databricks AutoML помогает автоматически применять машинное обучение к набору данных. Вы предоставляете набор данных и определяете целевой объект прогнозирования, а AutoML подготавливает набор данных для обучения модели. Затем AutoML выполняет и записывает набор пробных версий, которые создают, настраивают и оценивают несколько моделей. После оценки модели AutoML отображает результаты и предоставляет записную книжку Python с исходным кодом для каждого пробного запуска, чтобы можно было просматривать, воспроизводить и изменять код. AutoML также рассчитывает сводные статистические данные по вашему набору данных и сохраняет эту информацию в записной книжке, которую вы можете просмотреть позже.
Databricks AutoML можно использовать для задач регрессии, классификации и прогнозирования. Узнайте больше о работе Azure Databricks AutoML.
Требования
- Databricks Runtime 9.1 ML или более поздней версии. Для общедоступной версии Databricks Runtime 10.4 LTS ML или более поздней.
- Для прогнозирования временных рядов используйте Databricks Runtime 10.0 ML или более поздней версии.
- В Databricks Runtime 9.1 LTS ML и более поздних версий AutoML зависит от пакета
databricks-automl-runtime
, который содержит компоненты, полезные вне AutoML, а также помогает упростить записные книжки, созданные в ходе обучения AutoML.databricks-automl-runtime
доступен в PyPI.
- Дополнительные библиотеки, отличные от предварительно установленных в Databricks Runtime для Машинное обучение, должны быть установлены в кластере.
- Любое изменение (удаление, обновление или понижение) до существующих версий библиотек приводит к сбоям при выполнении из-за несовместимости.
- AutoML несовместим с кластерами режима общего доступа.
- Чтобы использовать каталог Unity с AutoML, режим доступа к кластеру должен быть одним пользователем, и вы должны быть назначенным одним пользователем кластера.