¿Qué es AutoML?

Databricks AutoML le ayuda a aplicar automáticamente el aprendizaje automático a un conjunto de datos. Proporcione el conjunto de datos e identifique el destino de predicción, mientras AutoML prepara el conjunto de datos para el entrenamiento del modelo. Después, AutoML realiza y registra un conjunto de pruebas que crea, ajusta y evalúa varios modelos. Después de la evaluación de modelos, AutoML muestra los resultados y proporciona un cuaderno de Python con el código fuente de cada ejecución de prueba para que pueda revisar, reproducir y modificar el código. AutoML también calcula las estadísticas de resumen del conjunto de datos y guarda esta información en un cuaderno que podrá revisar más adelante.

Puede usar Databricks AutoML para problemas de regresión, clasificación y previsión. Obtenga más información sobre cómo funciona AutoML de Azure Databricks.

Requisitos

  • Databricks Runtime 9.1 ML o posterior. Para la versión de disponibilidad general (GA), Databricks Runtime 10.4 LTS ML o superior.
    • Para la previsión de series temporales, Databricks Runtime 10.0 ML o posterior.
    • Con Databricks Runtime 9.1 LTS ML y posteriores, AutoML depende del paquete databricks-automl-runtime, que contiene componentes que son útiles fuera de AutoML, y también ayuda a simplificar los cuadernos generados por el entrenamiento de AutoML. databricks-automl-runtime está disponible en PyPI.
  • No se deben instalar bibliotecas adicionales en el clúster, más allá de las que están instaladas previamente en Databricks Runtime para Machine Learning.
    • Cualquier modificación (eliminación, actualización o degradación) a las versiones de biblioteca existentes produce errores de ejecución debido a la incompatibilidad.
  • AutoML no es compatible con clústeres de modo de acceso compartido.
  • Para usar Unity Catalog con AutoML, el modo de acceso del clúster debe ser Usuario único y usted debe ser el usuario único designado del clúster.

Pasos siguientes