Exemplos de treinamento de modelo
Esta seção inclui exemplos que mostram como treinar os modelos de machine learning no Azure Databricks usando muitas bibliotecas de software livre populares.
Você também pode usar o AutoML, que prepara automaticamente um conjunto de dados para treinamento de modelo, executa um conjunto de avaliações usando bibliotecas de software livre (como scikit-learn e XGBoost) e cria um notebook Python com o código-fonte de cada execução de avaliação para que você possa examinar, reproduzir e modificar o código.
Para visualizar um notebook de exemplo que mostra como treinar um modelo de machine learning que usa dados no Catálogo do Unity e grava as previsões no Catálogo do Unity, confira Treinar e registrar modelos de machine learning com o Catálogo do Unity.
Exemplos de machine learning
Pacote | Notebook(s) | Recursos |
---|---|---|
scikit-learn | Tutorial de aprendizado de máquina | Modelo de classificação, MLflow, ajuste de hiperparâmetro automatizado com Hyperopt e MLflow |
scikit-learn | Exemplo de ponta a ponta | Modelo de classificação, MLflow, ajuste de hiperparâmetro automatizado com Hyperopt e MLflow, XGBoost, Registro de Modelo, Fornecimento do Modelo |
MLlib | Exemplos de MLlib | Classificação binária, árvores de decisão, regressão GBT, fluxo estruturado, transformador personalizado |
xgboost | Exemplos de XGBoost | Python, PySpark e Scala, cargas de trabalho de nó único e treinamento distribuído |
Exemplos de ajuste de hiperparâmetro
Para obter informações gerais sobre o ajuste de hiperparâmetro no Azure Databricks, confira o Ajuste do Hiperparâmetro.
Pacote | Notebook | Recursos |
---|---|---|
Hyperopt | Hyperopt distribuído | Hyperopt distribuído, scikit-learn, MLflow |
Hyperopt | Comparar modelos | Usar o hyperopt distribuído para pesquisar espaço de hiperparâmetro para diferentes tipos de modelo simultaneamente |
Hyperopt | Algoritmos de treinamento distribuído e hyperopt | Hyperopt, MLlib |
Hyperopt | Práticas recomendadas do Hyperopt | Práticas recomendadas para conjuntos de dados de diferentes tamanhos |