Tutorial de machine learning

Nota

Databricks Runtime ML é uma ferramenta abrangente para desenvolver e implementar modelos de aprendizagem automática com Azure Databricks. Inclui as bibliotecas de aprendizagem automática e aprendizagem profunda mais populares, bem como o MLflow,uma plataforma de aprendizagem automática API para rastrear e gerir o ciclo de vida de aprendizagem automática de ponta a ponta. Consulte o guia de aprendizagem automática e aprendizagem profunda para mais detalhes.

A biblioteca de machine learning Apache Spark (MLlib) permite que os cientistas de dados se concentrem nos seus problemas e modelos de dados em vez de resolver as complexidades em torno de dados distribuídos (como infraestruturas, configurações, e assim por diante). O caderno tutorial leva-o através dos passos de carregamento e pré-processamento de dados, treinando um modelo usando um algoritmo MLlib, avaliando o desempenho do modelo, afinando o modelo e fazendo previsões. Ilustra também a utilização de gasodutos MLlib e a plataforma de aprendizagem automática MLflow.

Bloco de Notas

Utilize o caderno que corresponde à versão databricks Runtime no seu cluster. Para mais exemplos de aprendizagem automática, consulte machine learning e guia de aprendizagem profunda.

Começa com o caderno MLlib (Databricks Runtime 7.0 ou superior)

Obter o bloco de notas

Começa com o caderno MLlib (Databricks Runtime 5.5 LTS ou 6.x)

Obter o bloco de notas