Introdução às experimentações do MLflow

Esta coleção de blocos de anotações demonstra como você pode começar a trabalhar com execuções de experimentos MLflow.

Componentes MLflow

O MLflow é uma plataforma open source para gerir o ciclo de vida completo de machine learning. O MLflow tem três componentes principais:

  • Monitorização
  • Modelos
  • Projetos

O componente MLflow Tracking permite registrar e consultar sessões de treinamento (execuções) de modelo de máquina usando as seguintes APIs:

Uma execução MLflow é uma coleção de parâmetros, métricas, tags e artefatos associados a um processo de treinamento de modelo de aprendizado de máquina.

O que são experiências no MLflow?

Os experimentos são a principal unidade de organização no MLflow, todas as execuções do MLflow pertencem a um experimento . Cada experimento permite visualizar, pesquisar e comparar execuções, bem como baixar artefatos ou metadados de execução para análise em outras ferramentas. Os experimentos são mantidos em um servidor de rastreamento MLflow hospedado pelo Azure Databricks.

Os experimentos estão localizados na árvore de arquivos do espaço de trabalho . Você gerencia experimentos usando as mesmas ferramentas usadas para gerenciar outros objetos de espaço de trabalho, como pastas, blocos de anotações e bibliotecas.

Blocos de anotações de exemplo MLflow

Os blocos de anotações a seguir demonstram como criar e registrar em uma execução MLflow usando as APIs de rastreamento MLflow, bem como usar a interface do usuário do experimento para exibir a execução. Esses notebooks estão disponíveis em Python, Scala e R.

Os notebooks Python e R usam um experimento de notebook. O bloco de anotações Scala cria um experimento Shared na pasta.

Nota

Com o Databricks Runtime 10.4 LTS ML e superior, o Databricks Autologging é habilitado por padrão para notebooks Python.