Rychlý Start – Python

MLflow je open source platforma pro správu kompletního životního cyklu strojového učení. MLflow poskytuje jednoduchá rozhraní API pro metriky protokolování (například ztráty modelu), parametry (například rychlost učení) a namontované modely, což usnadňuje analýzu výsledků školení nebo nasazení modelů později.

V této části:

Nainstalovat MLflow

Pokud používáte Databricks runtime pro Machine Learning, MLflow je už nainstalovaný. V opačném případě nainstalujte balíček MLflow z PyPI.

Automatické protokolování školicích běhů do MLflow

MLflow poskytuje mlflow.<framework>.autolog() rozhraní API k automatickému protokolování školicího kódu napsaného v mnoha architekturách ml. Toto rozhraní API můžete volat předtím, než spustíte školicí kód pro protokol metriky, parametry a artefakty specifické pro model.

Tensorflow

# Also autoinstruments tf.keras
import mlflow.tensorflow
mlflow.tensorflow.autolog()

Keras

# Use import mlflow.tensorflow and mlflow.tensorflow.autolog() if using tf.keras
import mlflow.keras
mlflow.keras.autolog()

Xgboost

import mlflow.xgboost
mlflow.xgboost.autolog()

Lightgbm

import mlflow.lightgbm
mlflow.lightgbm.autolog()

Scikit-learn

import mlflow.sklearn
mlflow.sklearn.autolog()

Pyspark

Při ladění s nástrojem pyspark.ml se metriky a modely automaticky protokolují do MLflow. Viz Apache Spark MLlib a automatizované sledování MLflow .

Zobrazení výsledků

Po spuštění kódu Machine Learning můžete zobrazit výsledky pomocí bočního panelu postranit experiment. Pokyny k zobrazení experimentu, spuštění a revizi poznámkového bloku používaného v rychlém startu najdete v tématu zobrazení experimentu poznámkového bloku .

Sledovat další metriky, parametry a modely

Další informace můžete protokolovat přímo vyvoláním rozhraní API pro protokolování sledování MLflow.

  • Číselné metriky:

    import mlflow
    mlflow.log_metric("accuracy", 0.9)
    
  • Parametry školení:

    import mlflow
    mlflow.log_param("learning_rate", 0.001)
    
  • Vzor

    Scikit-learn

    import mlflow.sklearn
    mlflow.sklearn.log_model(model, "myModel")
    

    Pyspark

    import mlflow.spark
    mlflow.spark.log_model(model, "myModel")
    

    Xgboost

    import mlflow.xgboost
    mlflow.xgboost.log_model(model, "myModel")
    

    Tensorflow

    import mlflow.tensorflow
    mlflow.tensorflow.log_model(model, "myModel")
    

    Keras

    import mlflow.keras
    mlflow.keras.log_model(model, "myModel")
    

    Pytorch

    import mlflow.pytorch
    mlflow.pytorch.log_model(model, "myModel")
    

    Spacy

    import mlflow.spacy
    mlflow.spacy.log_model(model, "myModel")
    
  • Další artefakty (soubory):

    import mlflow
    mlflow.log_artifact("/tmp/my-file", "myArtifactPath")
    

Příklady poznámkových bloků

Požadavky

Databricks Runtime 6,4 nebo vyšší nebo Databricks Runtime 6,4 ML nebo vyšší.

Notebooks

Doporučený způsob, jak začít používat sledování MLflow pomocí Pythonu, je použití autolog() rozhraní MLflow API. Díky funkcím automatického protokolování v MLflow se v jednom řádku kódu automaticky protokoluje výsledný model, parametry použité k vytvoření modelu a skóre modelu. Následující Poznámkový blok vám ukáže, jak nastavit spuštění pomocí autologging.

Poznámkový blok MLflow autologging pro rychlé přihlašování Python

Získat poznámkový blok

Pokud potřebujete větší kontrolu nad metrikami protokolovanými jednotlivými cvičeními nebo chcete protokolovat další artefakty, jako jsou tabulky nebo vykreslení, můžete použít funkce rozhraní API pro protokolování MLflow, které jsou znázorněné v následujícím poznámkovém bloku.

Rychlé zablokování rozhraní API pro MLflow protokolování v Pythonu

Získat poznámkový blok

Další informace