Handleiding voor MLflow

MLflow is een open source-platform voor het beheer van de end-to-end levenscyclus van machine learning. Het bestaat uit de volgende hoofdcomponenten:

  • Tracering: Hiermee kunt u experimenten volgen om parameters en resultaten vast te leggen en te vergelijken.
  • Modellen: Hiermee kunt u modellen beheren en implementeren, van verschillende ML-bibliotheken tot verschillende modelbedienings- en inferentieplatforms.
  • Projecten: Hiermee kunt u ML-code verpakken in een herbruikbare, reproduceerbare vorm om te delen met andere datawetenschappers of over te zetten naar productie.
  • Modelregister: Hiermee kunt u een modelwinkel centraliseren voor het beheren van de overgangen van de volledige levenscyclus van modellen: van staging naar productie, met mogelijkheden voor versiebeheer en annotatie.
  • Modellen aanbieden: Hiermee kunt u MLflow-modellen als REST-eindpunten hosten.

MLflow ondersteunt Java, Python, R en REST-API's.

Azure Databricks biedt een volledig beheerde en gehoste versie van MLflow, geïntegreerd met beveiligingsfuncties voor bedrijven, hoge beschikbaarheid en andere Azure Databricks-werkruimtefuncties zoals experimenter- en runbeheer en het vastleggen van revisies van notebooks. MLflow op Azure Databricks biedt een geïntegreerde ervaring voor het volgen en beveiligen van machine learning-modeltrainingen en het uitvoeren van machine learning-projecten.

MLflow-gegevens worden versleuteld door Azure Databricks met behulp van een door het platform beheerde sleutel. Versleuteling met door de klant beheerde sleutels inschakelen voor beheerde services wordt niet ondersteund.

De eerste keer dat gebruikers beginnen met de quickstart, waarin de basis-API's voor het bijhouden van MLflow worden gedemonstreerd. In de volgende artikelen wordt elke MLflow-component geïntroduceerd met voorbeeldnotitieblokken en wordt beschreven hoe deze componenten worden gehost binnen Azure Databricks.