Scikit-learn gebruiken in Azure Databricks

Op deze pagina vindt u voorbeelden van hoe u het scikit-learn pakket kunt gebruiken om machine learning-modellen te trainen in Azure Databricks. scikit-learn is een van de populairste Python-bibliotheken voor machine learning met één knooppunt en is opgenomen in Databricks Runtime en Databricks Runtime ML. Zie de releaseopmerkingen voor Databricks Runtime voor de scikit-learn-bibliotheekversie die is opgenomen in de runtime van uw cluster.

U kunt deze notebooks importeren en uitvoeren in uw Azure Databricks-werkruimte.

Zie zelfstudies: Aan de slag met ML voor aanvullende voorbeeldnotebooks om snel aan de slag te gaan met Azure Databricks.

Basisvoorbeeld met scikit-learn

Dit notebook biedt een kort overzicht van machine learning-modeltraining in Azure Databricks. Het pakket maakt gebruik van het scikit-learn pakket om een eenvoudig classificatiemodel te trainen. Het illustreert ook het gebruik van MLflow om het ontwikkelingsproces van het model bij te houden en Hyperopt om het afstemmen van hyperparameters te automatiseren.

scikit-learn-classificatienotitieblok

Notebook downloaden

End-to-end-voorbeeld met scikit-learn in Azure Databricks

In dit notebook wordt scikit-learn gebruikt om een volledig end-to-end voorbeeld te illustreren van het laden van gegevens, modeltraining, afstemming van gedistribueerde hyperparameters en modeldeductie. Het illustreert ook modellevenscyclusbeheer met behulp van MLflow Model Registry om uw model te registreren en te registreren.

Scikit-learn gebruiken met MLflow-integratienotebook

Notebook downloaden