Använda scikit-learn i Azure Databricks

Den här sidan innehåller exempel på hur du kan använda scikit-learn paketet för att träna maskininlärningsmodeller i Azure Databricks. scikit-learn är ett av de mest populära Python-biblioteken för maskininlärning med en nod och ingår i Databricks Runtime och Databricks Runtime ML. Se Viktig information om Databricks Runtime för scikit-learn-biblioteksversionen som ingår i klustrets körning.

Du kan importera dessa notebook-filer och köra dem på din Azure Databricks-arbetsyta.

Ytterligare exempel på notebook-filer för att komma igång snabbt med Azure Databricks finns i Självstudier: Kom igång med ML.

Grundläggande exempel med scikit-learn

Den här notebook-filen ger en snabb översikt över maskininlärningsmodellträning i Azure Databricks. Det använder paketet scikit-learn för att träna en enkel klassificeringsmodell. Det illustrerar också användningen av MLflow för att spåra modellutvecklingsprocessen och Hyperopt för att automatisera justering av hyperparametrar.

Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

scikit-learn-klassificeringsanteckningsbok (Unity Catalog)

Hämta notebook-fil

Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

scikit-learn-klassificeringsanteckningsbok

Hämta notebook-fil

Exempel från slutpunkt till slutpunkt med scikit-learn i Azure Databricks

Den här notebook-filen använder scikit-learn för att illustrera ett komplett exempel från slutpunkt till slutpunkt på inläsning av data, modellträning, distribuerad hyperparameterjustering och modellinferens. Den illustrerar också modelllivscykelhantering med MLflow Model Registry för att logga och registrera din modell.

Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

Använda scikit-learn med MLflow-integrering på Databricks (Unity Catalog)

Hämta notebook-fil

Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

Använda scikit-learn med MLflow-integrering på Databricks

Hämta notebook-fil