Apache Spark MLlib gebruiken in Azure Databricks

Apache Spark MLlib is de bibliotheek voor machine learning van Apache Spark die bestaat uit veelgebruikte leeralgoritmen en hulpprogramma's, zoals voor classificatie, regressie, clustering, gezamenlijke filterfuncties, dimensionaliteitsvermindering en onderliggende optimalisatieprimitieven. Azure Databricks beveelt de volgende Apache Spark MLlib-handleidingen aan:

Voorbeeldnotebooks

De volgende notebooks laten zien hoe u verschillende Apache Spark MLlib-functies kunt gebruiken met behulp van Azure Databricks.

In deze sectie:

Voorbeeld van binaire classificatie

In dit notebook leert u hoe u een binaire classificatietoepassing bouwt met de Apache Spark MLlib Pipelines-API.

Notebook voor binaire classificatie

Notebook downloaden

Voorbeelden van beslissingsstructuren

Dit voorbeeld laat verschillende toepassingen van beslissingsstructuren zien met de Apache Spark MLlib Pipelines-API.

Beslissingsstructuren

Deze notebooks laten zien hoe u classificaties kunt uitvoeren met beslissingsstructuren.

Notebook over beslissingsstructuren voor digitale herkenning

Notebook downloaden

Notebook over beslissingsstructuren voor SFO-enquĂȘtes

Notebook downloaden

GBT-regressie met behulp van MLlib-pijplijnen

In dit notebook leert u hoe u MLlib-pijplijnen gebruikt om een regressie uit te voeren met behulp van structuren om het aantal fietsverhuren (per uur) te voorspellen op basis van informatie zoals de dag van de week, het weer, het seizoen, enzovoorts.

Notebook over regressie van fietsverhuur

Notebook downloaden

Apache Spark MLlib-pijplijnen en voorbeeld van gestructureerd streamen

Dit notebook laat zien hoe u een Apache Spark MLlib-pijplijn traint met historische gegevens en toepast op streaming-gegevens.

Notebook over gestructureerd streamen met MLlib-pijplijn

Notebook downloaden

Uitgebreid voorbeeld van Apache Spark MLlib

In dit notebook leert u hoe een aangepaste transformator maakt.

Notebook voor aangepaste transformator

Notebook downloaden

Voor naslaginformatie over MLlib-functies beveelt Azure Databricks de volgende Apache Spark API-referentie aan:

Zie de Apache Spark R-documentatie voor het gebruik van Apache Spark MLlib machine learning R.

Zie Machine learning-visualisaties voor ondersteuning van Azure Databricks bij het visualiseren van machine learning-algoritmen.