Beschreibungen von Machine Learning Modulen

Dieses Thema enthält eine Übersicht über alle Module , die in Azure Machine Learning Studio (klassisch) enthalten sind. Hierbei handelt es sich um einen interaktiven, visuellen Arbeitsbereich, mit dem Vorhersagemodelle erstellt und getestet werden können.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Dieser Inhalt bezieht sich nur auf Studio (klassisch). Ähnliche Drag & Drop-Module wurden Azure Machine Learning-Designer hinzugefügt. Weitere Informationen finden Sie in diesem Artikel zum Vergleich der beiden Versionen.

Was ist ein Modul?

In Machine Learning Studio (klassisch) ist ein Modul ein Baustein zum Erstellen von Experimenten. Jedes Modul kapselt einen bestimmten Machine Learning-Algorithmus, eine Funktion oder eine Code Bibliothek, die auf Daten in Ihrem Arbeitsbereich reagieren kann. Die Module sind so konzipiert, dass Sie Verbindungen von anderen Modulen akzeptieren, um Daten gemeinsam zu nutzen und zu ändern.

Der Code, der in jedem Modul ausgeführt wird, stammt aus vielen Quellen. Hierzu gehören Open Source-Bibliotheken und-Sprachen, von Microsoft Research entwickelte Algorithmen und Tools für die Arbeit mit Azure und anderen Clouddiensten.

Tipp

Suchen Sie nach Machine Learning-Algorithmen? Weitere Informationen finden Sie in der Kategorie Machine Learning , die Module für Entscheidungsbäume, Clustering, neuronale Netzwerke enthält. Die Kategorie trainieren und Auswerten enthalten Module, mit denen Sie Ihre Modelle trainieren und testen können.

Durch das verbinden und Konfigurieren von Modulen können Sie einen Workflow erstellen, der Daten aus externen Quellen liest, Sie für die Analyse vorbereitet, Machine Learning-Algorithmen anwendet und Ergebnisse generiert.

Wenn ein Experiment in Machine Learning Studio (klassisch) geöffnet ist, können Sie die komplette Liste der aktuellen Module im Navigationsbereich auf der linken Seite sehen. Sie ziehen diese Bausteine in ihr Experiment und verbinden Sie dann, um einen kompletten Machine Learning-Workflow zu erstellen, der als Experiment bezeichnet wird.

Manchmal werden Module aktualisiert, um neue Funktionen hinzuzufügen, oder um älteren Code zu entfernen. Wenn dies geschieht, werden alle von Ihnen erstellten Experimente, die das-Modul verwenden, weiterhin ausgeführt. Wenn Sie das Experiment das nächste Mal öffnen, werden Sie jedoch aufgefordert, das Modul zu aktualisieren oder ein anderes Modul zu verwenden.

Beispiele

Ein Beispiel für das Erstellen eines kompletten Machine Learning-Experiments finden Sie in den folgenden Tutorials:

Modulkategorien

Um die Suche nach verwandten Modulen zu vereinfachen, werden die Machine Learning-Tools in Machine Learning Studio (klassisch) nach diesen Kategorien gruppiert.

Daten Format Konvertierungen

Verwenden Sie diese Module zum Konvertieren von Daten in eins der Formate, die von anderen Machine Learning-Tools oder -Formaten verwendet werden.

  • Dateneingabe und -ausgabe

    Verwenden Sie diese Module zum Lesen von Daten und Modellen aus clouddatenquellen, einschließlich Hadoop-Clustern, Azure-Tabellen Speicher und Web-URLs. Sie können diese Module auch verwenden, um Ergebnisse in den Speicher oder in eine Datenbank zu schreiben.

  • Datentransformation

    Verwenden Sie diese Module zum Vorbereiten von Daten für die Analyse. Sie können Datentypen ändern, Spalten als Features oder Bezeichnungen kennzeichnen, Features generieren und Daten skalieren oder normalisieren.

  • Filter

    Transformieren von numerischen Daten, die von der digitalen Signalverarbeitung abgeleitet werden.

  • Lernen mit Zählungen

    Verwenden Sie gemeinsame Wahrscheinlichkeitsverteilungen, um Features zu erstellen, die große Datasets kompakt beschreiben.

  • Manipulation

    Diese Gruppe bietet eine Reihe von Tools für die Data Science. Beispielsweise können Sie fehlende Werte entfernen oder ersetzen, eine Teilmenge von Spalten auswählen, eine Spalte hinzufügen oder zwei Datasets verketten.

  • Sample and Split

    Unterteilen Sie ein Dataset nach Kriterien oder nach Größe, um Trainings-und Testsätze zu erstellen oder bestimmte Zeilen zu isolieren.

  • Scale and Reduce

    Transformieren Sie numerische Daten.

Featureauswahl

Verwenden Sie diese Module, um die besten Merkmale in Ihren Daten mithilfe von gut erforschten statistischen Methoden zu identifizieren.

Machine Learning

Diese Gruppe enthält die meisten Machine Learning-Algorithmen, die von Machine Learning unterstützt werden.

Außerdem sind Module enthalten, die die Algorithmen durch Trainingsmodelle, das Erzeugen von Bewertungen und das Auswerten der Modell Leistung unterstützen sollen.

  • Evaluieren

    Nachdem Sie ein Modell trainiert haben, verwenden Sie diese Tools, um die Genauigkeit des Modells zu messen.

  • Initialisieren

    Diese Module stellen die Machine Learning-Algorithmen bereit, die Sie anpassen können, indem Sie Parameter festlegen. Die Algorithmen in diesem Abschnitt sind nach Typ gruppiert:

  • Wert

    Verwenden Sie diese Module, um neue Daten über den Algorithmus zu übergeben und eine Reihe von Ergebnissen für die Auswertung zu generieren. Sie können auch die Ergebnisse der Bewertung als Teil eines Vorhersage Dienstanbieter verwenden.

  • Trainieren

    Diese Module trainieren ein initialisiertes Machine Learning-Modell mit den von Ihnen bereitgestellten Daten.

OpenCV-Bibliotheksmodule

Diese Module bieten Ihnen einfachen Zugriff auf eine beliebte Open Source-Bibliothek für die Bildverarbeitung und Bildklassifikation.

R Language Modules

Verwenden Sie diese Modulen, um Ihrem Experiment benutzerdefinierten R-Code hinzuzufügen oder um ein Machine Learning-Modell auf Grundlage eines R-Pakets zu implementieren.

Python-Sprachmodule

Verwenden Sie diese Module, um Ihrem Experiment benutzerdefinierten Python-Code hinzuzufügen.

Statistische Funktionen

Verwenden Sie diese Module zum Berechnen von Wahrscheinlichkeitsverteilungen, zum Erstellen benutzerdefinierter Berechnungen sowie zum Ausführen einer Vielzahl unterschiedlicher sonstiger Aufgaben im Zusammenhang mit numerischen Variablen.

Textanalyse

Verwenden Sie diese Module, um Feature-Hashwerte und benannte Entitäts Erkennung auszuführen oder um Text mithilfe von Tools für die Verarbeitung natürlicher Sprache vorzuverarbeiten.

Zeitreihe

Verwenden Sie diese Module, um Anomalien in Trends mithilfe von Algorithmen zu bewerten, die speziell für Zeitreihendaten entworfen wurden.

Machine Learning Studio (klassische) Module versuchen nicht, Daten Integrations Tools zu duplizieren, die in anderen Tools wie Azure Data Factory unterstützt werden. Stattdessen bieten die Module Funktionen, die für Maschinelles Lernen spezifisch sind:

  • Normalisierung, Gruppierung und Skalierung von Daten
  • Berechnen der statistischen Verteilung von Daten
  • Konvertierung in andere Machine Learning-Formate
  • Importieren von Daten, die für Machine Learning-Experimente und den Export von Ergebnissen verwendet werden
  • Text Analyse, Featureauswahl und Verringerung der Dimensionalität

Wenn Sie anspruchsvollere Funktionen für die Datenbearbeitung und-Speicherung benötigen, finden Sie hier weitere Informationen:

Weitere Informationen