Migrieren zu Azure Machine Learning von einer klassischen Studio-Instanz

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Wir empfehlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Seit Dezember 2021 können Sie keine neuen Ressourcen in der klassischen Studio-Instanz mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Studio (klassisch) weiterhin verwenden.

Die Dokumentation zur klassischen Studio-Instanz wird nicht mehr fortgeführt und künftig möglicherweise nicht mehr aktualisiert.

Erfahren Sie, wie Sie von Machine Learning Studio (klassisch) zu Azure Machine Learning migrieren. Machine Learning bietet eine modernisierte Data-Science-Plattform, die Ansätze ohne Code und Code-First-Ansätze kombiniert.

Dieser Leitfaden führt durch eine grundlegende Lift & Shift-Migration. Wenn Sie einen vorhandenen Workflow für maschinelles Lernen optimieren oder eine Plattform für maschinelles Lernen modernisieren möchten, finden Sie im Framework für die Azure Machine Learning-Einführung weitere Ressourcen (z. B. Tools für digitale Umfragen, Arbeitsblätter und Planungsvorlagen).

Diagramm: Framework für die Einführung von Azure Machine Learning

Arbeiten Sie bei der Migration mit Ihrem Cloud Solution Architect zusammen.

Für das Migrieren zu Machine Learning wird der folgende Ansatz empfohlen:

  • Schritt 1: Bewerten von Machine Learning
  • Schritt 2: Definieren einer Strategie und eines Plans
  • Schritt 3: Erneutes Erstellen von Experimenten und Webdiensten
  • Schritt 4: Integrieren von Client-Apps
  • Schritt 5: Bereinigen von Ressourcen in Studio (klassisch)
  • Schritt 6: Überprüfen und Erweitern von Szenarien

Schritt 1: Bewerten von Machine Learning

  1. Informieren Sie sich über Vorteile, Kosten und die Architektur von Azure Machine Learning.

  2. Vergleichen Sie die Funktionen von Machine Learning und Studio (klassisch).

    Die wesentlichen Unterschiede sind in der folgenden Tabelle zusammengefasst.

    Funktion Studio (klassisch) Azure Machine Learning
    Drag & Drop-Benutzeroberfläche Klassische Oberfläche Aktualisierte Umgebung: Azure Machine Learning-Designer
    Code SDKs Nicht unterstützt Vollständig integriert in Azure Machine Learning Python und R SDKs
    Experiment Skalierbar (Limit für Trainingsdaten: 10 GB) Skalieren mit Computeziel
    Trainieren von Computezielen Proprietäres Computeziel, nur CPU-Unterstützung Viele anpassbare Computeziele für das Training (beinhaltet GPU- und CPU-Unterstützung)
    Computeziele für die Bereitstellung Proprietäres Webdienstformat, nicht anpassbar Viele anpassbare Computeziele für die Bereitstellung (beinhaltet GPU- und CPU-Unterstützung)
    Machine Learning-Pipeline Nicht unterstützt Erstellung von flexiblen modularen Pipelines zum Automatisieren von Workflows
    MLOps Grundlegende Modellverwaltung und Bereitstellung; reine CPU-Bereitstellungen Entitätsversionierung (Modell, Daten, Workflows), Workflowautomatisierung, Integration in CICD-Tools, CPU- und GPU-Bereitstellungen und mehr
    Modellformat Proprietäres Format, nur Studio (klassisch) Mehrere unterstützte Formate, je nach Typ des Trainingsauftrags
    Automatisiertes Modelltraining und Optimieren von Hyperparametern Nicht unterstützt Unterstützt

    Code First-Optionen und codefreie Optionen
    Datendrifterkennung Nicht unterstützt Unterstützt
    Datenbezeichnungsprojekte Nicht unterstützt Unterstützt
    Rollenbasierte Zugriffssteuerung (Role-Based Access Control, RBAC) Nur Rolle „Mitwirkender“ und „Besitzer“ Flexible Rollendefinition und RBAC-Steuerung
    KI-Katalog Unterstützt Nicht unterstützt

    Lernen mit Python SDK-Beispielnotebooks

    Hinweis

    Das Feature Designer in Azure Machine Learning bietet ähnliche Drag & Drop-Funktionen wie Studio (klassisch). Machine Learning bietet als Alternative jedoch auch robuste Code-First-Workflows. Bei dieser Migrationsreihe liegt der Fokus auf dem Designer, da dieser der Funktion in Studio (klassisch) am ähnlichsten ist.

  3. Vergewissern Sie sich, dass die wichtigen Module aus Studio (klassisch) im Machine Learning-Designer unterstützt werden. Weitere Informationen finden Sie in der Tabelle unter Komponentenzuordnung zu Studio (klassisch) und dem Designer.

  4. Erstellen Sie einen Azure Machine Learning-Arbeitsbereich.

Schritt 2: Definieren einer Strategie und eines Plans

  1. Definieren Sie die geschäftliche Begründung und die erwarteten Ergebnisse.

  2. Richten Sie Ihren umsetzbaren Plan für die Azure Machine Learning-Einführung an den gewünschten Geschäftsergebnissen aus.

  3. Bereiten Sie Personen, Prozesse und Umgebungen auf die Änderungen vor.

Arbeiten Sie beim Definieren Ihrer Strategie mit Ihrem Cloud Solution Architect zusammen.

Informationen zur Planung von Ressourcen, einschließlich einer Planungsdokumentationsvorlage, finden Sie im Framework für die Azure Machine Learning-Einführung.

Schritt 3: Erneutes Erstellen Ihres ersten Modells

Nachdem Sie eine Strategie definiert haben, migrieren Sie Ihr erstes Modell.

  1. Migrieren eines Datasets zu Azure Machine Learning

  2. Verwenden Sie den Azure Machine Learning-Designer, um ein Experiment neu zu erstellen.

  3. Verwenden Sie den Azure Machine Learning-Designer, um einen Webdienst erneut bereitzustellen.

    Hinweis

    Diese Anleitung basiert auf Azure Machine Learning v1-Konzepten und -Features. Azure Machine Learning nutzt CLI v2 und Python SDK v2. Es wird empfohlen, die Studio-Modelle (klassisch) mithilfe von v2 anstelle von v1 neu zu erstellen. Starten Sie mit Azure Machine Learning v2.

Schritt 4: Integrieren von Client-Apps

Ändern Sie Clientanwendungen, die Webdienste aus Studio (klassisch) aufrufen, um Ihre neuen Machine Learning-Endpunkte zu verwenden.

Schritt 5: Bereinigen von Ressourcen in Studio (klassisch)

Um zusätzliche Gebühren zu vermeiden, bereinigen Sie aus Studio-Ressourcen (klassisch). Sie sollten Ressourcen so lange für Fallbacks aufbewahren, bis Sie die Machine Learning-Workloads überprüft haben.

Schritt 6: Überprüfen und Erweitern von Szenarien

  1. Überprüfen Sie die Modellmigration auf bewährte Methoden, und bewerten Sie Workloads.

  2. Erweitern Sie Szenarien, und migrieren Sie zusätzliche Workloads zu Azure Machine Learning.

Komponentenzuordnung zu Studio (klassisch) und dem Designer

In der folgenden Tabelle finden Sie Informationen zu den Modulen, die Sie beim erneuten Erstellen von Experimenten aus Studio (klassisch) im Azure Machine Learning-Designer verwenden können.

Wichtig

Der Designer implementiert Module über Open-Source-Python-Pakete anstelle von C#-Paketen wie Studio (klassisch). Aufgrund dieses Unterschieds kann die Ausgabe von Designer-Komponenten leicht von den Entsprechungen in Studio (klassisch) abweichen.

Kategorie Modul aus Studio (klassisch) Designer-Ersatzkomponenten
Dateneingabe und -ausgabe – Manuelle Eingabe von Daten
– Exportieren von Daten
– Importieren von Daten
– Laden eines trainierten Modells
– Entpacken von gezippten Datasets
– Manuelle Eingabe von Daten
– Exportieren von Daten
– Importieren von Daten
Datenformatkonvertierungen – Konvertieren in das CSV-Format
– Konvertieren in ein Dataset
– Konvertieren in das ARFF-Format
– Konvertieren in das SVMLight-Format
– Konvertieren in das TSV-Format
– Konvertieren in das CSV-Format
– Konvertieren in ein Dataset
Datentransformation – Manipulation – Hinzufügen von Spalten
– Hinzufügen von Zeilen
– Anwenden der SQL-Transformation
– Bereinigen fehlender Daten
– Konvertieren in Indikatorwerte
– Bearbeiten von Metadaten
– Verknüpfen von Daten
– Entfernen doppelter Zeilen
– Spalten im Dataset auswählen
– Auswählen der Spaltentransformation
– SMOTE
– Gruppieren von kategorischen Werten
– Hinzufügen von Spalten
– Hinzufügen von Zeilen
– Anwenden der SQL-Transformation
– Bereinigen fehlender Daten
– Konvertieren in Indikatorwerte
– Bearbeiten von Metadaten
– Verknüpfen von Daten
– Entfernen doppelter Zeilen
– Spalten im Dataset auswählen
– Auswählen der Spaltentransformation
– SMOTE
Datentransformation – Skalieren und Verringern – Abschneiden von Werten
– Gruppieren von Daten in Containern
– Daten normalisieren
– Hauptkomponentenanalyse
– Abschneiden von Werten
– Gruppieren von Daten in Containern
– Daten normalisieren
Datentransformation – Beispiel und Teilen – Partition und Beispiel
– Teilen von Daten
– Partition und Beispiel
– Teilen von Daten
Datentransformation – Filter – Anwenden von Filtern
– FIR-Filter
– IIR-Filter
– Medianfilter
– Filter für den gleitenden Durchschnitt
– Schwellenwertfilter
– Benutzerdefinierter Filter
Datentransformation – Lernen mit Zählungen – Erstellen von Zähltransformationen
– Exportieren einer Anzahltabelle
– Importieren einer Anzahltabelle
– Zusammenführen einer Zähltransformation
– Ändern von Anzahltabellenparametern
Featureauswahl – Filterbasierte Featureauswahl
– Fisher‘sche Diskriminanzfunktion
– Permutation der Featurerelevanz
– Filterbasierte Featureauswahl
– Permutation der Featurerelevanz
Modell – Klassifizierung – Entscheidungswald mit mehreren Klassen
– Entscheidungsdschungel mit mehreren Klassen
– Logistische Regression mit mehreren Klassen
– Neuronales Netz mit mehreren Klassen
– One-vs-All-Multiklasse
– Gemitteltes Perzeptron mit zwei Klassen
– Bayes Point Machine mit zwei Klassen
– Verstärkte Entscheidungsstruktur mit zwei Klassen
– Entscheidungswald mit zwei Klassen
– Entscheidungsdschungel mit zwei Klassen
– Lokal tiefe SVM mit zwei Klassen
– Logistische Regression mit zwei Klassen
– Neuronales Netz mit zwei Klassen
– Support Vector Machine mit zwei Klassen
– Entscheidungswald mit mehreren Klassen
– Verstärkte Entscheidungsstruktur mit mehreren Klassen
– Logistische Regression mit mehreren Klassen
– Neuronales Netz mit mehreren Klassen
– One-vs-All-Multiklasse
– Gemitteltes Perzeptron mit zwei Klassen
– Verstärkte Entscheidungsstruktur mit zwei Klassen
– Entscheidungswald mit zwei Klassen
– Logistische Regression mit zwei Klassen
– Neuronales Netz mit zwei Klassen
– Support Vector Machine mit zwei Klassen
Modell – Clustering – k-Means-Algorithmus – k-Means-Algorithmus
Modell – Regression – Bayes‘sche lineare Regression
– Regression mit verstärkter Entscheidungsstruktur
– Regression mit Entscheidungswald
– Schnelle gesamtstrukturbasierte Quantilregression
– Lineare Regression
– Regression mit neuronalem Netz
– Ordinal Regression
– Poisson-Regression
– Regression mit verstärkter Entscheidungsstruktur
– Regression mit Entscheidungswald
– Schnelle gesamtstrukturbasierte Quantilregression
– Lineare Regression
– Regression mit neuronalem Netz
– Poisson-Regression
Modell – Anomalieerkennung – Einklassige SVM
– PCA-basierte Anomalieerkennung
– PCA-basierte Anomalieerkennung
Machine Learning – Auswerten – Durchführen einer Kreuzvalidierung für ein Modell
– Modell bewerten
– Bewerten des Empfehlungsmoduls
– Durchführen einer Kreuzvalidierung für ein Modell
– Modell bewerten
– Bewerten des Empfehlungsmoduls
Machine Learning – Trainieren – Sweepclustering
– Trainieren eines Anomalieerkennungsmodells
– Clusteringmodell trainieren
– Trainieren des Matchbox-Empfehlungsmoduls –
Trainieren des Modells
– Optimieren von Modellhyperparametern
– Trainieren eines Anomalieerkennungsmodells
– Clusteringmodell trainieren
– Trainieren des Modells
– Trainieren Sie das PyTorch Modell
– Trainieren des SVD-Empfehlungsmoduls
– Trainieren des Wide-Learning- und Deep-Learning-Empfehlungsmoduls
– Optimieren von Modellhyperparametern
– Machine Learning – Bewerten – Anwenden von Transformationen
– Zuweisen von Daten zu Clustern
– Bewerten des Matchbox-Empfehlungsmoduls
– Bewerten eines Modells
– Anwenden von Transformationen
– Zuweisen von Daten zu Clustern
– Bewerten eines Bildmodells
– Bewerten eines Modells
– Bewerten des SVD-Empfehlungsmoduls
– Bewerten des Wide-Learning- und Deep-Learning-Empfehlungsmoduls
OpenCV-Bibliotheksmodule – Importieren von Bildern
– Vortrainierte Kaskadenbildklassifizierung
Python-Sprachmodule – Ausführen von Python-Skripts – Ausführen von Python-Skripts
– Erstellen eines Python-Modells
R Language Modules – Ausführen von R-Skripts
– Erstellen von R-Modellen
– Ausführen von R-Skripts
Statistische Funktionen – Anwenden einer mathematischen Operation
– Berechnen grundlegender Statistiken
– Berechnen der linearen Korrelation
– Auswerten von Wahrscheinlichkeitsfunktionen
– Ersetzen diskreter Werte
– Zusammenfassen von Daten
– Testen von Hypothesen mithilfe von t-Tests
– Anwenden einer mathematischen Operation
– Zusammenfassen von Daten
\Textanalyse – Erkennen von Sprachen
– Extrahieren von Schlüsselbegriffen aus Text
– Extrahieren von N-Gramm-Features aus Text
– Featurehashing
– Latent Dirichlet Allocation
– Erkennung benannter Entitäten
– Vorverarbeiten von Text
– Bewerten von vVowpal Wabbit-Modellen (Version 7-10)
– Bewerten von Vowpal Wabbit-Modellen (Version 8)
– Trainieren von Vowpal Wabbit-Modellen (Version 7-10)
– Trainieren von Vowpal Wabbit-Modellen (Version 8)
– Konvertieren von Wörtern in Vektoren
– Extrahieren von N-Gramm-Features aus Text
– Featurehashing
– Latent Dirichlet Allocation
– Vorverarbeiten von Text
– Bewerten von Vowpal Wabbit-Modellen
– Trainieren von Vowpal Wabbit-Modellen
Zeitreihe – Anomalieerkennung in Zeitreihen
Webdienst – Eingabe
- Ausgabe
– Eingabe
- Ausgabe
Maschinelles Sehen – Anwenden von Bildtransformationen
– Konvertieren in Bildverzeichnisse
– Initialisieren von Bildtransformationen
– Teilen von Bildverzeichnissen
– DenseNet-Bildklassifizierung
– ResNet-Bildklassifizierung

Weitere Informationen zur Verwendung einzelner Designer-Komponenten finden Sie in der Referenz zu Algorithmen und Komponenten im Azure Machine Learning-Designer.

Was passiert, wenn eine Designer-Komponente fehlt?

Der Machine Learning-Designer umfasst die beliebtesten Module von Studio (klassisch). Außerdem sind neue Module enthalten, die die neuesten Techniken im Bereich des maschinellen Lernens nutzen.

Wenn Ihre Migration aufgrund fehlender Module im Designer blockiert ist, können Sie uns kontaktieren, indem Sie ein Supportticket erstellen.

Beispielmigration

Beim folgenden Migrationsbeispiel werden einige der Unterschiede zwischen Studio (klassisch) und Azure Machine Learning hervorgehoben.

Datasets

In Studio (klassisch) wurden Datasets in Ihrem Arbeitsbereich gespeichert und konnten nur von Studio (klassisch) verwendet werden.

Screenshot: Datasets „Automobile price“ in Studio (klassisch)

In Machine Learning werden Datasets im Arbeitsbereich registriert und können für alle Bereiche von Machine Learning verwendet werden. Weitere Informationen zu den Vorteilen von Azure Machine Learning-Datasets finden Sie unter Daten in Azure Machine Learning v1.

Pipeline

In Studio (klassisch) enthielten Experimente die Verarbeitungslogik für Ihre Arbeit. Sie haben Experimente mit Drag & Drop-Modulen erstellt.

Screenshot: Experimente für Automobilpreise in Studio (klassisch)

In Machine Learning enthalten Pipelines die Verarbeitungslogik für Ihre Arbeit. Sie können Pipelines entweder mit Drag & Drop-Modulen oder durch Schreiben von Code erstellen.

Screenshot: Drag & Drop-Pipelines für Automobilpreise in Studio (klassisch)

Webdienstendpunkte

Studio (klassisch) hat die REQUEST/RESPOND-API für die Echtzeitvorhersage und die BATCH EXECUTION-API für die Batchvorhersage oder das erneute Training verwendet.

Screenshot: Endpunkt-API in Studio (klassisch)

Azure Machine Learning verwendet Echtzeitendpunkte (verwaltete Endpunkte) für Echtzeitvorhersagen und Pipelineendpunkte für Batchvorhersagen oder erneutes Training.

Screenshot: Echtzeitendpunkte und Pipelineendpunkte

In diesem Artikel haben Sie mehr über die allgemeinen Anforderungen für das Migrieren zu Machine Learning erfahren. Ausführliche Informationen zu den Schritten finden Sie in den anderen Artikeln der Migrationsreihe für Machine Learning Studio (klassisch):

Weitere Migrationsressourcen finden Sie im Azure Machine Learning Adoption Framework.