Was ist Machine Learning?

Machine Learning ist ein Data Science-Verfahren, mit dem Computer aus vorhandenen Daten lernen können, um zukünftiges Verhalten, Ergebnisse und Trends vorherzusagen. Durch den Einsatz von maschinellem Lernen können Computer lernen, ohne konkret programmiert worden zu sein. Tools für maschinelles Lernen verwenden KI-Systeme, die Muster erkennen und Assoziationen aus der Erfahrung mit den Daten herstellen können.

Vorhersagen oder Prognosen durch automatisiertes maschinelles Lernen können Anwendungen und Geräte intelligenter machen. Wenn Sie beispielsweise online einkaufen, trägt maschinelles Lernen dazu bei, dass Ihnen anhand der gekauften Produkte weitere Produkte empfohlen werden, die Ihnen gefallen könnten. Oder wenn Sie Ihre Kreditkarte durchziehen, vergleicht das maschinelle Lernen die Transaktion mit einer Datenbank von Transaktionen und hilft, Betrug zu erkennen. Auch wenn ein automatischer Staubsauger ein Zimmer saugt, wird mit maschinellem Lernen entschieden, ob die Arbeit erledigt ist.

Passende Machine Learning-Tools für alle Aufgaben

Azure Machine Learning verfügt über alle Tools, die Entwickler und Data Scientists für ihre Machine Learning-Workflows benötigen, z. B.:

Zum Erstellen von End-to-End-Workflowpipelines können Sie sogar Kubeflow verwenden.

Erstellen von Machine Learning-Modellen in Python oder R

Beginnen Sie Ihr Training auf Ihrem lokalen Computer mit dem Azure Machine Learning Python SDK oder R. Anschließend können Sie in die Cloud aufskalieren. Dank zahlreicher verfügbarer Computeziele wie Azure Machine Learning-Compute und Azure Databricks sowie Diensten für die erweiterte Hyperparameteroptimierung können Sie mithilfe der Cloud schneller bessere Modelle erstellen. Mit dem SDK können Sie auch das Training und die Abstimmung von Modellen automatisieren.

Erstellen von Machine Learning-Modellen mit Tools ohne Code

Optionen für Training und Bereitstellung ohne oder mit nur wenig Code:

  • Azure Machine Learning-Designer

    Verwenden Sie den Designer, um Daten vorzubereiten, Modelle für maschinelles Lernen zu trainieren, zu testen, einzusetzen, zu verwalten und zu verfolgen, ohne Code zu schreiben. Sie müssen nicht programmieren, sondern Sie verbinden Datensätze und Module visuell, um Ihr Modell zu erstellen. Versuchen Sie, eine Pipeline im Studio zu erstellen.

    Weitere Informationen finden Sie im Übersichtsartikel über den Azure Machine Learning-Designer.

  • SDK für automatisiertes maschinelles Lernen (AutoML)

    Erfahren Sie, wie Sie auf der benutzerfreundlichen Oberfläche AutoML-Experimente erstellen.

MLOps: Bereitstellung und Lebenszyklusverwaltung

MLOps (Machine Learning Operations) basiert auf DevOps-Prinzipien und -Methoden, die die Effizienz von Workflows erhöhen. Beispiele sind Continuous Integration, Continuous Delivery und Continuous Deployment. MLOps wendet diese Prinzipien auf den Machine Learning-Prozess mit folgendem Ziel an:

  • Schnelleres Experimentieren und Entwickeln von Modellen
  • Schnellere Bereitstellung von Modellen in der Produktionsumgebung
  • Qualitätssicherung

Wenn Sie über das richtige Modell verfügen, können Sie es ganz einfach in einem Onlineendpunkt verwenden. Weitere Informationen finden Sie unter Bereitstellen von Modellen mit Azure Machine Learning.

Anschließend können Sie Ihre bereitgestellten Modelle verwalten, indem Sie das Azure Machine Learning SDK für Python, Azure Machine Learning Studio oder die Azure Machine Learning CLI verwenden.

Diese Modelle können genutzt werden, um Prognosen in Echtzeit oder asynchron für große Datenmengen zurückzugeben.

Und dank fortschrittlicherMachine Learning-Pipelines können Sie bei jedem einzelnen Schritt – von der Datenaufbereitung über Training und Bewertung von Modellen bis hin zur Bereitstellung – zusammenarbeiten. Pipelines ermöglichen Folgendes:

  • Automatisieren des End-to-End-Prozesses für maschinelles Lernen in der Cloud
  • Wiederverwenden von Komponenten und Wiederholen von Schritten nur bei Bedarf
  • Verwenden verschiedener Computeressourcen in jedem Schritt
  • Ausführen von Batchbewertungsaufgaben

Falls Sie Skripts zum Automatisieren Ihres Machine Learning-Workflows nutzen möchten, helfen Ihnen die Befehlszeilentools der Azure Machine Learning CLI weiter. Hiermit können häufige Aufgaben erledigt werden, z. B. das Übermitteln einer Trainingsausführung oder das Bereitstellen eines Modells.

Informationen zu den nächsten Schritten mit Azure Machine Learning finden Sie hier.

Automatisiertes maschinelles Lernen

Datenwissenschaftler verbringen übermäßig viel Zeit damit, während des Experimentierens über Modelle zu iterieren. Das Ausprobieren verschiedener Algorithmen und Hyperparameterkombinationen, bis ein akzeptables Modell erstellt ist, ist für Datenwissenschaftler extrem anstrengend, da die Arbeit eintönig und wenig herausfordernd ist. Dieses Vorgehen führt zwar zu einer massiven Steigerung der Effizienz des Modells, kostet aber manchmal zu viel Zeit und Ressourcen und kann daher eine negative Kapitalrendite (ROI) haben.

Hier kommt automatisiertes maschinelles Lernen (AutoML) ins Spiel. Es verwendet die Konzepte aus dem Forschungspapier zur probabilistischen Matrixfaktorisierung. Es implementiert eine automatisierte Pipeline zum Ausprobieren intelligent ausgewählter Algorithmen und Hypermetereinstellungen basierend auf den Heuristiken der dargestellten Daten unter Berücksichtigung des gegebenen Problems oder Szenarios. Das Ergebnis dieser Pipeline ist eine Reihe von Modellen, die für das jeweilige Problem und den jeweiligen Datensatz am besten geeignet sind.

Weitere Informationen zu AutoML finden Sie unter AutoML und MLOps mit Azure Machine Learning.

Verwaltete Lösungen

Azure Machine Learning bietet vollständig verwaltete Ressourcen wie:

  • Recheninstanzen: Cloudbasierte VMs sind mit dem SDK und beliebten Data Science-Tools wie Jupyter Notebooks und JupyterLab vorkonfiguriert. Weitere Informationen finden Sie unter Erstellen und Verwalten von Compute-Instanzen.
  • Compute-Cluster: Trainieren Sie Modelle im Maßstab mithilfe der dynamischen Skalierung der Cluster virtueller Azure-Computer. Weitere Informationen finden Sie unter Erstellen und Verwalten von Compute-Clustern.
  • Serverlose Compute-Cluster: Trainieren Sie Modelle für dynamisch erstellte, dynamisch skalierende Cluster von virtuellen Azure-Computern. Weitere Informationen finden Sie unter Modellschulung auf serverlosem Compute (Vorschau).
  • Serverlose Apache Spark: Verwenden Sie dynamisch erstellte Apache Spark-Cluster für interaktive Daten-Wrangling- oder Training machine Learning-Modelle. Weitere Informationen finden Sie unter Serverless Spark compute.
  • Verwaltete Online-Endpunkte: Bereitstellen von Modellen als Webdienste, die Clientanwendungen nutzen können. Weitere Informationen finden Sie unter Online-Endpunkte.
  • Verwaltetes virtuelles Netzwerk: Bietet Netzwerkisolation für verwaltete Azure Machine Learning-Ressourcen und andere Azure-Dienste, auf denen Azure Machine Learning basiert. Weitere Informationen finden Sie unter Verwaltete Netzwerkisolation auf Arbeitsbereichsebene (Vorschau).

Verantwortungsvolles maschinelles Lernen

Vertrauen muss bei der Entwicklung und Nutzung von KI-Systemen im Mittelpunkt stehen. Vertrauen in die Plattform, den Prozess und die Modelle. Da KI und autonome Systeme immer stärker in unsere Gesellschaft integriert werden, ist es wichtig, proaktiv Maßnahmen zu ergreifen, um den unbeabsichtigten Folgen dieser Technologien vorzugreifen und sie zu beheben.

  • Verstehen Sie Ihre Modelle, und bauen Sie auf Fairness: Erläutern Sie das Modellverhalten und entdecken Sie Funktionen, welche die größten Auswirkungen auf Vorhersagen haben. Verwenden Sie integrierte Erklärungen für Glass- und Blackbox-Modelle während des Modelltrainings und der Inferenz. Verwenden Sie interaktive Visualisierungen zum Vergleichen von Modellen, und führen Sie Was-wäre-wenn-Analysen durch, um die Modellgenauigkeit zu verbessern. Testen Sie Ihre Modelle mit hochmodernen Algorithmen auf Fairness. Verringern Sie Unfairness im gesamten Lebenszyklus des maschinellen Lernens, vergleichen Sie die angepassten Modelle, und gehen Sie bewusst Kompromisse zwischen Fairness und Genauigkeit ein.
  • Schützen Sie die Privatsphäre und Vertraulichkeit: Erstellen Sie Modelle, die dies mit den neuesten Innovationen im differenziellen Datenschutz gewährleisten, bei dem in Daten genau abgestimmtes statistisches Datenrauschen eingefügt wird, um die Offenlegung vertraulicher Informationen einzuschränken. Erkennen Sie Datenverluste, und begrenzen Sie auf intelligente Weise wiederholte Abfragen, um das Risiko der Offenlegung gering zu halten. Verwenden Sie Verschlüsselung und vertrauliche Maschinelle Lerntechniken, die für maschinelles Lernen entwickelt wurden, um Modelle mit vertraulichen Daten sicher zu erstellen.
  • Kontrollieren und steuern Sie jeden Schritt des maschinellen Lernens: Greifen Sie auf integrierte Funktionen zu, um die Herkunft automatisch zu verfolgen und einen Prüfpfad über den gesamten Lebenszyklus des maschinellen Lernens zu erstellen. Verschaffen Sie sich einen vollständigen Überblick über den Prozess des maschinellen Lernens, indem Sie Datensätze, Modelle, Experimente, Code und mehr verfolgen. Verwenden Sie benutzerdefinierte Tags, um Modelldatenblätter zu implementieren, Metadaten für wichtige Modelle zu dokumentieren, die Verantwortlichkeit zu erhöhen und einen verantwortungsbewussten Ablauf zu gewährleisten.

Erfahren Sie mehr über die Implementierung von Responsible ML.

Integration in andere Dienste

Azure Machine Learning arbeitet mit anderen Azure-Plattformdiensten zusammen und lässt sich mit Open-Source-Tools wie Git und MLflow integrieren.

Nächste Schritte