Was ist Machine Learning?
Machine Learning ist ein Data Science-Verfahren, mit dem Computer aus vorhandenen Daten lernen können, um zukünftiges Verhalten, Ergebnisse und Trends vorherzusagen. Durch den Einsatz von maschinellem Lernen können Computer lernen, ohne konkret programmiert worden zu sein. Tools für maschinelles Lernen verwenden KI-Systeme, die Muster erkennen und Assoziationen aus der Erfahrung mit den Daten herstellen können.
Vorhersagen oder Prognosen durch automatisiertes maschinelles Lernen können Anwendungen und Geräte intelligenter machen. Wenn Sie beispielsweise online einkaufen, trägt maschinelles Lernen dazu bei, dass Ihnen anhand der gekauften Produkte weitere Produkte empfohlen werden, die Ihnen gefallen könnten. Oder wenn Sie Ihre Kreditkarte durchziehen, vergleicht das maschinelle Lernen die Transaktion mit einer Datenbank von Transaktionen und hilft, Betrug zu erkennen. Auch wenn ein automatischer Staubsauger ein Zimmer saugt, wird mit maschinellem Lernen entschieden, ob die Arbeit erledigt ist.
Passende Machine Learning-Tools für alle Aufgaben
Azure Machine Learning verfügt über alle Tools, die Entwickler und Data Scientists für ihre Machine Learning-Workflows benötigen, z. B.:
- Azure Machine Learning-Designer: Fügen Sie Module per Drag & Drop ein, um Ihre Experimente zu erstellen, und stellen Sie anschließend Pipelines bereit
- Jupyter Notebooks: Verwenden Sie unsere Tutorial-Serie oder erstellen Sie eigene Notebooks, um unsere SDK-Beispiele für Python zu nutzen.
- Integration in MLflow zur Nachverfolgung und Modellverwaltung.
- Der Eingabeaufforderungsfluss (Vorschau) bietet optimierte KI-Anwendungsentwicklung mithilfe großer Sprachmodelle (LLMs).
- Dedizierte Tools für Bildbezeichnungsprojekte .
- R-Skripts oder Notebooks: Erfahren Sie, wie Sie Ihre R-Workloads mitbringen.
- Der Solution Accelerator für viele Modelle (Vorschauversion) baut auf Azure Machine Learning auf und ermöglicht Ihnen Training, Betrieb und Verwaltung von Hunderten oder sogar Tausenden Machine Learning-Modellen.
- Visual Studio Code-Erweiterung
- Machine Learning-CLI
- Open-Source-Frameworks wie PyTorch, TensorFlow, scikit-learn und viele mehr.
Zum Erstellen von End-to-End-Workflowpipelines können Sie sogar Kubeflow verwenden.
Erstellen von Machine Learning-Modellen in Python oder R
Beginnen Sie Ihr Training auf Ihrem lokalen Computer mit dem Azure Machine Learning Python SDK oder R. Anschließend können Sie in die Cloud aufskalieren. Dank zahlreicher verfügbarer Computeziele wie Azure Machine Learning-Compute und Azure Databricks sowie Diensten für die erweiterte Hyperparameteroptimierung können Sie mithilfe der Cloud schneller bessere Modelle erstellen. Mit dem SDK können Sie auch das Training und die Abstimmung von Modellen automatisieren.
Erstellen von Machine Learning-Modellen mit Tools ohne Code
Optionen für Training und Bereitstellung ohne oder mit nur wenig Code:
Azure Machine Learning-Designer
Verwenden Sie den Designer, um Daten vorzubereiten, Modelle für maschinelles Lernen zu trainieren, zu testen, einzusetzen, zu verwalten und zu verfolgen, ohne Code zu schreiben. Sie müssen nicht programmieren, sondern Sie verbinden Datensätze und Module visuell, um Ihr Modell zu erstellen. Versuchen Sie, eine Pipeline im Studio zu erstellen.
Weitere Informationen finden Sie im Übersichtsartikel über den Azure Machine Learning-Designer.
SDK für automatisiertes maschinelles Lernen (AutoML)
Erfahren Sie, wie Sie auf der benutzerfreundlichen Oberfläche AutoML-Experimente erstellen.
MLOps: Bereitstellung und Lebenszyklusverwaltung
MLOps (Machine Learning Operations) basiert auf DevOps-Prinzipien und -Methoden, die die Effizienz von Workflows erhöhen. Beispiele sind Continuous Integration, Continuous Delivery und Continuous Deployment. MLOps wendet diese Prinzipien auf den Machine Learning-Prozess mit folgendem Ziel an:
- Schnelleres Experimentieren und Entwickeln von Modellen
- Schnellere Bereitstellung von Modellen in der Produktionsumgebung
- Qualitätssicherung
Wenn Sie über das richtige Modell verfügen, können Sie es ganz einfach in einem Onlineendpunkt verwenden. Weitere Informationen finden Sie unter Bereitstellen von Modellen mit Azure Machine Learning.
Anschließend können Sie Ihre bereitgestellten Modelle verwalten, indem Sie das Azure Machine Learning SDK für Python, Azure Machine Learning Studio oder die Azure Machine Learning CLI verwenden.
Diese Modelle können genutzt werden, um Prognosen in Echtzeit oder asynchron für große Datenmengen zurückzugeben.
Und dank fortschrittlicherMachine Learning-Pipelines können Sie bei jedem einzelnen Schritt – von der Datenaufbereitung über Training und Bewertung von Modellen bis hin zur Bereitstellung – zusammenarbeiten. Pipelines ermöglichen Folgendes:
- Automatisieren des End-to-End-Prozesses für maschinelles Lernen in der Cloud
- Wiederverwenden von Komponenten und Wiederholen von Schritten nur bei Bedarf
- Verwenden verschiedener Computeressourcen in jedem Schritt
- Ausführen von Batchbewertungsaufgaben
Falls Sie Skripts zum Automatisieren Ihres Machine Learning-Workflows nutzen möchten, helfen Ihnen die Befehlszeilentools der Azure Machine Learning CLI weiter. Hiermit können häufige Aufgaben erledigt werden, z. B. das Übermitteln einer Trainingsausführung oder das Bereitstellen eines Modells.
Informationen zu den nächsten Schritten mit Azure Machine Learning finden Sie hier.
Automatisiertes maschinelles Lernen
Datenwissenschaftler verbringen übermäßig viel Zeit damit, während des Experimentierens über Modelle zu iterieren. Das Ausprobieren verschiedener Algorithmen und Hyperparameterkombinationen, bis ein akzeptables Modell erstellt ist, ist für Datenwissenschaftler extrem anstrengend, da die Arbeit eintönig und wenig herausfordernd ist. Dieses Vorgehen führt zwar zu einer massiven Steigerung der Effizienz des Modells, kostet aber manchmal zu viel Zeit und Ressourcen und kann daher eine negative Kapitalrendite (ROI) haben.
Hier kommt automatisiertes maschinelles Lernen (AutoML) ins Spiel. Es verwendet die Konzepte aus dem Forschungspapier zur probabilistischen Matrixfaktorisierung. Es implementiert eine automatisierte Pipeline zum Ausprobieren intelligent ausgewählter Algorithmen und Hypermetereinstellungen basierend auf den Heuristiken der dargestellten Daten unter Berücksichtigung des gegebenen Problems oder Szenarios. Das Ergebnis dieser Pipeline ist eine Reihe von Modellen, die für das jeweilige Problem und den jeweiligen Datensatz am besten geeignet sind.
Weitere Informationen zu AutoML finden Sie unter AutoML und MLOps mit Azure Machine Learning.
Verwaltete Lösungen
Azure Machine Learning bietet vollständig verwaltete Ressourcen wie:
- Recheninstanzen: Cloudbasierte VMs sind mit dem SDK und beliebten Data Science-Tools wie Jupyter Notebooks und JupyterLab vorkonfiguriert. Weitere Informationen finden Sie unter Erstellen und Verwalten von Compute-Instanzen.
- Compute-Cluster: Trainieren Sie Modelle im Maßstab mithilfe der dynamischen Skalierung der Cluster virtueller Azure-Computer. Weitere Informationen finden Sie unter Erstellen und Verwalten von Compute-Clustern.
- Serverlose Compute-Cluster: Trainieren Sie Modelle für dynamisch erstellte, dynamisch skalierende Cluster von virtuellen Azure-Computern. Weitere Informationen finden Sie unter Modellschulung auf serverlosem Compute (Vorschau).
- Serverlose Apache Spark: Verwenden Sie dynamisch erstellte Apache Spark-Cluster für interaktive Daten-Wrangling- oder Training machine Learning-Modelle. Weitere Informationen finden Sie unter Serverless Spark compute.
- Verwaltete Online-Endpunkte: Bereitstellen von Modellen als Webdienste, die Clientanwendungen nutzen können. Weitere Informationen finden Sie unter Online-Endpunkte.
- Verwaltetes virtuelles Netzwerk: Bietet Netzwerkisolation für verwaltete Azure Machine Learning-Ressourcen und andere Azure-Dienste, auf denen Azure Machine Learning basiert. Weitere Informationen finden Sie unter Verwaltete Netzwerkisolation auf Arbeitsbereichsebene (Vorschau).
Verantwortungsvolles maschinelles Lernen
Vertrauen muss bei der Entwicklung und Nutzung von KI-Systemen im Mittelpunkt stehen. Vertrauen in die Plattform, den Prozess und die Modelle. Da KI und autonome Systeme immer stärker in unsere Gesellschaft integriert werden, ist es wichtig, proaktiv Maßnahmen zu ergreifen, um den unbeabsichtigten Folgen dieser Technologien vorzugreifen und sie zu beheben.
- Verstehen Sie Ihre Modelle, und bauen Sie auf Fairness: Erläutern Sie das Modellverhalten und entdecken Sie Funktionen, welche die größten Auswirkungen auf Vorhersagen haben. Verwenden Sie integrierte Erklärungen für Glass- und Blackbox-Modelle während des Modelltrainings und der Inferenz. Verwenden Sie interaktive Visualisierungen zum Vergleichen von Modellen, und führen Sie Was-wäre-wenn-Analysen durch, um die Modellgenauigkeit zu verbessern. Testen Sie Ihre Modelle mit hochmodernen Algorithmen auf Fairness. Verringern Sie Unfairness im gesamten Lebenszyklus des maschinellen Lernens, vergleichen Sie die angepassten Modelle, und gehen Sie bewusst Kompromisse zwischen Fairness und Genauigkeit ein.
- Schützen Sie die Privatsphäre und Vertraulichkeit: Erstellen Sie Modelle, die dies mit den neuesten Innovationen im differenziellen Datenschutz gewährleisten, bei dem in Daten genau abgestimmtes statistisches Datenrauschen eingefügt wird, um die Offenlegung vertraulicher Informationen einzuschränken. Erkennen Sie Datenverluste, und begrenzen Sie auf intelligente Weise wiederholte Abfragen, um das Risiko der Offenlegung gering zu halten. Verwenden Sie Verschlüsselung und vertrauliche Maschinelle Lerntechniken, die für maschinelles Lernen entwickelt wurden, um Modelle mit vertraulichen Daten sicher zu erstellen.
- Kontrollieren und steuern Sie jeden Schritt des maschinellen Lernens: Greifen Sie auf integrierte Funktionen zu, um die Herkunft automatisch zu verfolgen und einen Prüfpfad über den gesamten Lebenszyklus des maschinellen Lernens zu erstellen. Verschaffen Sie sich einen vollständigen Überblick über den Prozess des maschinellen Lernens, indem Sie Datensätze, Modelle, Experimente, Code und mehr verfolgen. Verwenden Sie benutzerdefinierte Tags, um Modelldatenblätter zu implementieren, Metadaten für wichtige Modelle zu dokumentieren, die Verantwortlichkeit zu erhöhen und einen verantwortungsbewussten Ablauf zu gewährleisten.
Erfahren Sie mehr über die Implementierung von Responsible ML.
Integration in andere Dienste
Azure Machine Learning arbeitet mit anderen Azure-Plattformdiensten zusammen und lässt sich mit Open-Source-Tools wie Git und MLflow integrieren.
- Computeziele wie Azure Kubernetes Service, Azure Container Instances, Azure Databricks, Azure Data Lake Analytics und Azure HDInsight: Weitere Informationen zu Computezielen finden Sie unter Was sind Computeziele in Azure Machine Learning?.
- Azure Event Grid: Weitere Informationen finden Sie unter Nutzen von Azure Machine Learning-Ereignissen.
- Azure Monitor: Weitere Informationen finden Sie unter Überwachen von Azure Machine Learning.
- Datenspeicher wie Azure Storage-Konten, Azure Data Lake Storage, Azure SQL-Datenbank, Azure Database für PostgreSQL und Azure Open Datasets: Weitere Informationen finden Sie unter Zugreifen auf Daten in Azure Storage-Diensten und Erstellen und Verwalten von Datenbeständen.
- Azure Virtual Network: Weitere Informationen finden Sie unter Schützen von Azure ML-Experiment- und Rückschlussaufträgen in einem virtuellen Netzwerk.
- Azure-Pipelines: Weitere Informationen finden Sie unter Einrichten von MLOps mit Azure DevOps.
- Git-Repositoryprotokolle: Weitere Informationen finden Sie unter Git-Integration.
- MLflow: Weitere Informationen finden Sie unter Nachverfolgen von Modellmetriken und Bereitstellen von ML-Modellen mit MLflow und Azure Machine Learning.
- Kubeflow: Weitere Informationen finden Sie unter Erstellen von End-to-End-Workflowpipelines.
- Sichere Kommunikation: Das Azure Storage-Konto, die Computeziele und andere Ressourcen können innerhalb eines virtuellen Netzwerks gefahrlos zum Trainieren von Modellen sowie für Rückschlüsse verwendet werden. Weitere Informationen finden Sie unter Sichern von Azure ML-Experiment- und Rückschlussaufträgen in einem virtuellen Azure-Netzwerk.
Nächste Schritte
- Lesen Sie Whitepapers und E-Books für maschinelles Lernen in Azure Machine Learning.
- Machen Sie sich mit KI-Architekturen und Architekturen für maschinelles Lernen vertraut.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für