Vorschlagen von Inhaltstags mit Deep Learning und NLP

Container Registry
Data Science Virtual Machines
Kubernetes-Dienst
Machine Learning
SQL Server

Lösungsidee

Wenn Sie möchten, dass wir diesen Artikel um weitere Informationen ergänzen, z. B. potenzielle Anwendungsfälle, alternative Dienste, Überlegungen zur Implementierung oder Preisempfehlungen, lassen Sie es uns über Feedback auf GitHub wissen!

Websites in sozialen Netzwerken, Foren und andere textlastige Frage- und Antwortdienste sind in hohem Maß auf Inhaltstagging angewiesen, das eine gute Indizierung und Benutzersuche ermöglicht. Häufig wird das Inhaltstagging aber den Benutzern überlassen. Da Benutzer allerdings nicht über Listen mit häufig gesuchten Begriffen oder über ein fundiertes Verständnis der Websitestruktur verfügen, wird Inhalt häufig falsch beschriftet. Falsch beschriftete Inhalte sind schwer oder unmöglich zu finden, wenn sie später benötigt werden.

Durch die Kombination von Deep Learning und Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) mit Daten zu websitespezifischen Suchbegriffen trägt diese Lösung zu einer deutlich verbesserten Genauigkeit beim Inhaltstagging für eine Website bei. Wenn Benutzer Inhalte eingeben, werden häufig verwendete Begriffe als Inhaltstags vorgeschlagen, was anderen die Suche nach den Informationen erleichtert.

Aufbau

Architekturdiagramm: Übersicht über die Verwendung von Azure Machine Learning zum Vorschlagen von Inhaltstags für Websites

Laden Sie eine SVG-Datei dieser Architektur herunter.

Komponenten

  • Microsoft SQL Server: Daten werden mithilfe von Microsoft SQL Server gespeichert, strukturiert und indiziert.
  • Azure Machine Learning: Modelltraining (einschließlich Hyperparameteroptimierung) und Bereitstellung des endgültigen Modells (einschließlich Aufskalieren auf einen von Kubernetes verwalteten Azure-Cluster)
  • Azure Data Science Virtual Machine: Die Kernentwicklungsumgebung für diese Lösung ist ein benutzerdefiniertes VM-Image auf der Azure-Cloudplattform, das speziell für Data Science entwickelt wurde.
  • Jupyter Notebook-Instanzen in Azure Data Science VM: Jupyter Notebook-Instanzen können als grundlegende integrierte Entwicklungsumgebung (Integrated Development Environment, IDE) für das Modell verwendet werden.
  • Azure Container Registry: Speichert Echtzeitwebdienste als Docker-Container. Diese Container werden über Azure Container Registry hochgeladen und registriert.
  • Azure Kubernetes Service (AKS): Die Bereitstellung dieser Lösung erfolgt über Azure Kubernetes Service, in dem ein von Kubernetes verwalteter Cluster ausgeführt wird. Die Container werden aus Images bereitgestellt, die in Azure Container Registry gespeichert sind.

Nächste Schritte

Weitere Informationen finden Sie in der Produktdokumentation:

Probieren Sie die folgenden Microsoft Learn-Module aus: