Sugerencia de etiquetas de contenido con aprendizaje profundo y NLP

Container Registry
Data Science Virtual Machine
Kubernetes Service
Machine Learning
SQL Server

Idea de solución

Si le gustaría que expandamos este artículo con más información, como posibles casos de uso, servicios alternativos, consideraciones de implementación o una guía de precios, comuníquese a través de los Comentarios de GitHub.

Los sitios web sociales, los foros y otros servicios de preguntas y respuestas con mucha actividad dependen en gran medida del etiquetado del contenido, que facilita una correcta indexación y búsqueda por parte de los usuarios. Sin embargo, el etiquetado del contenido a menudo se deja a elección de los usuarios. Como no tienen listas de términos buscados con frecuencia o un conocimiento profundo de la estructura de un sitio web, suelen etiquetar mal el contenido. El contenido etiquetado de forma errónea es difícil o imposible de encontrar cuando se necesita más adelante.

Al combinar el aprendizaje profundo y el procesamiento de lenguaje natural (NLP) con datos sobre términos de búsqueda específicos del sitio web, esta solución puede mejorar considerablemente la precisión del etiquetado del contenido en un sitio web. A medida que los usuarios escriban contenido, esta solución ofrece términos muy utilizados como etiquetas de contenido sugeridas, lo que facilita a otros usuarios encontrar la información.

Architecture

Diagrama de arquitectura: información general sobre el uso de Azure Machine Learning a fin de ayudar a sugerir etiquetas de contenido para sitios web.

Descargue un SVG de esta arquitectura.

Componentes

  • Microsoft SQL Server: los datos se almacenan, estructuran e indexan por medio de Microsoft SQL Server.
  • Azure Machine Learning: entrenamiento del modelo, incluido el ajuste de hiperparámetros y la implementación del modelo final, así como el escalado horizontal a un clúster de Azure administrado por Kubernetes.
  • Azure Data Science Virtual Machine: el entorno de desarrollo principal de esta solución es una imagen de máquina virtual personalizada en la plataforma en la nube de Azure creada específicamente para realizar ciencia de datos.
  • Cuadernos de Jupyter Notebook en Azure Data Science VM: los cuadernos de Jupyter Notebook se pueden utilizar como entorno de desarrollo integrado (IDE) de base para el modelo.
  • Azure Container Registry: almacena servicios web en tiempo real como contenedores de Docker. Estos contenedores se cargan y registran mediante Azure Container Registry.
  • Azure Kubernetes Service (AKS): la implementación de esta solución usa Azure Kubernetes Service para la ejecución de un clúster administrado por Kubernetes. Los contenedores se implementan a partir de imágenes almacenadas en Azure Container Registry.

Pasos siguientes

Consulte la documentación del producto:

Pruebe estos módulos de Microsoft Learn: