Предлагать теги содержимого с глубоким обучением и NLP

Реестр контейнеров
Виртуальные машины для обработки и анализа данных
Служба Kubernetes
Машинное обучение
SQL Server

Концепция решения

если вы хотите узнать больше о том, как получить дополнительные сведения о возможных вариантах использования, альтернативных службах, рекомендациях по реализации или ценах, сообщите нам о GitHub.

Социальные веб-сайты, форумы и другие трудные вопросы в Q&службы сильно полагаются на теги, что обеспечивает хорошее индексирование и поиск пользователей. Однако часто при добавлении тегов к содержимому остаются пользователи. Поскольку у пользователей нет списков часто встречающихся терминов или глубокого понимания структуры узла, они часто неплохо помечают содержимое. Неотмеченное содержимое сложно или невозможно найти, если оно понадобится позже.

Благодаря сочетанию глубокого обучения и обработки естественного языка (NLP) с данными об условиях поиска, связанных с конкретными сайтами, это решение помогает значительно улучшить точность тегов содержимого на сайте. При вводе пользователями содержимого это решение предлагает наиболее часто используемые термины в качестве предлагаемых тегов содержимого, что упрощает поиск информации другими пользователями.

Architecture

схема архитектуры. общие сведения об использовании Машинное обучение Azure для предложения тегов содержимого для веб-сайтов.

Скачайте SVG этой архитектуры.

Компоненты

  • Microsoft SQL Server: данные хранятся, структурированы и индексируются с помощью Microsoft SQL Server.
  • Машинное обучение Azure: обучение модели, включая настройку параметров и развертывание окончательной модели, включая масштабирование до управляемого Kubernetes кластера Azure.
  • Виртуальная машина для обработки и анализа данных Azure. основная среда разработки для этого решения — это настраиваемый образ виртуальной машины на облачной платформе Azure, созданный специально для обработки и анализа данных.
  • Записные книжки Jupyter на виртуальной машине для обработки и анализа данных Azure. записные книжки Jupyter можно использовать в качестве базовой интегрированной среды разработки (IDE) для модели.
  • Реестр контейнеров Azure: хранит веб-службы в режиме реального времени в виде контейнеров DOCKER. Эти контейнеры передаются и регистрируются с помощью реестра контейнеров Azure.
  • Служба Kubernetes Azure (AKS). для развертывания этого решения используется служба Kubernetes Azure, выполняющая Kubernetes управляемый кластер. Контейнеры развертываются из образов, хранящихся в реестре контейнеров Azure.

Дальнейшие действия

См. документацию по продукту:

Попробуйте следующие модули Microsoft Learn: