您现在访问的是微软AZURE全球版技术文档网站,若需要访问由世纪互联运营的MICROSOFT AZURE中国区技术文档网站,请访问 https://docs.azure.cn.

使用深度学习和 NLP 建议内容标记

容器注册表
Data Science Virtual Machine
Kubernetes 服务
机器学习
SQL Server

解决方案理念

如果想了解详细信息(例如潜在用例、替代服务、实施注意事项或定价指南)来扩展本文,请通过反馈GitHub告知我们!

社交站点、论坛和其他大量文本的 Q A 服务严重依赖于内容标记, & 这可实现良好的索引编制和用户搜索。 但是,内容标记通常由用户自行决定。 由于用户没有常用搜索词的列表或对站点结构的深入理解,因此他们经常错误地标记内容。 以后需要时,很难或不可能找到标记错误的内容。

可能的用例

通过将深度学习和自然语言处理 (NLP) 与特定于站点的搜索词的数据相结合,此解决方案有助于极大地提高站点上的内容标记准确性。 当用户键入内容时,此解决方案会提供高度使用的术语作为建议的内容标记,使其他人更容易找到信息。

体系结构

体系结构关系图:使用 Azure 机器学习帮助建议网站的内容标记的概述。

下载此体系结构的 SVG。

工作流

  • 使用数据存储、结构化和索引Microsoft SQL Server。
  • 模型训练,包括超参数优化和最终模型的部署,包括横向扩展到 Kubernetes 托管的 Azure 群集。
  • 此解决方案的核心开发环境是专为执行数据科学而构建的 Azure 云平台上的自定义 VM 映像。
  • Jupyter Notebook 可以用作模型 IDE (IDE) 的基础集成开发环境。
  • 将实时 Web 服务存储为 Docker 容器。 这些容器通过 Azure 容器注册表 进行上传和Azure 容器注册表。
  • 此解决方案的部署使用Azure Kubernetes 服务 Kubernetes 托管群集的群集。 容器从存储在 Azure 容器注册表 中的映像进行部署。

组件

后续步骤

请参阅产品文档:

请尝试以下Microsoft Learn模块: