ディープ ラーニングと NLP を使用してコンテンツ タグを提案する

Container Registry
Data Science Virtual Machine
Kubernetes Service
Machine Learning
SQL Server

ソリューションのアイデア

この記事にさらに多くの情報 (想定されるユース ケース、代替サービス、実装に関する考慮事項、価格ガイダンスなど) の掲載をご希望の方は、GitHub のフィードバックでお知らせください。

ソーシャル サイト、フォーラム、その他のテキストの多い Q&A サービスはコンテンツのタグ付けに大きく依存しているため、優れたインデックス作成とユーザー検索が可能になります。 ただし、多くの場合、コンテンツのタグ付けはユーザーの裁量に任されています。 ユーザーは、一般的に検索される用語の一覧や、サイト構造に関する深い知識を持っていないため、コンテンツのラベル付けが間違っていることがよくあります。 誤ってラベル付けされたコンテンツは、後で必要になったときに見つけることが困難であるか、不可能です。

ディープ ラーニングと自然言語処理 (NLP) をサイト固有の検索語句のデータと組み合わせることにより、このソリューションはサイトのコンテンツのタグ付け精度を大幅に向上させます。 このソリューションでは、ユーザーがコンテンツを入力すると、推奨されるコンテンツ タグとしてよく使用される用語が提供されるため、他のユーザーが情報を簡単に見つけられるようになります。

アーキテクチャ

アーキテクチャ図: Azure Machine Learning を使用した Web サイトのコンテンツ タグの提案に関する概要。

このアーキテクチャの SVG をダウンロードします。

Components

  • Microsoft SQL Server:データは Microsoft SQL Server を使用して格納、構造化、およびインデックス化されます。
  • Azure Machine Learning: ハイパーパラメーターのチューニングや、Kubernetes マネージド Azure クラスターへのスケールアウトなどの最終的なモデルのデプロイを含むモデル トレーニング。
  • Azure Data Science Virtual Machine: このソリューションの主要な開発環境は、データ サイエンス専用に構築された Azure クラウド プラットフォーム上のカスタマイズされた VM イメージです。
  • Azure Data Science VM の Jupyter Notebooks: Jupyter Notebooks は、モデルの基本統合開発環境 (IDE) として使用できます。
  • Azure Container Registry: リアルタイムの Web サービスを Docker コンテナーとして格納します。 これらのコンテナーは Azure Container Registry によってアップロードおよび登録されます。
  • Azure Kubernetes Service (AKS):このソリューションのデプロイでは、Kubernetes で管理されているクラスターを実行している Azure Kubernetes Service を使用します。 コンテナーは Azure Container Registry に格納されているイメージからデプロイされます。

次のステップ

次の製品ドキュメントを参照してください。

次の Microsoft Learn モジュールをお試しください。