Text Analytics API とはWhat is the Text Analytics API?

Text Analytics API は、テキスト マイニングとテキスト分析のための自然言語処理 (NLP) 機能を提供するクラウドベースのサービスであり、感情分析、オピニオン マイニング、キー フレーズ抽出、言語検出、名前付きエンティティの認識などを備えています。The Text Analytics API is a cloud-based service that provides Natural Language Processing (NLP) features for text mining and text analysis, including: sentiment analysis, opinion mining, key phrase extraction, language detection, and named entity recognition.

この API は、機械学習と AI のアルゴリズムを開発プロジェクトで利用できるようクラウドに集めた Azure Cognitive Services に含まれます。The API is a part of Azure Cognitive Services, a collection of machine learning and AI algorithms in the cloud for your development projects. これらの機能は REST API またはクライアント ライブラリで使用できます。You can use these features with the REST API, or the client library.

センチメント分析Sentiment analysis

感情分析を使用して、テキストのマイニングにより肯定的または否定的な感情の手がかりを探すことで、ブランドまたはトピックに対して人々がどのように考えているかを突き止めます。Use sentiment analysis and find out what people think of your brand or topic by mining the text for clues about positive or negative sentiment.

この機能は、文章とドキュメントレベルでサービスによって検出された最も高い信頼度スコアに基づいて、センチメント ラベル ("negative"、"neutral"、"positive" など) を提供します。The feature provides sentiment labels (such as "negative", "neutral" and "positive") based on the highest confidence score found by the service at a sentence and document-level. また、この機能は、positive、neutral、negative (肯定的、中立的、否定的) のセンチメントに関し、各ドキュメントとその中の文章に対して 0 と 1 の間の信頼度スコアを返します。This feature also returns confidence scores between 0 and 1 for each document & sentences within it for positive, neutral and negative sentiment. また、コンテナーを使用してオンプレミスでサービスを実行することもできます。You can also be run the service on premises using a container.

バージョン 3.1 プレビュー以降では、オピニオン マイニングは感情分析の 1 つの機能となっています。Starting in the v3.1 preview, opinion mining is a feature of Sentiment Analysis. この機能は、自然言語処理 (NLP) ではアスペクトベースの感情分析とも呼ばれます。テキストに含まれるアスペクト (製品やサービスの属性など) に関連した意見について、より粒度の細かい情報が得られます。Also known as Aspect-based Sentiment Analysis in Natural Language Processing (NLP), this feature provides more granular information about the opinions related to aspects (such as the attributes of products or services) in text.

キー フレーズの抽出Key phrase extraction

キー フレーズ抽出を使用して、テキスト内の主要な概念をすばやく特定します。Use key phrase extraction to quickly identify the main concepts in text. たとえば、「食べ物はおいしくて、すばらしいスタッフがいた」というテキストでは、キー フレーズ抽出は話題の中心として "食べ物" と "すばらしいスタッフ" を返します。For example, in the text "The food was delicious and there were wonderful staff", Key Phrase Extraction will return the main talking points: "food" and "wonderful staff".

言語検出Language detection

言語検出を使用すると、さまざまな言語、異形、方言、一部の地方言語や文化言語で、入力テキストの記述言語を検出するほか、要求で送信されたドキュメントごとに 1 つの言語コードを報告することができます。Language detection can detect the language an input text is written in and report a single language code for every document submitted on the request in a wide range of languages, variants, dialects, and some regional/cultural languages. 言語コードは信頼度スコアとペアになっています。The language code is paired with a confidence score.

名前付きエンティティの認識Named entity recognition

名前付きエンティティの認識 (NER) は、テキスト内のエンティティを、人、場所、組織、数量として識別して分類できます。既知のエンティティも認識され、Web 上の詳細情報にリンクされます。Named Entity Recognition (NER) can Identify and categorize entities in your text as people, places, organizations, quantities, Well-known entities are also recognized and linked to more information on the web.

Docker コンテナーを使用してオンプレミスにデプロイするDeploy on premises using Docker containers

Text Analytics コンテナーを使用して、API 機能をオンプレミスにデプロイします。Use Text Analytics containers to deploy API features on-premises. これらの Docker コンテナーを使用すると、コンプライアンス、セキュリティ、またはその他の運用上の理由により、データにより近いところでサービスを使用できます。These docker containers enable you to bring the service closer to your data for compliance, security or other operational reasons. Text Analytics には、次のコンテナーが用意されています。Text Analytics offers the following containers:

  • 感情分析sentiment analysis
  • キー フレーズ抽出 (プレビュー)key phrase extraction (preview)
  • 言語検出 (プレビュー)language detection (preview)
  • Text Analytics for Health (プレビュー)Text Analytics for health (preview)

非同期操作Asynchronous operations

/analyze エンドポイントを使用すると、NER やキー フレーズ抽出などの Text Analytics API の選択した機能を非同期に使用できます。The /analyze endpoint enables you to use select features of the Text Analytics API asynchronously, such as NER and key phrase extraction.

一般的なワークフローTypical workflow

ワークフローは単純です。ユーザーが分析のためにデータを送信し、コードで出力を処理します。The workflow is simple: you submit data for analysis and handle outputs in your code. アナライザーはそのままの状態で利用されます。構成やカスタマイズの追加はありません。Analyzers are consumed as-is, with no additional configuration or customization.

  1. Text Analytics 用の Azure リソースを作成します。Create an Azure resource for Text Analytics. その後、対象の要求を認証するために生成されたキーを取得します。Afterwards, get the key generated for you to authenticate your requests.

  2. 未加工の非構造化テキストとしてデータを含む要求を JSON で表しますFormulate a request containing your data as raw unstructured text, in JSON.

  3. 任意のリソース (感情分析、キー フレーズ抽出、言語検出、名前付きエンティティの認識) を付加し、新規登録時に確立されたエンドポイントに要求を投稿します。Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or named entity recognition.

  4. 応答をローカルでストリームまたは保存します。Stream or store the response locally. 要求に基づき、結果は感情スコア、抽出されたキー フレーズのコレクション、または言語コードになります。Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

ID をベースに出力は 1 つの JSON ドキュメントとして返されます。投稿したテキスト ドキュメントごとに結果が返されます。Output is returned as a single JSON document, with results for each text document you posted, based on ID. その後、結果を分析、視覚化、または分類し、実用的な情報を得ることができます。You can subsequently analyze, visualize, or categorize the results into actionable insights.

データはユーザーのアカウントに保存されません。Data is not stored in your account. Text Analytics API で実行された操作はステートレスです。つまり、入力したテキストが処理され、結果がすぐに返されます。Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

多様なプログラミング経験レベル向けの Text AnalyticsText Analytics for multiple programming experience levels

プログラミングの経験があまりなくても、Text Analytics API を自分のプロセスで使い始めることができます。You can start using the Text Analytics API in your processes, even if you don't have much experience in programming. これらのチュートリアルを使用して、経験レベルに合わせてさまざまな方法でテキストを分析するための API の使用方法を学習してください。Use these tutorials to learn how you can use the API to analyze text in different ways to fit your experience level.

サポートされている言語Supported languages

このセクションは見つけやすいように別の記事に移されました。This section has been moved to a separate article for better discoverability. このコンテンツについては、Text Analytics API でサポートされている言語に関するページを参照してください。Refer to Supported languages in the Text Analytics API for this content.

データ制限Data limits

Text Analytics API のエンドポイントはすべて、未加工のテキスト データを受け取ります。All of the Text Analytics API endpoints accept raw text data. 詳細については、データの制限に関する記事を参照してください。See the Data limits article for more information.

Unicode エンコーディングUnicode encoding

Text Analytics API では、テキストの表現と文字数の計算に Unicode エンコーディングが使用されます。The Text Analytics API uses Unicode encoding for text representation and character count calculations. 要求は UTF-8 と UTF-16 の両方で提出できます。文字数に測定可能な違いはありません。Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Unicode コードポイントは文字の長さのヒューリスティックとして使用され、テキスト分析データを制限するという目的では同等と見なされます。Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. StringInfo.LengthInTextElements を利用して文字数を取得する場合、データ サイズの測定に使用しているものと同じ方法を使用することになります。If you use StringInfo.LengthInTextElements to get the character count, you are using the same method we use to measure data size.

次のステップNext steps