Worum handelt es sich bei der Textanalyse-API?What is the Text Analytics API?

Die Textanalyse-API ist ein cloudbasierter Dienst für Features zur Verarbeitung natürlicher Sprache, z. B. Textmining und -analyse, einschließlich Stimmungsanalysen, Opinion Mining, Schlüsselbegriffserkennung, Spracherkennung und Erkennung benannter Entitäten.The Text Analytics API is a cloud-based service that provides Natural Language Processing (NLP) features for text mining and text analysis, including: sentiment analysis, opinion mining, key phrase extraction, language detection, and named entity recognition.

Die API ist ein Teil von Azure Cognitive Services, einer Sammlung von Algorithmen für maschinelles Lernen und künstliche Intelligenz (KI) in der Cloud, die Sie für Ihre Entwicklungsprojekte verwenden können.The API is a part of Azure Cognitive Services, a collection of machine learning and AI algorithms in the cloud for your development projects. Sie können diese Features mit der REST-API oder der Clientbibliothek verwenden.You can use these features with the REST API, or the client library.

StimmungsanalyseSentiment analysis

Ermitteln Sie anhand der Stimmungsanalyse, was Menschen von Ihrer Marke oder Ihrem Thema halten, indem Sie unformatierten Text auf Hinweise einer positiven oder negativen Stimmung analysieren.Use sentiment analysis and find out what people think of your brand or topic by mining the text for clues about positive or negative sentiment.

Bei diesem Feature werden Stimmungsbezeichnungen (z. B. „negativ“, „neutral“ und „positiv“) basierend auf der höchsten Zuverlässigkeitsbewertung angegeben, die vom Dienst auf Satz- und Dokumentebene gefunden wird.The feature provides sentiment labels (such as "negative", "neutral" and "positive") based on the highest confidence score found by the service at a sentence and document-level. Darüber hinaus werden bei diesem Feature Zuverlässigkeitsbewertungen zwischen 0 und 1 für jedes Dokument und jeden darin enthaltenen Satz zurückgegeben (positive, neutrale und negative Stimmung).This feature also returns confidence scores between 0 and 1 for each document & sentences within it for positive, neutral and negative sentiment. Sie können den Dienst auch lokal ausführen, indem Sie einen Container verwenden.You can also be run the service on premises using a container.

Opinion Mining ist ab Version 3.1 Preview ein Feature der Stimmungsanalyse.Starting in the v3.1 preview, opinion mining is a feature of Sentiment Analysis. Dieses Feature wird in der Verarbeitung natürlicher Sprache (Natural Language Processing, NLP) auch als aspektbasierte Standpunktanalyse bezeichnet und bietet feiner abgestufte Informationen zu den Meinungen in Bezug auf Aspekte (z. B. Attribute von Produkten oder Dienstleistungen) in Texten.Also known as Aspect-based Sentiment Analysis in Natural Language Processing (NLP), this feature provides more granular information about the opinions related to aspects (such as the attributes of products or services) in text.

SchlüsselwortextraktionKey phrase extraction

Verwenden Sie die Schlüsselbegriffserkennung, um schnell die Hauptkonzepte eines Texts zu identifizieren.Use key phrase extraction to quickly identify the main concepts in text. Im Text „Das Essen war köstlich, und es gab hervorragendes Personal“ gibt die Schlüsselbegriffserkennung beispielsweise die Kernpunkte „Essen“ und „hervorragendes Personal“ zurück.For example, in the text "The food was delicious and there were wonderful staff", Key Phrase Extraction will return the main talking points: "food" and "wonderful staff".

SpracherkennungLanguage detection

Die Spracherkennung kann eine Vielzahl von Sprachen, Varianten und Dialekten sowie einige Regional- und Kultursprachen die Sprache von Eingabetexten erkennen und einen einzigen Sprachcode für jedes Dokument melden, das auf Anforderung gesendet wird.Language detection can detect the language an input text is written in and report a single language code for every document submitted on the request in a wide range of languages, variants, dialects, and some regional/cultural languages. Der Sprachcode wird mit einer Zuverlässigkeitsbewertung bereitgestellt.The language code is paired with a confidence score.

Erkennung benannter EntitätenNamed entity recognition

Die Erkennung benannter Entitäten (NER) kann in Ihrem Text Entitäten identifizieren und kategorisieren, die als Personen, Orte, Organisationen und Mengen erkannt werden. Bekannte Entitäten werden ebenfalls erkannt, und es werden Links zu weiteren Informationen im Internet bereitgestellt.Named Entity Recognition (NER) can Identify and categorize entities in your text as people, places, organizations, quantities, Well-known entities are also recognized and linked to more information on the web.

Lokales Bereitstellen unter Verwendung von Docker-ContainernDeploy on premises using Docker containers

Verwenden Sie Container für die Textanalyse, um API-Features lokal bereitzustellen.Use Text Analytics containers to deploy API features on-premises. Mithilfe dieser Docker-Container können Sie den Dienst näher an Ihre Daten heranbringen, um Compliance- oder Sicherheitsanforderungen zu erfüllen oder anderen betrieblichen Anforderungen gerecht zu werden.These docker containers enable you to bring the service closer to your data for compliance, security or other operational reasons. Die Textanalyse bietet folgende Container:Text Analytics offers the following containers:

  • Stimmungsanalysesentiment analysis
  • Schlüsselbegriffserkennung (Vorschauversion)key phrase extraction (preview)
  • Sprachenerkennung (Vorschauversion)language detection (preview)
  • Textanalyse für Gesundheit (Vorschauversion)Text Analytics for health (preview)

Asynchrone VorgängeAsynchronous operations

Der Endpunkt /analyze ermöglicht die asynchrone Verwendung ausgewählter Features der Textanalyse-API. Hierzu zählen beispielsweise die Erkennung benannter Entitäten und die Schlüsselbegriffserkennung.The /analyze endpoint enables you to use select features of the Text Analytics API asynchronously, such as NER and key phrase extraction.

Typischer WorkflowTypical workflow

Der Workflow ist einfach: Sie übermitteln Daten für die Analyse und verarbeiten Ausgaben in Ihrem Code.The workflow is simple: you submit data for analysis and handle outputs in your code. Analysetool werden unverändert (d.h. ohne Konfigurationen oder Anpassungen) verwendet.Analyzers are consumed as-is, with no additional configuration or customization.

  1. Erstellen Sie eine Azure-Ressource für die Textanalyse.Create an Azure resource for Text Analytics. Rufen Sie anschließend den Schlüssel ab, der für Sie zum Authentifizieren Ihrer Anforderungen generiert wurde.Afterwards, get the key generated for you to authenticate your requests.

  2. Formulieren Sie eine Anforderung, die Ihre Daten als unformatierten, unstrukturierten Text im JSON-Format enthält.Formulate a request containing your data as raw unstructured text, in JSON.

  3. Übermitteln Sie die Anforderung an den Endpunkt, der im Rahmen der Registrierung eingerichtet wurde, und fügen Sie die gewünschte Ressource an: Standpunktanalyse, Schlüsselbegriffserkennung, Sprachenerkennung oder Erkennung benannter Entitäten.Post the request to the endpoint established during sign-up, appending the desired resource: sentiment analysis, key phrase extraction, language detection, or named entity recognition.

  4. Streamen oder speichern Sie die Antwort lokal.Stream or store the response locally. Je nach Anforderung ist das Ergebnis entweder eine Standpunktbewertung, eine Sammlung von extrahierten Schlüsselbegriffen oder ein Sprachcode.Depending on the request, results are either a sentiment score, a collection of extracted key phrases, or a language code.

Die Ausgabe wird als einzelnes JSON-Dokument mit Ergebnissen für jedes bereitgestellte Textdokument zurückgegeben und basiert auf der ID.Output is returned as a single JSON document, with results for each text document you posted, based on ID. Sie können die Ergebnisse anschließend analysieren, visualisieren oder in verwertbare Erkenntnisse kategorisieren.You can subsequently analyze, visualize, or categorize the results into actionable insights.

Daten werden nicht in Ihrem Konto gespeichert.Data is not stored in your account. Von der Textanalyse-API durchgeführte Vorgänge sind zustandslos. Dies bedeutet, dass der bereitgestellte Text verarbeitet wird und die Ergebnisse sofort zurückgegeben werden.Operations performed by the Text Analytics API are stateless, which means the text you provide is processed and results are returned immediately.

Textanalyse für mehrere Stufen der ProgrammierungserfahrungText Analytics for multiple programming experience levels

Sie können mit der Verwendung der Textanalyse-API in Ihren Prozessen beginnen, auch wenn Sie über wenig Erfahrung bei der Programmierung verfügen.You can start using the Text Analytics API in your processes, even if you don't have much experience in programming. Anhand dieser Tutorials erfahren Sie, wie Sie die API verwenden können, um Text gemäß Ihrem Erfahrungsstand auf verschiedene Weise zu analysieren.Use these tutorials to learn how you can use the API to analyze text in different ways to fit your experience level.

Unterstützte SprachenSupported languages

Für eine bessere Auffindbarkeit wurde dieser Abschnitt in einen separaten Artikel verschoben.This section has been moved to a separate article for better discoverability. Diesen Inhalt finden Sie unter Supported languages in the Text Analytics API (Unterstützte Sprachen in der Textanalyse-API).Refer to Supported languages in the Text Analytics API for this content.

DatengrenzwerteData limits

Alle Endpunkte der Textanalyse-API akzeptieren unformatierte Textdaten.All of the Text Analytics API endpoints accept raw text data. Weitere Informationen finden Sie im Artikel zu den Datengrenzwerten.See the Data limits article for more information.

Unicode-CodierungUnicode encoding

Die Textanalyse-API verwendet Unicode-Codierung für die Textdarstellung und die Berechnung der Zeichenanzahl.The Text Analytics API uses Unicode encoding for text representation and character count calculations. Anforderungen können in UTF-8 und UTF-16 übermittelt werden, dabei gibt es keine messbaren Unterschiede bei der Zeichenanzahl.Requests can be submitted in both UTF-8 and UTF-16 with no measurable differences in the character count. Unicode-Codepunkte werden als Heuristik für die Zeichenlänge verwendet und werden für die Grenzwerte der Textanalysedaten als äquivalent betrachtet.Unicode codepoints are used as the heuristic for character length and are considered equivalent for the purposes of text analytics data limits. Wenn Sie StringInfo.LengthInTextElements verwenden, um die Zeichenanzahl abzurufen, verwenden Sie die gleiche Methode wie wir, um die Datengröße zu ermitteln.If you use StringInfo.LengthInTextElements to get the character count, you are using the same method we use to measure data size.

Nächste SchritteNext steps