Der kognitive Skill „Spracherkennung“Language detection cognitive skill

Der Skill Spracherkennung erkennt die Sprache von Eingabetexten und meldet einen einzigen Sprachcode für jedes Dokument, das auf Anforderung gesendet wird.The Language Detection skill detects the language of input text and reports a single language code for every document submitted on the request. Der Sprachcode ist mit einem Wert kombiniert, der die Stärke der Analyse angibt.The language code is paired with a score indicating the strength of the analysis. Bei dieser Qualifikation werden die Machine Learning-Modelle verwendet, die in Cognitive Services über die Textanalyse bereitgestellt werden.This skill uses the machine learning models provided by Text Analytics in Cognitive Services.

Diese Funktion ist besonders nützlich, wenn Sie die Sprache des Texts als Eingabe für andere Skills (z.B. den Skill „Standpunktanalyse“ oder den Skill „Text teilen“) benötigen.This capability is especially useful when you need to provide the language of the text as input to other skills (for example, the Sentiment Analysis skill or Text Split skill).

„Spracherkennung“ nutzt die Bibliotheken von Bing zur Verarbeitung natürlicher Sprache, wodurch die Anzahl von unterstützten Sprachen und Regionen überschritten wird, die für „Textanalyse“ aufgeführt sind.Language detection leverages Bing's natural language processing libraries, which exceeds the number of supported languages and regions listed for Text Analytics. Die genaue Sprachenliste wird nicht veröffentlicht. Sie enthält aber alle verbreiteten Sprachen, plus Varianten, Dialekte sowie einige Regional- und Kultursprachen.The exact list of languages is not published, but includes all widely-spoken languages, plus variants, dialects, and some regional and cultural languages. Bei Inhalten in einer seltener verwendeten Sprache können Sie die Sprachenerkennungs-API ausprobieren, um zu sehen, ob sie einen Code zurückgibt.If you have content expressed in a less frequently used language, you can try the Language Detection API to see if it returns a code. Die Antwort bei Sprachen, die nicht erkannt werden können, lautet unknown.The response for languages that cannot be detected is unknown.

Hinweis

Wenn Sie den Umfang erweitern, indem Sie die Verarbeitungsfrequenz erhöhen oder weitere Dokumente oder KI-Algorithmen hinzufügen, müssen Sie eine kostenpflichtige Cognitive Services-Ressource anfügen.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Gebühren fallen beim Aufrufen von APIs in Cognitive Services sowie für die Bildextraktion im Rahmen der Dokumentaufschlüsselungsphase in Azure Search an.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Search. Für die Textextraktion aus Dokumenten fallen keine Gebühren an.There are no charges for text extraction from documents.

Die Ausführung integrierter Qualifikationen wird nach dem bestehenden nutzungsbasierten Preis für Cognitive Services berechnet.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Die Preise für die Bildextraktion werden auf der Preisseite von Azure Search beschrieben.Image extraction pricing is described on the Azure Search pricing page.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkillMicrosoft.Skills.Text.LanguageDetectionSkill

DatengrenzwerteData limits

Die maximale Größe eines Datensatzes ist 50.000 Zeichen, gemessen durch String.Length.The maximum size of a record should be 50,000 characters as measured by String.Length. Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an das Stimmungsanalysetool senden, verwenden Sie den Skill „Text teilen“.If you need to break up your data before sending it to the sentiment analyzer, you may use the Text Split skill.

SkilleingabenSkill inputs

Bei den Parametern wird zwischen Groß- und Kleinschreibung unterschieden.Parameters are case-sensitive.

EingabenInputs BESCHREIBUNGDescription
texttext Der zu analysierende TextThe text to be analyzed.

SkillausgabenSkill outputs

AusgabenameOutput Name BESCHREIBUNGDescription
languageCodelanguageCode Der für die Sprache identifizierte ISO-6391-Sprachcode.The ISO 6391 language code for the language identified. Beispiel: „en“.For example, "en".
languageNamelanguageName Der Name der Sprache.The name of language. Beispiel: „Englisch“.For example "English".
Ergebnis Ihrer Appscore Ein Wert zwischen 0 und 1 ein.A value between 0 and 1. Die Wahrscheinlichkeit, dass die Sprache korrekt identifiziert ist.The likelihood that language is correctly identified. Der Wert kann kleiner als 1 sein, wenn im Satz verschiedene Sprachen kombiniert sind.The score may be lower than 1 if the sentence has mixed languages.

BeispieldefinitionSample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

BeispieleingabeSample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      }
    ]

BeispielausgabeSample output

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      }
    ]
}

Auftretende FehlerError cases

Wenn der Text in einer nicht unterstützten Sprache ausgedrückt wird, tritt ein Fehler auf, und es wird keine Sprachen-ID zurückgegeben.If text is expressed in an unsupported language, an error is generated and no language identifier is returned.

Weitere InformationenSee also