Aptitud cognitiva para la detección de idiomasLanguage detection cognitive skill

La aptitud Detección de idioma detecta el idioma del texto de entrada e informa de un único código de idioma para cada documento enviado en la solicitud.The Language Detection skill detects the language of input text and reports a single language code for every document submitted on the request. El código de idioma se empareja con una puntuación que indica la intensidad del análisis.The language code is paired with a score indicating the strength of the analysis. Esta aptitud utiliza los modelos de aprendizaje automático proporcionados por Text Analytics en Cognitive Services.This skill uses the machine learning models provided by Text Analytics in Cognitive Services.

Esta funcionalidad es especialmente útil cuando necesita proporcionar el idioma del texto como entrada para otras aptitudes (por ejemplo, la aptitud de análisis de opiniones o la aptitud de división de texto).This capability is especially useful when you need to provide the language of the text as input to other skills (for example, the Sentiment Analysis skill or Text Split skill).

La detección de idioma aprovecha las bibliotecas de procesamiento de lenguaje natural de Bing, lo que supera el número de idiomas y regiones admitidos enumerados para Text Analytics.Language detection leverages Bing's natural language processing libraries, which exceeds the number of supported languages and regions listed for Text Analytics. La lista exacta de idiomas no está publicada, pero incluye todos los idiomas ampliamente hablados, además de variantes, dialectos y algunos idiomas regionales y culturales.The exact list of languages is not published, but includes all widely-spoken languages, plus variants, dialects, and some regional and cultural languages. Si tiene contenido que se expresa en un idioma que se usa con menos frecuencia, puede probar Language Detection API para ver si devuelve un código.If you have content expressed in a less frequently used language, you can try the Language Detection API to see if it returns a code. La respuesta para los idiomas que no se pueden detectar es unknown.The response for languages that cannot be detected is unknown.

Nota

A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Cognitive Services.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. Los cargos se acumulan cuando se llama a las API de Cognitive Services y por la extracción de imágenes como parte de la fase de descifrado de documentos de Azure Cognitive Search.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. No hay ningún cargo por la extracción de texto de documentos.There are no charges for text extraction from documents.

La ejecución de aptitudes integradas se cobra según los precios de pago por uso de Cognitive Services existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. Los precios de la extracción de imágenes se describen en la página de precios de Búsqueda cognitiva de Azure.Image extraction pricing is described on the Azure Cognitive Search pricing page.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkillMicrosoft.Skills.Text.LanguageDetectionSkill

Límites de datosData limits

El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length.The maximum size of a record should be 50,000 characters as measured by String.Length. Si tiene que dividir los datos antes de enviarlos a la aptitud de detección de idioma, puede usar la aptitud de división de texto.If you need to break up your data before sending it to the language detection skill, you may use the Text Split skill.

Entradas de la aptitudSkill inputs

Los parámetros distinguen mayúsculas de minúsculas.Parameters are case-sensitive.

EntradasInputs DescripciónDescription
texttext Texto que se va a analizar.The text to be analyzed.

Salidas de la aptitudSkill outputs

Nombre de salidaOutput Name DescripciónDescription
languageCodelanguageCode El código de idioma ISO 6391 para el idioma identificado.The ISO 6391 language code for the language identified. Por ejemplo, "en".For example, "en".
languageNamelanguageName El nombre del idioma.The name of language. Por ejemplo, "inglés".For example "English".
scorescore Un valor entre 0 y 1.A value between 0 and 1. La probabilidad de que el lenguaje esté correctamente identificado.The likelihood that language is correctly identified. La puntuación puede ser inferior a 1 si la oración tiene distintos idiomas.The score may be lower than 1 if the sentence has mixed languages.

Definición de ejemploSample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Entrada de ejemploSample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      }
    ]

Salida de ejemploSample output

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      }
    ]
}

Casos de errorError cases

Si el texto está escrito en un idioma no compatible, se genera un error y no se devuelve ningún identificador de idioma.If text is expressed in an unsupported language, an error is generated and no language identifier is returned.

Consulte tambiénSee also