Habilidade cognitiva de detecção de idiomaLanguage detection cognitive skill

A detecção de idioma habilidade detecta o idioma do texto de entrada e relata um único código de idioma para cada documento enviado na solicitação.The Language Detection skill detects the language of input text and reports a single language code for every document submitted on the request. O código de idioma é emparelhado com uma pontuação que indica a intensidade da análise.The language code is paired with a score indicating the strength of the analysis. Essa habilidade usa os modelos de machine learning fornecidos pela Análise de Texto nos Serviços Cognitivos.This skill uses the machine learning models provided by Text Analytics in Cognitive Services.

Esse recurso é especialmente útil quando você precisa fornecer o idioma do texto como entrada para outras habilidades (por exemplo, a habilidade de Análise de Sentimento ou Habilidade de Divisão de Texto).This capability is especially useful when you need to provide the language of the text as input to other skills (for example, the Sentiment Analysis skill or Text Split skill).

A detecção de idioma aproveita as bibliotecas de processamento de idioma natural do Bing, que excedem o número de idiomas e regiões com suporte listados para análise de texto.Language detection leverages Bing's natural language processing libraries, which exceeds the number of supported languages and regions listed for Text Analytics. A lista exata de idiomas não é publicada, mas inclui todas as linguagens amplamente faladas, além de variantes, dialetos e algumas linguagens regionais e culturais.The exact list of languages is not published, but includes all widely-spoken languages, plus variants, dialects, and some regional and cultural languages. Se você tiver conteúdo expresso em uma linguagem usada com menos frequência, poderá tentar a API detecção de idioma para ver se ela retorna um código.If you have content expressed in a less frequently used language, you can try the Language Detection API to see if it returns a code. A resposta para idiomas que não pode ser detectada é unknown.The response for languages that cannot be detected is unknown.

Observação

À medida que expandir o escopo aumentando a frequência de processamento, adicionando mais documentos ou adicionando mais algoritmos de IA, você precisará anexar um recurso de Serviços Cognitivos faturável.As you expand scope by increasing the frequency of processing, adding more documents, or adding more AI algorithms, you will need to attach a billable Cognitive Services resource. As cobranças são geradas ao chamar APIs nos Serviços Cognitivos e para a extração de imagem, como parte do estágio de quebra de documento na Pesquisa Cognitiva do Azure.Charges accrue when calling APIs in Cognitive Services, and for image extraction as part of the document-cracking stage in Azure Cognitive Search. Não há encargos para extração de texto em documentos.There are no charges for text extraction from documents.

A execução de habilidades integradas é cobrada nos preços pagos conforme o uso dos Serviços Cognitivos existentes.Execution of built-in skills is charged at the existing Cognitive Services pay-as-you go price. O preço da extração de imagem é descrito na página de preços da Pesquisa Cognitiva do Azure.Image extraction pricing is described on the Azure Cognitive Search pricing page.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkillMicrosoft.Skills.Text.LanguageDetectionSkill

Limites de dadosData limits

O tamanho máximo de um registro deve ser de 50.000 caracteres conforme medido por String.Length.The maximum size of a record should be 50,000 characters as measured by String.Length. Se você precisar dividir seus dados antes de enviá-los para a habilidade de detecção de idioma, poderá usar a habilidade de divisão de texto.If you need to break up your data before sending it to the language detection skill, you may use the Text Split skill.

Entradas de habilidadesSkill inputs

Os parâmetros diferenciam maiúsculas de minúsculas.Parameters are case-sensitive.

EntradasInputs DescriçãoDescription
text O texto a ser analisado.The text to be analyzed.

Saídas de habilidadesSkill outputs

Nome de saídaOutput Name DescriçãoDescription
languageCode O código de idioma ISO 6391 para o idioma identificado.The ISO 6391 language code for the language identified. Por exemplo, “in”For example, "en".
languageName O nome do idioma.The name of language. Por exemplo “inglês”.For example "English".
score Um valor entre 0 e 1.A value between 0 and 1. A probabilidade de que o idioma é identificado corretamente.The likelihood that language is correctly identified. A pontuação pode ser menor que 1, se a frase misturou idiomas.The score may be lower than 1 if the sentence has mixed languages.

Definição de exemploSample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Entrada de exemploSample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      }
    ]

Saída de exemploSample output

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      }
    ]
}

Casos de erroError cases

Se o texto é expresso em um idioma sem suporte, um erro será gerado e nenhum identificador de idioma será retornado.If text is expressed in an unsupported language, an error is generated and no language identifier is returned.

Confira tambémSee also