Compétence cognitive Traduction de texte

La compétence Traduction de texte évalue le texte et, pour chaque enregistrement, retourne le texte traduit dans la langue cible spécifiée. Cette compétence utilise l’API de traduction de texte Translator Text v3.0 disponible dans Azure AI Services.

Cette fonctionnalité est utile si vous vous attendez à ce que vos documents ne soient pas tous dans la même langue, auquel cas vous pouvez normaliser le texte dans une seule langue avant l’indexation de la recherche en le traduisant. Elle est également utile dans les cas d’usage de localisation, où vous pouvez avoir besoin de copies du même texte dans plusieurs langues.

L’API Traduction de texte Translator Text v3.0 est un service Azure AI non régional, ce qui signifie que vos données ne sont pas conservées dans la même région que votre ressource Recherche Azure AI ou Azure AI Services associée.

Remarque

Cette compétence est liée aux services Azure AI et nécessite une ressource facturable pour les transactions qui dépassent 20 documents par indexeur et par jour. L'exécution des compétences intégrées est facturée au prix actuel du paiement à l'utilisation des services Azure AI.

Lorsque vous utilisez cette compétence, tous les documents de la source sont traités et facturés pour la traduction, même si les langues source et cible sont identiques. Ce comportement est utile pour la prise en charge multilingue dans le même document, mais il peut entraîner des traitements inutiles. Pour éviter des frais de facturation superflus de documents qui n’ont pas besoin de traitement, enlevez-les du conteneur de source de données avant d’exécuter la compétence.

@odata.type

Microsoft.Skills.Text.TranslationSkill

Limites de données

La taille maximale d’un enregistrement doit être de 50 000 caractères telle que mesurée par String.Length. Si vous devez subdiviser vos données avant de les envoyer à la compétence de traduction de texte, utilisez la compétence Fractionnement de texte. Si vous utilisez une compétence de fractionnement de texte, définissez la longueur de la page sur 5 000 pour obtenir les meilleures performances.

Paramètres de la compétence

Les paramètres respectent la casse.

Entrées Description
defaultToLanguageCode (Obligatoire) Code de la langue dans laquelle traduire les documents, pour ceux qui ne spécifient pas explicitement la langue cible.
Voir la liste complète des langues prises en charge.
defaultFromLanguageCode (Facultatif) Code de la langue à partir de laquelle traduire les documents, pour ceux qui ne spécifient pas explicitement la langue source. Si defaultFromLanguageCode n’est pas spécifié, la détection automatique de la langue fournie par l’API de traduction de texte Translator Text est utilisée pour déterminer la langue source.
Voir la liste complète des langues prises en charge.
suggestedFrom (Facultatif) Code de la langue à partir de laquelle traduire les documents quand ni fromLanguageCode ni defaultFromLanguageCode ne sont fournis, et que la détection automatique de la langue échoue. Si la langue suggestedFrom n’est pas spécifiée, l’anglais (en) est utilisé comme langue suggestedFrom.
Voir la liste complète des langues prises en charge.

Entrées de la compétence

Nom de l'entrée Description
texte Texte à traduire.
toLanguageCode Chaîne indiquant la langue dans laquelle le texte doit être traduit. Si cette entrée n’est pas spécifiée, defaultToLanguageCode est utilisé pour traduire le texte.
Voir la liste complète des langues prises en charge.
fromLanguageCode Chaîne indiquant la langue actuelle du texte. Si ce paramètre n’est pas spécifié, defaultFromLanguageCode (ou la détection automatique de la langue si defaultFromLanguageCode n’est pas fourni) est utilisé pour traduire le texte.
Voir la liste complète des langues prises en charge.

Sorties de la compétence

Nom de sortie Description
translatedText Chaîne de résultat de la traduction du texte de translatedFromLanguageCode vers translatedToLanguageCode.
translatedToLanguageCode Chaîne indiquant le code de langue dans lequel le texte a été traduit. Utile si vous traduisez dans plusieurs langues et que vous souhaitez pouvoir savoir quel texte est dans quelle langue.
translatedFromLanguageCode Chaîne indiquant le code de langue à partir duquel le texte a été traduit. Utile si vous avez opté pour l’option de détection automatique de la langue, car cette sortie vous donnera le résultat de cette détection.

Exemple de définition

 {
    "@odata.type": "#Microsoft.Skills.Text.TranslationSkill",
    "defaultToLanguageCode": "fr",
    "suggestedFrom": "en",
    "context": "/document",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      }
    ],
    "outputs": [
      {
        "name": "translatedText",
        "targetName": "translatedText"
      },
      {
        "name": "translatedFromLanguageCode",
        "targetName": "translatedFromLanguageCode"
      },
      {
        "name": "translatedToLanguageCode",
        "targetName": "translatedToLanguageCode"
      }
    ]
  }

Exemple d’entrée

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "text": "We hold these truths to be self-evident, that all men are created equal."
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "text": "Estamos muy felices de estar con ustedes."
        }
    }
  ]
}

Exemple de sortie

{
  "values": [
    {
      "recordId": "1",
      "data":
        {
          "translatedText": "Nous tenons ces vérités pour évidentes, que tous les hommes sont créés égaux.",
          "translatedFromLanguageCode": "en",
          "translatedToLanguageCode": "fr"
        }
    },
    {
      "recordId": "2",
      "data":
        {
          "translatedText": "Nous sommes très heureux d'être avec vous.",
          "translatedFromLanguageCode": "es",
          "translatedToLanguageCode": "fr"
        }
    }
  ]
}

Erreurs et avertissements

Si vous fournissez un code de langue non pris en charge pour la langue cible ou source, une erreur est générée et le texte n’est pas traduit. Si votre texte est vide, un avertissement est généré. Si votre texte comprend plus de 50 000 caractères, seuls les 50 000 premiers caractères sont traduits et un avertissement est émis.

Voir aussi