Qu’est un dictionnaire ?

Un dictionnaire est une paire alignée de documents qui spécifie une liste d’expressions ou de phrases avec les traductions correspondantes. Utilisez un dictionnaire dans le cadre de votre formation si vous souhaitez que Translator traduise toutes les occurrences d’une expression ou phrase source d’après la traduction que vous indiquez dans le dictionnaire. Les dictionnaires sont parfois appelés glossaires ou bases terminologiques. On peut considérer le dictionnaire comme un « copier-remplacer » par force brute pour tous les termes listés. En outre, le service Microsoft Custom Translator crée et utilise ses propres dictionnaires à usage général pour améliorer la qualité de sa traduction. Toutefois, un dictionnaire fourni par le client est prioritaire. Il fait en premier l’objet de recherches pour des mots ou des phrases.

Les dictionnaires ne fonctionnent que pour les projets des paires de langues qui s’appuient sur un modèle de réseau neuronal global Microsoft entièrement pris en charge. Affichez la liste complète des langues.

Dictionnaire d’expressions

Un dictionnaire d’expressions respecte la casse. Il s’agit d’une opération de recherche et de remplacement exacte. Quand vous incluez un dictionnaire d’expressions dans l’entraînement de votre modèle, tous les mots ou expressions listés sont traduits de la manière spécifiée. La traduction du reste de la phrase reste inchangée. Vous pouvez utiliser un dictionnaire d’expressions pour spécifier des expressions à ne pas traduire. Pour ce faire, indiquez la même expression non traduite dans les fichiers source et cible.

Dictionnaire dynamique

La fonctionnalité de dictionnaire dynamique vous permet de personnaliser des traductions pour des termes ou des expressions spécifiques. Vous définissez des traductions personnalisées pour votre contenu unique, votre langue ou vos besoins spécifiques.

Dictionnaire d’expressions neuronal

Le dictionnaire d’expressions neuronal étend les fonctionnalités de notre dictionnaire dynamique et de notre dictionnaire d’expressions standard. Les dictionnaires dynamique et d’expressions vous permettent de personnaliser le résultat d’une traduction en fournissant vos propres traductions pour des expressions et des termes spécifiques. La fonctionnalité de dictionnaire dynamique est utilisée avec l’API Translator, tandis que le dictionnaire d’expressions neuronal est activé à l’aide de Custom Translator. Le dictionnaire d’expressions neuronal améliore la qualité de traduction de phrases incluant une ou plusieurs traductions de terme en laissant le modèle de traduction automatique ajuster le terme et le contexte. Cet ajustement produit des traductions plus fluides. En même temps, il préserve la précision élevée de la traduction de terme.

Dictionnaire de phrases

Un dictionnaire de phrases ne respecte pas la casse. Le dictionnaire de phrases permet de spécifier la traduction cible exacte d’une phrase source. La totalité (et pas seulement une partie) de la phrase soumise doit être identique à l’entrée de dictionnaire source Une entrée de dictionnaire source qui se termine par un signe de ponctuation est ignorée pendant la mise en correspondance. Si seulement une partie de la phrase correspond, l’entrée n’est pas mise en correspondance. Lorsqu’une correspondance est détectée, l’entrée cible du dictionnaire de phrases est retournée.

Apprentissage sur dictionnaire uniquement

Il est possible d’entraîner un modèle en n’utilisant que des données de dictionnaire. Pour ce faire, sélectionnez uniquement le document de dictionnaire (ou plusieurs documents de dictionnaire) à inclure, puis sélectionnez Créer un modèle. Dans la mesure où cet entraînement repose uniquement sur un dictionnaire, aucun nombre minimal de phrases d’entraînement n’est nécessaire. En général, votre modèle accomplit cette formation en moins de temps qu’une formation standard. Les modèles obtenus utilisent les modèles de référence de Microsoft pour la traduction ainsi que les dictionnaires que vous ajoutez. Vous ne recevez pas de rapport de test.

Remarque

Dans la mesure où Custom Translator n’aligne pas les fichiers de dictionnaire, il est important que les documents de dictionnaire comportent un nombre égal d’expressions/de phrases sources et cibles, et que celles-ci soient alignées avec précision.

Recommandations

  • Les dictionnaires ne sont pas un substitut à l’entraînement d’un modèle avec des données d’entraînement. Pour de meilleurs résultats, nous vous recommandons de laisser le système apprendre à partir de vos données d’entraînement. Toutefois, quand des phrases ou des noms composés doivent être traduits textuellement, utilisez un dictionnaire d’expressions.

  • Le dictionnaire d’expressions doit être utilisé avec parcimonie. Quand une expression est remplacée au sein d’une phrase, le contexte de cette phrase est perdu ou limité pour traduire le reste de la phrase. D’un côté, l’expression ou le mot dans la phrase est traduit en fonction du dictionnaire fourni mais, de l’autre, la qualité de traduction globale de la phrase s’en trouve souvent diminuée.

  • Le dictionnaire d’expressions fonctionne bien pour les noms composés comme les noms de produits (« Microsoft SQL Server »), les noms propres (« ville de Hambourg ») et les fonctionnalités de produit (« tableau croisé dynamique »). Cela ne fonctionne pas aussi bien pour les verbes ou les adjectifs, car ces mots sont généralement hautement contextuels dans la langue source ou cible. La bonne pratique consiste à éviter les entrées de dictionnaire d’expressions pour tout ce qui n’est pas un nom composé.

  • Si vous utilisez un dictionnaire d’expressions, la casse et la ponctuation sont importantes. Les entrées de dictionnaire respectent la casse et la ponctuation. Custom Translator n’établit une correspondance qu’avec des mots et des expressions dans la phrase d’entrée qui utilisent exactement les mêmes casse et signes de ponctuation que ceux spécifiés dans le fichier de dictionnaire source. En outre, les traductions reflètent la casse et la ponctuation fournies dans le fichier de dictionnaire cible.

    Exemple

    • Vous effectuez l’apprentissage d’un système anglais-espagnol qui utilise un dictionnaire d’expressions et vous spécifiez SQL server dans le fichier source et Microsoft SQL Server dans le fichier cible. Quand vous demandez la traduction d’une phrase qui contient l’expression SQL server, Custom Translator établit une correspondance entre l’entrée de dictionnaire et la traduction qui contient Microsoft SQL Server.
    • Quand vous demandez la traduction d’une phrase qui inclut la même expression, mais qui ne correspond pas à ce qui se trouve dans votre fichier source, par exemple sql server, sql Server ou SQL Server, il ne retourne pas de correspondance de votre dictionnaire.
    • La traduction suit les règles de la langue cible, comme spécifié dans votre dictionnaire d’expressions.
  • Pour plus d’informations sur le dictionnaire d’expressions neuronal, consultezl’aide et les recommandations concernant le dictionnaire neuronal.

  • Si vous utilisez un dictionnaire de phrases, la ponctuation finale de la phrase est ignorée.

    Exemple

    • Si votre dictionnaire source contient « Cette phrase se termine par un signe de ponctuation ! », toutes les demandes de traduction contenant « Cette phrase se termine par un signe de ponctuation » correspondent.
  • Votre dictionnaire doit contenir des lignes sources uniques. Si une ligne source (mot, expression ou phrase) apparaît plusieurs fois dans un fichier de dictionnaire, le système utilise toujours la dernière entrée fournie et retourne la cible quand une correspondance est trouvée.

  • Évitez d’ajouter des expressions composées uniquement de nombres ou de mots à deux ou trois lettres, tels que des acronymes, dans le fichier de dictionnaire source.

Étapes suivantes