Vad är en ordlista?

En ordlista är ett justerat dokumentpar som anger en lista med fraser eller meningar och deras motsvarande översättningar. Använd en ordlista i träningen när du vill att Microsoft Translator alltid ska översätta alla instanser av källfrasen eller meningen med hjälp av översättningen som du har angett i ordlistan. Ordlistor kallas ibland ordlistor eller termbaser. Du kan se ordlistan som en råstyrkkraft som "kopiera och ersätt" för alla termer som du listar. Dessutom bygger och använder Microsoft Custom Translator-tjänsten egna ordlistor för generell användning för att förbättra kvaliteten på översättningen. En kunds tillhandahållna ordlista tar dock tid och genomsöks först för att söka efter ord eller meningar.

Ordlistor fungerar bara för projekt i språkpar som har en microsoft-modell med fullständigt stöd för allmänt neuralt nätverk bakom sig. Visa den fullständiga listan över språk.

Frasordlista

Frasordlistan är fallkänslig. Det är en exakt find and replace-åtgärd. När du inkluderar en frasordlista i träningen av din modell översätts alla ord eller fraser som anges på det sätt som du har angett. Resten av meningen översätts som vanligt. Du kan använda en frasordlista för att ange fraser som inte ska översättas genom att ange samma oöversatta fras i käll- och målfilen i ordlistan.

Ordlista för mening

Meningsordlistan är icke-okänslig. Med meningsordlistan kan du ange en exakt målöversättning för en käll mening. För att en ordlistematchning i en mening ska ske måste hela den skickade meningen matcha källordlisteposten. Om källordlisteposten slutar med skiljetecken ignoreras den under matchningen. Om bara en del av meningen matchar matchar posten inte. När en matchning identifieras returneras målposten i meningsordlistan.

Endast ordlisteträningar

Du kan träna en modell med endast ordlistedata. Om du vill göra detta väljer du bara det ordlistedokument (eller flera ordlistedokument) som du vill inkludera och trycker på Skapa modell. Eftersom det här är en ordlisteträning krävs inget minsta antal tränings meningar. Din modell slutför normalt träningen mycket snabbare än en standardträning. De resulterande modellerna använder Microsofts baslinjemodeller för översättning med de ordlistor som du har lagt till. Du får ingen testrapport.

Anteckning

Anpassade Translator inte meningar justerar ordlistefiler, så det är viktigt att det finns lika många käll- och målfraser/meningar i ordlistedokumenten och att de är exakt justerade.

Rekommendationer

  • Ordlistor ersätter inte träning av en modell med träningsdata. Vi rekommenderar att du undviker dem och låter systemet lära sig av dina träningsdata. Men när meningar eller sammansatta substantiv måste återges som de är ska du använda en ordlista.
  • Frasordlistan bör användas sparsamt. Tänk på att när en fras i en mening ersätts försvinner kontexten i den meningen eller begränsas till att översätta resten av meningen. Resultatet är att frasen eller ordet i meningen översätts enligt den angivna ordlistan, men den övergripande översättningskvaliteten för meningen kommer ofta att drabbas.
  • Frasordlistan fungerar bra för sammansatta substantiv som produktnamn ("Microsoft SQL Server"), rätt namn ("Hamburgs stad") eller funktioner i produkten ("pivottabell"). Det fungerar inte lika bra för verb eller adjektiv eftersom de vanligtvis är mycket inflected i källan eller på målspråket. Bästa praxis är att undvika ordlisteposter för fraser för allt utom sammansatta substantiv.
  • När du använder en frasordlista är versaler och skiljetecken viktiga. Ordlisteposter matchar bara ord och fraser i den inmatade meningen som använder exakt samma versaler och skiljetecken som anges i källordlistefilen. Översättningarna återspeglar också versaler och skiljetecken som anges i målordlistefilen. Om du till exempel har tränat ett engelskt till spanska system som använder en frasordlista som anger "US" i källfilen och "EE. UU." i målfilen. När du begär översättning av en mening som innehåller ordet "us" (inte versaler), matchar detta INTE ordlistan. Men om du begär översättning av en mening som innehåller ordet "US" (versaler) skulle den matcha ordlistan och översättningen skulle innehålla "EE. UU." Observera att versaler och skiljetecken i översättningen kan vara annorlunda än vad som anges i ordbokens målfil och kan vara annorlunda än versaler och skiljetecken i källan. Den följer reglerna för målspråket.
  • När du använder en meningsordlista ignoreras skiljetecken i slutet av meningen. Om din källordlista till exempel innehåller "den här meningen slutar med skiljetecken!", matchar alla översättningsbegäranden som innehåller "den här meningen slutar med skiljetecken".
  • Om ett ord förekommer mer än en gång i en ordlistefil använder systemet alltid den sista angivna posten. Därför bör ordlistan inte innehålla flera översättningar av samma ord.

Nästa steg