Vad är parallella dokument?
Parallella dokument är par med dokument där det ena är översättningen av det andra. Ett dokument i paret innehåller meningar i käll språket och det andra dokumentet innehåller de meningarna översatta till mål språket. Det spelar ingen roll vilket språk som har marker ATS som "källa" och vilket språk som marker ATS som "mål" – ett parallellt dokument kan användas för att träna ett översättnings system i båda riktningarna.
Krav
Du behöver minst 10 000 unika justerade parallella meningar för att träna ett system. Den här begränsningen är ett säkerhets nät för att se till att dina parallella meningar innehåller tillräckligt med unik vokabulär för att kunna träna en översättnings modell. Bästa praxis är att kontinuerligt lägga till mer Parallel-innehåll och omträna för att förbättra kvaliteten på ditt översättnings system. Se menings justering.
Microsoft kräver att dokument som överförs till den anpassade översättaren inte bryter mot en tredje parts upphovs rätt eller immateriell egendom. Mer information finns i användnings villkoren. Att ladda upp ett dokument med hjälp av portalen ändrar inte ägande rätten till den immateriella egendomen i själva dokumentet.
Användning av parallella dokument
Parallella dokument används av systemet:
För att lära dig hur ord, fraser och meningar ofta mappas mellan de två språken.
För att lära dig att bearbeta lämplig kontext beroende på de omgivande fraserna. Ett ord kan inte alltid översättas till exakt samma ord på det andra språket.
Vi rekommenderar att du ser till att det finns en 1:1 mening mellan käll-och mål språk versionerna av dokumenten.
Om projektet är en domän (kategori) bör dokumenten vara konsekventa i terminologin i den kategorin. Kvaliteten på det resulterande översättnings systemet beror på antalet meningar i dokument uppsättningen och meningens kvalitet. De fler exempel som dokumenten innehåller med olika användnings områden för ett ord som är speciellt för din kategori, vilket är det bästa jobbet som systemet kan utföra under översättningen.
Överförda dokument är privata för varje arbets yta och kan användas i så många projekt eller utbildningar som du vill. Meningar som extraheras från dina dokument lagras separat i lagrings platsen som vanliga Unicode-textfiler och är tillgängliga för borttagning. Använd inte den anpassade översättaren som en dokument lagrings plats. du kommer inte att kunna ladda ned de dokument du laddade upp i det format du laddade upp dem.
Nästa steg
- Lär dig hur du använder en ord lista i en anpassad översättare.