A Custom Translator kulcskifejezései

Az alábbi táblázat a Custom Translator használata során esetlegesen talált kulcskifejezések listáját tartalmazza.

Word vagy kifejezés Definíció
Forrásnyelv A forrásnyelv az a kezdő nyelv, amelyet egy másik nyelvre (a "cél") szeretne konvertálni.
Célnyelv A célnyelv az a nyelv, amelyet a gépi fordításnak meg kell adnia, miután megkapta a forrásnyelvet.
Egynyelvű fájl Az egynyelvű fájlok egyetlen nyelvvel vannak párosítva egy másik, más nyelvű fájllal.
Párhuzamos fájlok A párhuzamos fájl két fájl és a megfelelő szöveg kombinációja. Egy fájl rendelkezik a forrásnyelvével. A másik a célnyelv.
Mondat igazítása A párhuzamos adatkészletnek olyan mondatokhoz kell igazítania a mondatokat, amelyek ugyanazt a szöveget képviselik mindkét nyelven. Például egy forrás párhuzamos fájlban az első mondatnak elméletileg le kell képeznie a cél párhuzamos fájl első mondatára.
Igazított szöveg A fájlérvényesítés egyik legfontosabb lépése a mondatok igazítása a párhuzamos dokumentumokban. A dolgok különböző nyelveken vannak kifejezve. A különböző nyelvek szórendje is eltérő. Ezzel a lépéssel a mondatokat ugyanahhoz a tartalomhoz igazítja, hogy azok felhasználhatók legyenek a betanításhoz. Az alacsony mondatigazítás azt jelzi, hogy valami nem stimmel az egyik vagy mindkét fájllal.
Word kompatibilitástörő/töretlen Word törés a szavak közötti határok jelölésének függvénye. Számos írási rendszer használ szóközt a szavak közötti határ jelölésére. Word töretlenség az előző lépésben szavak közé beszúrt látható jelölők eltávolítását jelenti.
Határolójelek A határolójelek a mondatok szegmensekre való felosztásának vagy a mondatok közötti margó elválasztásának módjai. Az angol szóközökben például a szavakat, kettőspontokat és pontosvesszőket elválasztó záradékok és ponthatároló mondatok.
Betanítási fájlok A betanítási fájl arra szolgál, hogy megtanítsa a gépi fordítási rendszernek, hogyan képezhet le egy nyelvet (a forrást) egy célnyelvre (a célnyelvre). Minél több adatot ad meg, annál jobb lesz a rendszer teljesítménye.
Fájlok finomhangolása Ezek a fájlok gyakran véletlenszerűen származnak a betanítási készletből (ha nem választ ki hangolási készletet). A mondatok automatikusan ki vannak jelölve, és a rendszer finomhangolására és a megfelelő működés biztosítására szolgálnak. Ha általános célú fordítási modellt szeretne létrehozni, és saját hangolási fájlokat szeretne létrehozni, győződjön meg arról, hogy azok a tartományok közötti mondatok véletlenszerű készletei
Fájlok tesztelése Ezek a fájlok gyakran származtatott fájlok, amelyek véletlenszerűen vannak kiválasztva a betanítási készletből (ha nem választ ki tesztkészletet). Ezeknek a mondatoknak a célja a fordítási modell pontosságának kiértékelése. Annak érdekében, hogy a rendszer pontosan lefordítsa ezeket a mondatokat, érdemes lehet létrehozni egy tesztkészletet, és feltölteni azt a fordítóba. Ezzel biztosítható, hogy a mondatok a rendszer értékelésében (BLEU-pontszám létrehozása) legyenek felhasználva.
Kombinált fájl Olyan fájltípus, amelyben a forrás és a lefordított mondatok ugyanabban a fájlban találhatók. Támogatott fájlformátumok (TMX, XLIFF, XLF, ICI és XLSX).
Fájl archiválása Más fájlokat tartalmazó fájl. Támogatott fájlformátumok (zip, gz, tgz).
BLEU-pontszám A BLEU a fordítási modell "pontosságának" vagy pontosságának értékelésére szolgáló iparági szabvány módszer. Bár léteznek más kiértékelési módszerek is, a Microsoft Translator a BLEU metódust használja a pontosság projekttulajdonosoknak való jelentéséhez.