Özel Çeviri anahtar terimleri

Aşağıdaki tabloda, Özel Çeviri çalışırken bulabileceğiniz önemli terimlerin listesi yer alır.

Sözcük veya Tümcecik Tanım
Kaynak Dil Kaynak dil, başka bir dile ("hedef") dönüştürmek istediğiniz başlangıç dilidir.
Hedef Dil Hedef dil, makine çevirisinin kaynak dili aldıktan sonra sağlamasını istediğiniz dildir.
Tek Dilli Dosya Tek dilli bir dosya, farklı bir dilde başka bir dosyayla eşleştirilmemiş tek bir dile sahiptir.
Paralel Dosyalar Paralel dosya, karşılık gelen metin içeren iki dosyanın birleşimidir. Bir dosya kaynak dile sahiptir. Diğeri hedef dile sahiptir.
Tümce Hizalama Paralel veri kümesi, her iki dilde de aynı metni temsil eden cümlelerle hizalanmış cümlelere sahip olmalıdır. Örneğin, bir kaynak paralel dosyada ilk cümle, teoride hedef paralel dosyadaki ilk cümleye eşlenmelidir.
Hizalanmış Metin Dosya doğrulamanın en önemli adımlarından biri, tümceleri paralel belgelere hizalamaktır. Her şey farklı dillerde farklı şekilde ifade edilir. Ayrıca farklı diller farklı sözcük düzenlerine sahiptir. Bu adım, cümleleri eğitim için kullanılabilmesi için aynı içerikle hizalama işini yapar. Düşük cümle hizalaması, dosyalardan birinde veya her ikisinde de bir sorun olabileceğini gösterir.
Sözcük Bölme/ Bölünmez Sözcük kesme, sözcükler arasındaki sınırları işaretleme işlevidir. Birçok yazma sistemi, sözcükler arasındaki sınırı belirtmek için bir boşluk kullanır. Sözcük bölünmez, önceki adımda sözcükler arasına eklenmiş olabilecek görünür işaretçilerin kaldırılmasını ifade eder.
Sınırlayıcı Sınırlayıcılar, bir cümlenin segmentlere bölünmesinin veya cümleler arasındaki kenar boşluğunun sınırlandırılmış olmasıdır. Örneğin, İngilizce boşluklarda sözcükleri, iki nokta üst üste ve noktalı virgülle sınırlandırma yan tümceleri ve noktalı virgüller tümceleri sınırlandırma.
Eğitim Dosyaları Eğitim dosyası, makine çevirisi sistemine bir dilden (kaynak) hedef dile (hedef) nasıl eşleme yapılacağını öğretmek için kullanılır. Ne kadar çok veri sağlarsanız sistem o kadar iyi performans gösterir.
Dosyaları Ayarlama Bu dosyalar genellikle eğitim kümesinden rastgele türetilir (ayarlama kümesi seçmezseniz). Cümleler otomatik olarak seçilir ve sistemi ayarlamak ve düzgün çalıştığından emin olmak için kullanılır. Genel amaçlı bir çeviri modeli oluşturmak ve kendi ayarlama dosyalarınızı oluşturmak istiyorsanız, bunların etki alanları arasında rastgele bir cümle kümesi olduğundan emin olun
Dosyaları Test Etme Bu dosyalar genellikle eğitim kümesinden rastgele seçilen türetilmiş dosyalardır (herhangi bir test kümesi seçmezseniz). Bu cümlelerin amacı çeviri modelinin doğruluğunu değerlendirmektir. Bu cümleler sistemin doğru çevrildiğinden emin olmak istediğiniz cümleler olduğundan, bir test kümesi oluşturup çeviriciye yüklemek isteyebilirsiniz. Bunun yapılması, bu cümlelerin sistemin değerlendirmesinde (BLEU puanının oluşturulması) kullanılmasını sağlar.
Birleşik giriş dosyası Kaynak ve çevrilmiş cümlelerin aynı dosyada yer aldığı dosya türü. Desteklenen dosya biçimleri (TMX, XLIFF, XLF, ICI ve XLSX).
Arşiv dosyası Diğer dosyaları içeren bir dosya. Desteklenen dosya biçimleri (zip, gz, tgz).
BLEU Puanı BLEU , çeviri modelinin "duyarlığını" veya doğruluğunu değerlendirmek için endüstri standardı bir yöntemdir. Başka değerlendirme yöntemleri olsa da, Microsoft Çeviri Project Sahiplerine doğruluğu bildirmek için BLEU yöntemini kullanır.