Membangun serta mengelola dokumen pelatihan

Penerjemah Kustom memungkinkan Anda untuk membangun model terjemahan yang mencerminkan bisnis, industri, dan terminologi dan gaya khusus domain Anda. Melatih dan menyebarkan model kustom itu mudah dan tidak memerlukan keterampilan pemrograman apa pun. Penerjemah Kustom memungkinkan Anda mengunggah file paralel, file memori terjemahan, atau file zip.

Dokumen paralel adalah pasangan dokumen yang salah satu dokumennya (target) adalah terjemahan dari yang lain (sumber). Satu dokumen dalam pasangan dokumen berisi kalimat dalam bahasa sumber dan dokumen lainnya berisi kalimat-kalimat yang diterjemahkan ke bahasa target.

Sebelum mengunggah dokumen Anda, tinjau format dokumen dan panduan konvensi penamaan untuk memastikan format file Anda didukung di Penerjemah Kustom.

Cara membuat set dokumen

Menemukan data kualitas dalam domain sering kali merupakan tugas yang menantang yang bervariasi berdasarkan klasifikasi pengguna. Berikut adalah beberapa pertanyaan yang dapat Anda tanyakan pada diri sendiri saat Anda mengevaluasi data apa yang mungkin tersedia untuk Anda:

  • Perusahaan sering memiliki banyak data terjemahan yang telah terakumulasi selama bertahun-tahun menggunakan terjemahan manusia. Apakah perusahaan Anda memiliki data terjemahan sebelumnya yang tersedia yang dapat Anda gunakan?

  • Apakah Anda memiliki sejumlah besar data monolingual? Data monolingual adalah data hanya dalam satu bahasa. Jika demikian, bisakah Anda mendapatkan terjemahan untuk data ini?

  • Bisakah Anda menjelajahi portal online untuk mengumpulkan kalimat sumber dan mensintesis kalimat target?

Materi pelatihan untuk setiap jenis dokumen

Sumber Apa fungsinya Aturan yang harus diikuti
Dokumen pelatihan bilingual Mengajarkan sistem terminologi dan gaya Anda. Jadilah liberal. Terjemahan manusia dalam domain lebih baik daripada terjemahan mesin. Tambahkan dan hapus dokumen sesuai penggunaan dan cobalah untuk meningkatkan skor BLEU.
Menyetel dokumen Melatih parameter Terjemahan Mesin Neural. Jadilah ketat. Tulis mereka untuk secara optimal mewakili apa yang akan Anda terjemahkan di masa depan.
Dokumen pengujian Hitung skor BLEU. Jadilah ketat. Tulis dokumen pengujian agar secara optimal mewakili apa yang Anda rencanakan untuk diterjemahkan di masa mendatang.
Kamus frasa Memaksa terjemahan yang diberikan 100% dari waktu. Jadilah membatasi. Kamus frasa peka huruf besar/kecil dan kata atau frasa apa pun yang tercantum diterjemahkan dengan cara yang Anda tentukan. Dalam banyak kasus, lebih baik tidak menggunakan kamus frasa dan membiarkan sistem belajar.
kamus kalimat Memaksa terjemahan yang diberikan 100% dari waktu. Jadilah ketat. Kamus kalimat tidak peka huruf besar/kecil dan baik untuk umum dalam kalimat pendek domain. Agar kecocokan kamus kalimat terjadi, seluruh kalimat yang dikirimkan harus cocok dengan entri kamus sumber. Jika hanya sebagian kalimat yang cocok, entri tidak akan cocok.

Cara mengunggah dokumen

Jenis dokumen dikaitkan dengan pasangan bahasa yang dipilih saat Anda membuat proyek.

  1. Masuk ke portal Penerjemah Kustom. Ruang kerja default Anda dimuat dan daftar proyek yang dibuat sebelumnya ditampilkan.

  2. Pilih Nama proyek yang diinginkan. Secara default, bilah Kelola dokumen dipilih dan daftar dokumen yang diunggah sebelumnya ditampilkan.

  3. Pilih Tambahkan set dokumen dan pilih jenis dokumen:

    • Set pelatihan
    • Set pengujian
    • Set penyetelan
    • Set kamus:
      • Kamus Frasa
      • Kamus Kalimat
  4. Pilih Selanjutnya.

    Cuplikan layar yang mengilustrasikan tautan unggahan dokumen.

    Catatan

    Memilih set Kamus meluncurkan dialog Pilih jenis kamus. Pilih salah satu dan pilih Berikutnya

  5. Pilih format dokumen Anda dari tombol radio.

    Cuplikan layar yang mengilustrasikan halaman unggah dokumen.

    • Untuk dokumen Paralel, isi Document set name dan pilih Telusuri file untuk memilih dokumen sumber dan target.
    • Untuk file Memori terjemahan (TM) atau Unggah beberapa set dengan ZIP, pilih Telusuri file untuk memilih file
  6. Pilih Unggah.

Pada titik ini, Penerjemah Kustom sedang memproses dokumen Anda dan mencoba mengekstrak kalimat seperti yang ditunjukkan dalam pemberitahuan pengunggahan. Setelah selesai diproses, Anda akan melihat pemberitahuan pengunggahan berhasil.

Cuplikan layar yang mengilustrasikan jendela dialog pemrosesan dokumen unggahan.

Lihat riwayat unggahan

Di halaman ruang kerja Anda dapat melihat riwayat semua detail unggahan dokumen seperti jenis dokumen, pasangan bahasa, status unggahan, dll.

  1. Dari halaman ruang kerja portal Penerjemah Kustom , klik tab Unggah Riwayat untuk melihat riwayat.

    Cuplikan layar memperlihatkan tab riwayat unggahan.

  2. Halaman ini menunjukkan status semua unggahan Anda sebelumnya. Hal ini menampilkan unggahan dari yang terbaru hingga yang terbaru. Untuk setiap unggahan, ini menunjukkan nama dokumen, status unggahan, tanggal unggahan, jumlah file yang diunggah, jenis file yang diunggah, pasangan bahasa file, dan dibuat oleh. Anda bisa menggunakan Filter untuk menemukan dokumen dengan cepat berdasarkan nama, status, bahasa, dan rentang tanggal.

    Cuplikan layar memperlihatkan halaman riwayat unggahan.

  3. Pilih rekaman riwayat unggahan mana pun. Di halaman detail riwayat unggahan, Anda dapat melihat file yang diunggah sebagai bagian dari unggahan, status unggahan file, bahasa pemrograman file dan pesan kesalahan (jika ada kesalahan dalam pengunggahan).

Langkah berikutnya