Apa itu Document Translation?

Terjemahan Dokumen adalah fitur terjemahan mesin berbasis cloud dari layanan Penerjemah Azure AI. Anda dapat menerjemahkan beberapa dokumen dan kompleks di semua bahasa dan dialek yang didukung sambil mempertahankan struktur dokumen asli dan format data. API Terjemahan Dokumen mendukung dua operasi terjemahan:

  • Terjemahan dokumen batch asinkron mendukung pemrosesan asinkron beberapa dokumen dan file besar. Proses terjemahan batch memerlukan akun penyimpanan Azure Blob dengan kontainer untuk sumber dan dokumen yang diterjemahkan.

  • Terjemahan dokumen sinkron mendukung pemrosesan terjemahan file tunggal yang sinkron. Proses terjemahan file tidak memerlukan akun penyimpanan Azure Blob. Respons akhir berisi dokumen yang diterjemahkan dan dikembalikan langsung ke klien panggilan.

Terjemahan batch asinkron

Gunakan pemrosesan dokumen asinkron untuk menerjemahkan beberapa dokumen dan file besar.

Fitur utama batch

Fitur Deskripsi
Menerjemahkan file berukuran besar Terjemahkan seluruh dokumen secara asinkron.
Menerjemahkan banyak file Menerjemahkan beberapa file di semua bahasa dan dialek yang didukung sambil mempertahankan struktur dokumen dan format data.
Mempertahankan presentasi file sumber Terjemahkan {i>file
Menerapkan terjemahan kustom Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom.
Menerapkan glosarium kustom Terjemahkan dokumen menggunakan glosarium kustom.
Mendeteksi bahasa dokumen secara otomatis Izinkan layanan Document Translation menentukan bahasa dokumen.
Menerjemahkan dokumen dengan konten dalam beberapa bahasa Gunakan fitur deteksi otomatis untuk menerjemahkan dokumen dengan konten yang terdiri dari beberapa bahasa ke dalam bahasa target Anda.

Opsi pengembangan batch

Anda dapat menambahkan Document Translation ke aplikasi Anda dengan menggunakan REST API atau SDK pustaka klien:

  • REST API. adalah antarmuka agnostik bahasa yang memungkinkan Anda untuk membuat permintaan dan header otorisasi untuk menerjemahkan dokumen.

  • SDK pustaka klien adalah kelas, objek, metode, serta kode khusus bahasa yang dapat Anda gunakan dengan cepat dengan menambahkan referensi dalam proyek Anda. Saat ini Document Translation mendukung bahasa pemrogram C#/.NET dan Python.

Format dokumen yang didukung batch

Metode Dapatkan format dokumen yang didukung mengembalikan daftar format dokumen yang didukung oleh layanan Terjemahan Dokumen. Daftar ini mencakup ekstensi file umum, dan jenis konten jika menggunakan API pengunggahan.

Jenis file Ekstensi {i>file Deskripsi
Adobe PDF pdf Format file dokumen portabel. Penerjemahan Dokumen menggunakan teknologi pengenalan karakter optik (OCR) untuk mengekstrak dan menerjemahkan teks dalam dokumen PDF yang dipindai sambil mempertahankan tata letak aslinya.
Comma Separated Values csv {i>File spreadsheet
HTML html, htm Hyper Text Markup Language.
Localization Interchange File Format xlf Format dokumen paralel, ekspor sistem Memori Terjemahan. Bahasa yang digunakan didefinisikan di dalam file.
Markdown markdown, , mkdnmdown, md, mkd, mdwn, mdtxt, , mdtext,rmd Bahasa markup ringan untuk membuat teks yang diformat.
MHTML mthml, mht Format arsip halaman web yang digunakan untuk menggabungkan kode HTML dan sumber daya pendampingnya.
Microsoft Excel xls, xlsx {i>File spreadsheet
Microsoft Outlook msg Pesan email yang dibuat atau disimpan dalam Microsoft Outlook.
Microsoft PowerPoint ppt, pptx {i>File slideshow
Microsoft Word doc, docx {i>File
OpenDocument Text odt File{i>
OpenDocument Presentation odp File{i>
OpenDocument Spreadsheet ods File{i>
Rich Text Format rtf Dokumen teks yang berisi pemformatan.
Tab Separated Values/TAB tsv/tab {i>File spreadsheet
Teks txt Dokumen teks yang tidak diformat.

Jenis file Warisan Batch

Jenis file sumber dipertahankan selama terjemahan dokumen dengan pengecualian berikut:

Ekstensi file sumber Ekstensi file terjemahan
.doc, .odt, .rtf, .docx
.xls, .ods .xlsx
.ppt, .odp .pptx

Format glosarium yang didukung batch

Document Translation mendukung jenis file glosarium berikut:

Jenis file Ekstensi {i>file Deskripsi
Comma Separated Values csv {i>File spreadsheet
Localization Interchange File Format xlf , xliff Format dokumen paralel, ekspor sistem Translation Memory yang digunakan oleh bahasa didefinisikan di dalam file.
Tab Separated Values/TAB tsv, tab {i>File spreadsheet

Terjemahan sinkron

Gunakan pemrosesan terjemahan sinkron untuk mengirim dokumen sebagai bagian dari isi permintaan HTTP dan menerima dokumen yang diterjemahkan dalam respons HTTP.

Fitur kunci terjemahan sinkron

Fitur Deskripsi
Menerjemahkan file halaman tunggal Permintaan sinkron hanya menerima satu dokumen sebagai input.
Mempertahankan presentasi file sumber Terjemahkan {i>file
Menerapkan terjemahan kustom Terjemahkan dokumen menggunakan model terjemahan umum dan terjemahan kustom.
Menerapkan glosarium kustom Terjemahkan dokumen menggunakan glosarium kustom.
Terjemahan bahasa tunggal Terjemahkan ke dan dari satu bahasa yang didukung.
Mendeteksi bahasa dokumen secara otomatis Izinkan layanan Document Translation menentukan bahasa dokumen.
Menerapkan glosarium kustom Menerjemahkan dokumen menggunakan glosarium kustom.

Format dokumen yang didukung sinkron

Jenis file Ekstensi {i>file Jenis konten Deskripsi
Teks Biasa .txt text/plain Dokumen teks yang tidak diformat.
Nilai Yang Dipisahkan Tab .txv
.tab
text/tab-separated-values Format file teks yang menggunakan tab untuk memisahkan nilai dan baris baru untuk memisahkan rekaman.
Nilai yang Dipisahkan Koma .csv text/csv Format file teks yang menggunakan koma sebagai pemisah di antara nilai.
Bahasa Markup HyperText .html
.htm
text/html HTML adalah bahasa markup standar yang digunakan untuk menyusun halaman web dan konten.
MHTML .mthml
.mht
message/rfc822
@application/x-mimearchive
@multipart/related
Format file arsip halaman web.
Microsoft PowerPoint .pptx application/vnd.openxmlformats-officedocument.presentationml.presentation Format file berbasis XML yang digunakan untuk presentasi peragaan slide PowerPoint.
Microsoft Excel .xlsx application/vnd.openxmlformats-officedocument.spreadsheetml.sheet Format file berbasis XML yang digunakan untuk lembar bentang Excel.
Microsoft Word .docx application/vnd.openxmlformats-officedocument.wordprocessingml.document Format file berbasis XML yang digunakan untuk dokumen Word.
Microsoft Outlook .msg application/vnd.ms-outlook Format file yang digunakan untuk objek pesan email Outlook tersimpan.
Pertukaran Pelokalan Xml .xlf
.xliff
application/xliff+xml Format file berbasis XML standar yang banyak digunakan dalam pemrosesan perangkat lunak terjemahan dan pelokalan.

Format glosarium yang didukung sinkron

Document Translation mendukung jenis file glosarium berikut:

Jenis file Ekstensi {i>file Deskripsi
Nilai yang Dipisahkan Koma csv {i>File spreadsheet
XmlLocalizationInterchange xlf , xliff Format berbasis XML yang dirancang untuk menstandarkan bagaimana data diteruskan selama proses pelokalan.
TabSeparatedValues tsv, tab {i>File spreadsheet

Batas Permintaan Terjemahan Dokumen

Untuk informasi terperinci mengenai batas permintaan Azure AI Penerjemah Service, lihatBatas permintaan Terjemahan Dokumen.

Residensi data Terjemahan Dokumen

Residensi data Terjemahan Dokumen bergantung pada wilayah Azure tempat sumber daya Penerjemah Anda dibuat:

✔️ Fitur: Titik akhir Layanan Terjemahan ✔️
Dokumen: Kustom: <name-of-your-resource.cognitiveservices.azure.com/translator/text/batch/v1.1

Wilayah yang dibuat sumber daya Meminta pusat data pemrosesan
Global Pusat data terdekat yang tersedia.
Amerika US Timur 2 • US Barat 2
Asia Pasifik Jepang Timur • Asia Tenggara
Eropa (kecuali Swiss) Prancis Tengah • Eropa Barat
Swiss Swiss Utara • Swiss Barat

Langkah berikutnya

Dalam mulai cepat kami, Anda mempelajari cara mulai menggunakan Terjemahan Dokumen dengan cepat. Untuk memulai, Anda memerlukan akun Azure aktif. Jika Anda tidak memilikinya, Anda dapat membuat akun gratis.