Apa yang dimaksud terjemahan ucapan?

Dalam artikel ini, Anda mempelajari tentang manfaat dan kemampuan terjemahan dengan Azure AI Speech. Layanan Ucapan mendukung terjemahan ucapan dan ucapan ke ucapan dan ucapan ke teks real-time.

Dengan SDK Ucapan atau CLI Ucapan, Anda dapat memberikan aplikasi, alat, dan perangkat Anda akses ke transkripsi sumber dan output terjemahan untuk audio yang disediakan. Transkripsi sementara dan hasil terjemahan dihasilkan saat ucapan terdeteksi, dan hasil akhir dapat dikonversi menjadi ucapan yang disintesis.

Untuk daftar bahasa yang didukung untuk terjemahan ucapan, lihat Dukungan bahasa dan suara.

Tip

Buka Speech Studio untuk menguji dan menerjemahkan ucapan dengan cepat ke bahasa lain pilihan Anda dengan latensi rendah.

Fitur inti

Fitur inti terjemahan ucapan meliputi:

Terjemahan ucapan ke teks

Fitur standar yang ditawarkan oleh layanan Ucapan adalah kemampuan untuk mengambil aliran audio input dalam bahasa sumber yang Anda tentukan, dan membuatnya diterjemahkan dan dihasilkan sebagai teks dalam bahasa target yang Anda tentukan.

Terjemahan ucapan ke ucapan

Sebagai tambahan untuk fitur di atas, layanan Ucapan juga menawarkan opsi untuk membacakan dengan keras teks yang diterjemahkan menggunakan database besar suara yang telah dilatih sebelumnya, memungkinkan output alami dari ucapan input.

Terjemahan ucapan multibahasa (Pratinjau)

Terjemahan ucapan multibahasa menerapkan tingkat teknologi terjemahan ucapan baru yang membuka berbagai kemampuan, termasuk tidak memiliki bahasa input yang ditentukan, menangani sakelar bahasa dalam sesi yang sama, dan mendukung terjemahan streaming langsung ke dalam bahasa Inggris. Fitur-fitur ini memungkinkan tingkat kekuatan terjemahan ucapan baru yang dapat diimplementasikan ke dalam produk Anda.

  • Bahasa input yang tidak ditentukan. Terjemahan ucapan multibahasa dapat menerima audio dalam berbagai bahasa, dan tidak perlu menentukan bahasa input yang diharapkan.
  • Pengalihan bahasa. Terjemahan ucapan multibahasa memungkinkan beberapa bahasa diucapkan selama sesi yang sama, dan semuanya diterjemahkan ke dalam bahasa target yang sama. Tidak perlu menghidupkan ulang sesi saat bahasa input berubah atau tindakan lain oleh Anda.
  • Transkripsi. Layanan menghasilkan transkripsi dalam bahasa target yang ditentukan. Transkripsi bahasa sumber belum tersedia.

Beberapa kasus penggunaan untuk terjemahan ucapan multibahasa meliputi:

  • Penerjemah Perjalanan. Saat bepergian ke luar negeri, terjemahan ucapan multibahasa menawarkan kemampuan untuk membuat solusi yang memungkinkan pelanggan untuk menerjemahkan audio input apa pun ke dan dari bahasa lokal. Ini memungkinkan mereka untuk berkomunikasi dengan penduduk setempat dan lebih memahami lingkungan mereka.
  • Rapat Bisnis. Dalam pertemuan dengan orang-orang yang berbicara bahasa yang berbeda, terjemahan ucapan multibahasa memungkinkan anggota rapat untuk semua berkomunikasi satu sama lain secara alami seolah-olah tidak ada hambatan bahasa.

Untuk terjemahan ucapan multibahasa, ini adalah bahasa layanan Ucapan dapat secara otomatis mendeteksi dan beralih antara dari input: Arab (ar), Basque (UE), Bosnia (bs), Bulgaria (bg), Chinese Simplified (zh), Chinese Traditional (zhh), Czech (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Galician (gl), Jerman (de), Yunani (el), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Makedonia (mk), Norwegia (nb), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slowakia (sk), Slovenia (sl), Spanyol (es), Swedia (sv), Thai (th), Turki (tr), Ukraina (uk), Vietnam (vi), dan Welsh (cy).

Untuk daftar bahasa output (target) yang didukung, lihat dokumentasi Terjemahkan ke bahasa teks dalam bahasa dan dukungan suara.

Untuk informasi selengkapnya tentang terjemahan ucapan multibahasa, lihat terjemahan ucapan cara memandu dan sampel terjemahan ucapan di GitHub.

Terjemahan beberapa bahasa target

Dalam skenario di mana Anda menginginkan output dalam beberapa bahasa, layanan Ucapan secara langsung menawarkan kemampuan bagi Anda untuk menerjemahkan bahasa input ke dalam dua bahasa target. Ini memungkinkan mereka untuk menerima dua output dan berbagi terjemahan ini ke audiens yang lebih luas dengan satu panggilan API. Jika diperlukan lebih banyak bahasa output, Anda dapat membuat sumber daya multi-layanan atau menggunakan layanan terjemahan terpisah.

Jika Anda memerlukan terjemahan ke lebih dari dua bahasa target, Anda perlu membuat sumber daya multi-layanan atau menggunakan layanan terjemahan terpisah untuk lebih banyak bahasa di luar yang kedua. Jika Anda memilih untuk memanggil layanan terjemahan ucapan dengan sumber daya multi-layanan, harap dicatat bahwa biaya terjemahan berlaku untuk setiap bahasa di luar yang kedua, berdasarkan jumlah karakter terjemahan.

Untuk menghitung biaya terjemahan yang diterapkan, lihat harga Azure AI Penerjemah.

Harga terjemahan beberapa bahasa target

Penting untuk dicatat bahwa layanan terjemahan ucapan beroperasi secara real time, dan hasil ucapan perantara diterjemahkan untuk menghasilkan hasil terjemahan menengah. Oleh karena itu, jumlah terjemahan aktual lebih besar dari token audio input. Anda dikenakan biaya untuk transkripsi ucapan ke teks dan terjemahan teks untuk setiap bahasa target.

Misalnya, Anda menginginkan terjemahan teks dari file audio satu jam ke tiga bahasa target. Jika transkripsi ucapan ke teks awal berisi 10.000 karakter, Anda mungkin dikenakan biaya $2,80.

Peringatan

Harga dalam contoh ini hanya untuk tujuan ilustrasi. Silakan merujuk ke harga Azure AI Speech dan harga Azure AI Penerjemah untuk informasi harga terbaru.

Contoh harga sebelumnya sebesar $2,80 dihitung dengan menggabungkan transkripsi ucapan ke teks dan biaya terjemahan teks. Berikut adalah cara penghitungan dilakukan:

  • Harga daftar terjemahan ucapan adalah $2,50 per jam, mencakup hingga 2 bahasa target. Harga digunakan sebagai contoh cara menghitung biaya. Lihat Standar terjemahan>Pay as You Go>Speech di tabel harga Azure AI Speech untuk informasi harga terbaru.
  • Biaya untuk terjemahan bahasa ketiga adalah 30 sen dalam contoh ini. Harga daftar terjemahan adalah $ 10 per juta karakter. Karena file audio berisi 10.000 karakter, biaya terjemahan adalah $10 * 10.000 / 1.000.000 * 3 = $0,3. Angka "3" dalam persamaan ini mewakili koefisien pembobotan lalu lintas menengah, yang mungkin bervariasi tergantung pada bahasa yang terlibat. Harga digunakan sebagai contoh cara menghitung biaya. Lihat Terjemahan Teks terjemahan>Pay as You Go>Standard di tabel harga Azure AI Penerjemah untuk informasi harga terbaru.

Memulai

Sebagai langkah pertama Anda, coba mulai cepat terjemahan ucapan. Layanan penerjemahan ucapan tersedia melalui Speech SDK dan Speech CLI.

Anda menemukan ucapan Speech SDK ke teks dan sampel terjemahan di GitHub. Sampel ini mencakup skenario umum seperti membaca audio dari file atau aliran, pengenalan/penerjemahan berkelanjutan dan satu kali, serta bekerja dengan model kustom.

Langkah berikutnya