Penilaian pengucapan di AI Studio

Penting

Beberapa fitur yang dijelaskan dalam artikel ini mungkin hanya tersedia dalam pratinjau. Pratinjau ini disediakan tanpa perjanjian tingkat layanan, dan kami tidak merekomendasikannya untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk mengetahui informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.

Penilaian pengucapan menggunakan kemampuan ucapan ke teks untuk memberikan umpan balik subjektif dan objektif bagi pelajar bahasa. Berlatih pengucapan dan mendapatkan umpan balik tepat waktu sangat penting untuk meningkatkan keterampilan bahasa. Penilaian yang didorong oleh guru berpengalaman dapat memakan banyak waktu dan upaya dan membuat penilaian berkualitas tinggi mahal bagi pelajar. Penilaian pengucapan dapat membantu membuat penilaian bahasa lebih menarik dan dapat diakses oleh pelajar dari semua latar belakang.

Catatan

Untuk informasi tentang ketersediaan penilaian pengucapan, lihat bahasa yang didukung dan wilayah yang tersedia.

Artikel ini menjelaskan cara menggunakan alat penilaian pengucapan tanpa menulis kode apa pun melalui AI Studio. Untuk informasi tentang cara mengintegrasikan penilaian pengucapan di aplikasi ucapan Anda, lihat Cara menggunakan penilaian pengucapan.

Skenario membaca dan berbicara

Untuk penilaian pengucapan, ada dua skenario: Membaca dan Berbicara.

  • Membaca: Skenario ini dirancang untuk penilaian skrip. Ini mengharuskan pelajar untuk membaca teks tertentu. Teks referensi disediakan terlebih dahulu.
  • Berbicara: Skenario ini dirancang untuk penilaian yang tidak diskrip. Ini mengharuskan pelajar untuk berbicara tentang topik tertentu. Teks referensi tidak disediakan terlebih dahulu.

Melakukan penilaian berskrip

Ikuti langkah-langkah ini untuk menilai pengucapan Anda terkait teks referensi:

  1. Buka Penilaian pengucapan di AI Studio.

    Cuplikan layar cara membuka penilaian Pengucapan di AI Studio.

  2. Pada tab Baca, pilih bahasa yang didukung yang ingin Anda evaluasi pengucapannya.

    Cuplikan layar memilih bahasa yang didukung pada tab baca yang ingin Anda evaluasi pengucapannya.

  3. Anda dapat menggunakan sampel teks yang disediakan atau memasukkan skrip Anda sendiri.

    Saat membaca teks, Anda harus dekat dengan mikrofon untuk memastikan suara yang direkam tidak terlalu rendah.

    Cuplikan layar tempat merekam audio dengan mikrofon pada tab baca.

    Jika tidak, Anda dapat mengunggah audio yang direkam untuk penilaian pengucapan. Setelah berhasil diunggah, audio secara otomatis dievaluasi oleh sistem, seperti yang ditunjukkan pada cuplikan layar berikut.

    Cuplikan layar pengunggahan audio yang terekam untuk dinilai.

Melakukan penilaian tanpa naskah

Jika Anda ingin melakukan penilaian tanpa naskah, pilih tab Berbicara. Fitur ini memungkinkan Anda untuk melakukan penilaian tanpa memberikan teks referensi terlebih dahulu. Berikut cara melanjutkan:

  1. Buka Penilaian pengucapan di AI Studio.

  2. Pada tab Berbicara, pilih bahasa yang didukung yang ingin Anda evaluasi pengucapannya.

    Cuplikan layar memilih bahasa yang didukung pada tab berbicara yang ingin Anda evaluasi pengucapannya.

  3. Selanjutnya, Anda dapat memilih dari topik sampel yang disediakan atau memasukkan topik Anda sendiri. Pilihan ini memungkinkan Anda menilai kemampuan Anda untuk berbicara pada subjek tertentu tanpa skrip yang telah ditentukan sebelumnya.

    Cuplikan layar memasukkan topik pada tab berbicara untuk menilai kemampuan Anda untuk berbicara pada subjek tertentu tanpa skrip yang telah ditentukan sebelumnya.

    Saat merekam ucapan Anda untuk penilaian pengucapan, penting untuk memastikan bahwa waktu perekaman Anda berada dalam kisaran 15 detik yang direkomendasikan (setara dengan lebih dari 50 kata) hingga 10 menit. Rentang waktu ini optimal untuk mengevaluasi konten ucapan Anda secara akurat. Untuk menerima skor topik, audio lisan Anda harus berisi setidaknya tiga kalimat.

    Anda juga dapat mengunggah audio yang direkam untuk penilaian pengucapan. Setelah berhasil diunggah, audio secara otomatis dievaluasi oleh sistem.

Hasil penilaian pengucapan

Setelah Anda merekam ucapan atau mengunggah audio yang direkam, hasil Penilaian adalah output. Hasilnya mencakup audio lisan Anda dan umpan balik tentang penilaian ucapan Anda. Anda dapat mendengarkan audio lisan Anda dan mengunduhnya jika perlu.

Anda juga dapat memeriksa hasil penilaian pengucapan di JSON. Skor akurasi tingkat kata, tingkat suku kata, dan tingkat fonem disertakan dalam file JSON.

Cuplikan layar memperlihatkan hasil penilaian pada jendela tampilan, yang mencakup transkrip dan umpan balik pada ucapan Anda.

Kata disorot sesuai dengan jenis kesalahan. Jenis kesalahan dalam penilaian pengucapan diwakili menggunakan warna yang berbeda. Perbedaan visual ini memudahkan untuk mengidentifikasi dan menganalisis kesalahan tertentu. Ini memberikan gambaran umum yang jelas tentang jenis kesalahan dan frekuensi dalam audio lisan, membantu Anda fokus pada area yang perlu ditingkatkan. Anda dapat mengaktifkan/menonaktifkan setiap jenis kesalahan untuk fokus pada jenis kesalahan tertentu atau mengecualikan jenis tertentu dari tampilan. Fitur ini memberikan fleksibilitas dalam cara Anda meninjau dan menganalisis kesalahan dalam audio lisan Anda. Saat mengarahkan mouse ke atas setiap kata, Anda dapat melihat skor akurasi untuk seluruh kata atau fonem tertentu.

Di bagian bawah hasil Penilaian, hasil penilaian ditampilkan. Untuk penilaian pengucapan berskrip, hanya skor pengucapan (termasuk skor akurasi, skor kelancaran, skor kelengkapan, dan skor prosody) yang disediakan. Untuk penilaian pengucapan yang tidak ditulis, skor pengucapan (termasuk skor akurasi, skor kefasihan, dan skor prosody) dan skor konten (termasuk skor kosakata, skor tata bahasa, dan skor topik) ditampilkan.

Granularitas penilaian pengucapan

Penilaian pengucapan memberikan berbagai hasil penilaian dalam granularitas yang berbeda, dari fonem individual hingga seluruh input teks.

  • Pada tingkat teks lengkap, penilaian pengucapan menawarkan skor Fluency, Completeness, dan Prosody tambahan: Fluency menunjukkan seberapa dekat ucapan cocok dengan penggunaan pembicara asli dari istirahat senyap di antara kata-kata; Kelengkapan menunjukkan berapa banyak kata yang diucapkan dalam ucapan ke input teks referensi; Prosody menunjukkan seberapa baik pembicara menyampaikan elemen kealamaan, ekspresif, dan prosodi keseluruhan dalam ucapan mereka. Skor keseluruhan yang dikumpulkan dari Akurasi, Kefasihan, Kelengkapan, dan Prosody kemudian diberikan untuk menunjukkan kualitas pengucapan keseluruhan dari ucapan yang diberikan. Penilaian pengucapan juga menawarkan skor konten (Kosakata, Tata Bahasa, dan Topik) di tingkat teks lengkap.
  • Pada tingkat kata, penilaian pengucapan dapat secara otomatis mendeteksi kesalahan dan memberikan skor akurasi secara bersamaan, yang memberikan informasi lebih rinci tentang kelalaian, pengulangan, penyisipan, dan kesalahan penolakan dalam ucapan yang diberikan.
  • Skor akurasi tingkat suku kata saat ini tersedia melalui file JSON atau Speech SDK.
  • Pada tingkat fonem, penilaian pengucapan memberikan skor akurasi setiap fonem, membantu pelajar untuk lebih memahami detail pengucapan dari ucapan mereka.

Selain skor dasar akurasi, kefasihan, dan kelengkapan, fitur penilaian pengucapan di AI Studio mencakup skor yang lebih komprehensif untuk memberikan umpan balik terperinci tentang berbagai aspek performa dan pemahaman ucapan. Skor yang ditingkatkan adalah sebagai berikut: Skor prosody, skor Kosakata, skor Tata Bahasa, dan Skor topik. Skor ini menawarkan wawasan berharga tentang prosodi ucapan, penggunaan kosakata, kebenaran tata bahasa, dan pemahaman topik.

Cuplikan layar skor pengucapan keseluruhan dan skor konten keseluruhan di AI Studio.

Di bagian bawah hasil Penilaian, dua skor keseluruhan ditampilkan: Skor pengucapan dan Skor konten. Di tab Baca, Anda menemukan skor Pengucapan ditampilkan. Di tab Berbicara, skor Pengucapan dan skor Konten ditampilkan.

Skor pengucapan: Skor ini mewakili penilaian agregat dari kualitas pengucapan dan mencakup empat subaspek. Skor ini tersedia di tab baca dan bicara untuk penilaian skrip dan tanpa naskah.

  • Skor akurasi: Mengevaluasi kebenaran pengucapan.
  • Skor kefasihan: Mengukur tingkat kelancaran dan kealamaan dalam ucapan.
  • Skor kelengkapan: Mencerminkan jumlah kata yang diucapkan dengan benar.
  • Skor prosody: Menilai penggunaan intonasi, ritme, dan stres yang sesuai. Beberapa jenis kesalahan lainnya yang terkait dengan penilaian prosody diperkenalkan, seperti Istirahat tak terduga, Istirahat yang hilang, dan Monotone. Jenis kesalahan ini memberikan informasi yang lebih rinci tentang kesalahan pengucapan dibandingkan dengan mesin sebelumnya.

Skor konten: Skor ini memberikan penilaian agregat terhadap konten ucapan dan menyertakan tiga subaspek. Skor ini hanya tersedia di tab berbicara untuk penilaian yang tidak diskrip.

  • Skor kosakata: Mengevaluasi penggunaan kata-kata pembicara yang efektif dan kepatutannya dalam konteks yang diberikan untuk mengekspresikan ide secara akurat, dan tingkat kompleksitas leksikal.
  • Skor tata bahasa: Mengevaluasi kebenaran penggunaan tata bahasa dan berbagai pola kalimat. Ini mempertimbangkan akurasi leksikal, akurasi tata bahasa, dan keragaman struktur kalimat, memberikan evaluasi kecakapan bahasa yang lebih komprehensif.
  • Skor topik: Menilai tingkat pemahaman dan keterlibatan dengan topik yang dibahas dalam ucapan. Ini mengevaluasi kemampuan pembicara untuk mengekspresikan pemikiran dan ide yang terkait dengan topik yang diberikan secara efektif.

Skor keseluruhan ini menawarkan penilaian komprehensif dari pengucapan dan konten, memberikan umpan balik yang berharga kepada pelajar tentang berbagai aspek performa dan pemahaman ucapan mereka. Dengan fitur yang disempurnakan ini, pelajar bahasa dapat memperoleh wawasan yang lebih mendalam tentang keuntungan dan area mereka untuk peningkatan dalam pengucapan dan ekspresi konten.

Catatan

Penilaian konten dan prosody hanya tersedia di lokal en-US .

Skor penilaian dalam mode streaming

Penilaian pengucapan mendukung mode streaming tanpa gangguan. Demo AI Studio memungkinkan hingga 60 menit perekaman dalam mode streaming untuk evaluasi. Selama Anda tidak menekan tombol hentikan perekaman, proses evaluasi tidak selesai dan Anda dapat menjeda dan melanjutkan evaluasi dengan nyaman.

Penilaian pengucapan mengevaluasi beberapa aspek pengucapan. Di bagian bawah hasil Penilaian, Anda dapat melihat skor Pengucapan sebagai skor keseluruhan agregat, yang mencakup 4 sub aspek: Skor akurasi, Skor kefasihan, Skor kelengkapan, dan skor Prosody. Dalam mode streaming, karena skor Akurasi, Skor fluensi, dan skor Prosody akan bervariasi dari waktu ke waktu sepanjang proses rekaman, kami menunjukkan pendekatan di AI Studio untuk menampilkan perkiraan skor keseluruhan secara bertahap sebelum akhir evaluasi, yang hanya ditimbang dengan skor Akurasi, Skor kefasihan, dan skor Prosody. Skor Kelengkapan hanya dihitung pada akhir evaluasi setelah Anda menekan tombol berhenti, sehingga skor keseluruhan pengucapan akhir dikumpulkan dari Skor akurasi, Skor kefasihan, Skor kelengkapan, dan skor Prosody dengan berat.

Lihat contoh demo di bawah ini untuk seluruh proses mengevaluasi pengucapan dalam mode streaming.

Mulai merekam

Saat Anda mulai merekam, skor di bagian bawah mulai berganti dari 0.

Cuplikan layar skor penilaian keseluruhan saat mulai merekam.

Selama perekaman

Selama merekam paragraf panjang, Anda dapat menjeda perekaman kapan saja. Anda dapat terus mengevaluasi rekaman selama Anda tidak menekan tombol berhenti.

Cuplikan layar skor penilaian keseluruhan saat merekam.

Selesaikan perekaman

Setelah menekan tombol berhenti, Anda dapat melihat skor Pengucapan, Skor akurasi, Skor kefasihan, Skor kelengkapan, dan skor Prosody di bagian bawah.

Cuplikan layar skor penilaian keseluruhan setelah perekaman.

Harga

Sebagai garis besar, penggunaan biaya penilaian pengucapan sama dengan ucapan ke teks untuk harga tingkat bayar sesuai penggunaan atau komitmen. Jika Anda membeli tingkat komitmen untuk ucapan ke teks, pengeluaran untuk penilaian pengucapan akan memenuhi komitmen.

Fitur penilaian pengucapan juga menawarkan skor lain yang tidak termasuk dalam garis besar ucapan ke harga teks: prosody, tata bahasa, topik, dan kosakata. Skor ini tersedia sebagai biaya add-on di atas ucapan garis besar ke harga teks. Untuk informasi tentang harga, lihat harga ucapan ke teks.

Berikut adalah tabel skor penilaian pengucapan yang tersedia, apakah tersedia dalam penilaian berskrip atau tidak , dan apakah itu termasuk dalam ucapan dasar ke harga teks atau harga add-on.

Skor Skrip atau tidak diskrip Termasuk dalam ucapan garis besar ke harga teks?
Akurasi Skrip dan tidak diskrip Ya
Kelancaran Skrip dan tidak diskrip Ya
Kelengkapan Terskrip Ya
Salah tuntas Skrip dan tidak diskrip Ya
Prosodi Skrip dan tidak diskrip No
Tatabahasa Tidak diskrip saja No
Topik Tidak diskrip saja No
Kosakata Tidak diskrip saja No

AI yang Bertanggung Jawab

Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang menggunakannya, orang-orang yang akan terpengaruh olehnya, dan lingkungan tempatnya disebarkan. Baca catatan transparansi untuk mempelajari tentang penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda.

Langkah berikutnya