Lite suara saraf kustom (pratinjau)

Artikel
01/18/2024

Speech Studio menyediakan dua jenis proyek suara saraf kustom (CNV): CNV lite dan profesional CNV.

Profesional suara neural kustom (CNV) memungkinkan Anda mengunggah data pelatihan yang dikumpulkan melalui studio rekaman profesional dan membuat suara berkualitas lebih tinggi yang hampir tidak dapat dibedakan dari sampel manusianya. Akses profesional CNV terbatas berdasarkan kriteria kelayakan dan penggunaan. Minta akses pada formulir intake.
Suara neural kustom (CNV) lite adalah jenis proyek dalam pratinjau publik. Anda dapat mendemosikan dan mengevaluasi suara neural kustom sebelum berinvestasi dalam rekaman profesional untuk membuat suara berkualitas lebih tinggi. Tidak diperlukan aplikasi. Microsoft membatasi dan memilih sampel perekaman dan pengujian untuk digunakan dengan CNV lite. Anda harus mengajukan permohonan akses penuh ke profesional CNV untuk menyebarkan dan menggunakan model lite CNV untuk tujuan bisnis.

Dengan proyek lite CNV, Anda merekam suara Anda secara online dengan membaca 20-50 skrip yang telah ditentukan sebelumnya yang disediakan oleh Microsoft. Setelah Anda merekam setidaknya 20 sampel, Anda dapat mulai melatih model. Setelah model berhasil dilatih, Anda dapat meninjau model dan memeriksa 20 sampel output yang dihasilkan dengan set skrip yang telah ditentukan sebelumnya.

Lihat bahasa yang didukung untuk suara neural kustom.

Membandingkan jenis proyek

Tabel berikut ini meringkas perbedaan utama antara jenis proyek profesional CNV lite dan CNV.

Item	Lite (Pratinjau)	Pro
Skenario target	Demonstrasi atau evaluasi	Skenario profesional seperti suara merek dan karakter untuk bot obrolan, atau pembacaan konten audio.
Data pelatihan	Rekam secara online menggunakan Speech Studio	Bawa data Anda. Perekaman di studio profesional disarankan.
Skrip untuk perekaman	Disediakan di Speech Studio	Gunakan skrip Anda sendiri yang sesuai dengan skenario kasus penggunaan. Microsoft menyediakan skrip contoh untuk referensi.
Ukuran data yang diperlukan	20-50 ucapan	300-2000 ucapan
Waktu Pelatihan	Kurang dari satu jam komputasi	Sekitar 20-40 jam komputasi
Kualitas suara	Kualitas sedang	Kualitas tinggi
Ketersediaan	Siapa pun dapat merekam sampel secara online dan melatih model untuk tujuan demo dan evaluasi. Akses penuh ke suara neural kustom diperlukan jika Anda ingin menyebarkan model lite CNV untuk penggunaan bisnis.	Unggahan data tidak dibatasi, tetapi Anda hanya dapat melatih dan menyebarkan model profesional CNV setelah akses disetujui. Akses profesional CNV terbatas berdasarkan kriteria kelayakan dan penggunaan. Minta akses pada formulir intake.
Harga	Harga per unit berlaku sama untuk proyek profesional CNV lite dan CNV. Periksa detail harganya di sini.	Harga per unit berlaku sama untuk proyek profesional CNV lite dan CNV. Periksa detail harganya di sini.

Membuat proyek lite suara saraf kustom

Untuk membuat proyek lite suara neural kustom, ikuti langkah-langkah berikut:

Masuk ke Speech Studio.
Pilih langganan dan sumber Ucapan untuk digunakan.

Penting

Pelatihan suara neural kustom saat ini hanya tersedia di beberapa wilayah. Lihat catatan kaki di tabel wilayah untuk informasi selengkapnya.
Pilih Suara>kustom Buat proyek.
Pilih Suara neural kustom bohong>Berikutnya.

Catatan

Untuk membuat proyek Pro suara saraf kustom, lihat Membuat proyek untuk suara neural kustom.
Ikuti instruksi yang diberikan oleh wizard untuk membuat proyek Anda.
Pilih proyek baru berdasarkan nama atau pilih Buka proyek. Anda melihat item menu ini di panel kiri: Rekam dan bangun, Tinjau model, dan Sebarkan model.

Proyek lite CNV kedaluwarsa setelah 90 hari kecuali pernyataan verbal yang direkam oleh bakat suara dikirimkan.

Merekam dan membangun model lite CNV

Rekam setidaknya 20 sampel suara (hingga 50) dengan skrip yang disediakan secara online. Sampel suara yang direkam di sini digunakan untuk membuat versi sintetis suara Anda.

Berikut adalah beberapa tips untuk membantu Anda merekam sampel suara Anda:

Gunakan mikrofon yang baik. Tingkatkan kejelasan sampel Anda dengan menggunakan mikrofon berkualitas tinggi. Bicaralah sekitar 8 inci jauhnya dari mikrofon untuk menghindari suara mulut.
Hindari kebisingan latar belakang. Rekam di ruangan yang tenang tanpa kebisingan latar belakang atau gema.
Santai dan bicaralah secara alami. Izinkan diri Anda untuk mengekspresikan emosi saat Anda membaca kalimat.
Rekor dalam sekali ambil. Untuk menjaga tingkat energi yang konsisten, rekam semua kalimat dalam satu sesi.
Ucapkan setiap kata dengan benar, dan ucapkan dengan jelas.

Untuk merekam dan membangun model lite CNV, ikuti langkah-langkah berikut:

Pilih Suara> kustom Nama >proyek Anda Rekam dan bangun.
Pilih Mulai.
Baca ketentuan penggunaan talenta Voice dengan hati-hati. Pilih kotak centang untuk mengakui ketentuan penggunaan.
Pilih Terima
Tekan ikon mikrofon untuk memulai pemeriksaan kebisingan. Pemeriksaan kebisingan ini hanya membutuhkan waktu beberapa detik, dan Anda tidak perlu berbicara selama itu.
Jika kebisingan terdeteksi, Anda dapat memilih Periksa lagi untuk mengulangi pemeriksaan kebisingan. Jika tidak ada kebisingan yang terdeteksi, Anda dapat memilih Selesai untuk melanjutkan ke langkah berikutnya.
Tinjau tips perekaman dan pilih Dapatkan. Untuk hasil terbaik, buka area tenang tanpa kebisingan latar belakang sebelum merekam sampel suara Anda.
Tekan ikon mikrofon untuk mulai merekam.
Tekan ikon berhenti untuk menghentikan perekaman.
Tinjau metrik kualitas. Setelah merekam setiap sampel, periksa metrik kualitasnya sebelum melanjutkan ke sampel berikutnya.
Rekam lebih banyak sampel. Meskipun Anda dapat membuat model hanya dengan 20 sampel, disarankan agar Anda merekam hingga 50 untuk mendapatkan kualitas yang lebih baik.
Pilih Latih model untuk memulai proses pelatihan.

Proses pelatihan membutuhkan waktu sekitar satu jam komputasi. Anda dapat memeriksa kemajuan proses pelatihan di halaman Tinjau model .

Meninjau model

Untuk meninjau model lite CNV dan mendengarkan suara sintetis Anda sendiri, ikuti langkah-langkah berikut:

Pilih Suara> kustom Nama >proyek Anda Tinjau model. Di sini Anda dapat meninjau nama model suara, bahasa model, ukuran data sampel, dan kemajuan pelatihan. Nama suara terdiri dari kata "Neural" ditambahkan ke nama proyek Anda.
Pilih nama model suara untuk meninjau detail model dan mendengarkan teks sampel ke hasil ucapan.
Pilih ikon putar untuk mendengar suara Anda mengucapkan setiap skrip.

Kirim pernyataan verbal

Pernyataan verbal yang direkam oleh bakat suara diperlukan sebelum Anda dapat menyebarkan model untuk penggunaan bisnis Anda.

Untuk mengirimkan pernyataan verbal talenta suara, ikuti langkah-langkah berikut:

Pilih Suara> kustom Nama> proyek Anda Sebarkan model>Kelola bakat suara Anda.
Pilih model.
Masukkan nama bakat suara dan nama perusahaan.
Membaca dan merekam pernyataan. Pilih ikon mikrofon untuk mulai merekam. Pilih ikon berhenti untuk menghentikan perekaman.
Pilih Kirim untuk mengirimkan pernyataan.
Periksa status pemrosesan dalam tabel skrip di bagian bawah dasbor. Setelah status Berhasil, Anda dapat menyebarkan model.

Menyebarkan model

Untuk menyebarkan model suara dan menggunakannya di aplikasi, Anda harus mendapatkan akses penuh ke suara saraf kustom. Minta akses pada formulir intake. Dalam waktu sekitar 10 hari kerja, Anda menerima email dengan status persetujuan. Pernyataan verbal yang direkam oleh bakat suara juga diperlukan sebelum Anda dapat menyebarkan model untuk penggunaan bisnis Anda.

Untuk menyebarkan model lite CNV, ikuti langkah-langkah berikut:

Pilih Suara> kustom Nama> proyek Anda Sebarkan model Sebarkan model>.
Pilih nama model suara lalu pilih Berikutnya.
Masukkan nama dan deskripsi untuk titik akhir Anda lalu pilih Berikutnya.
Pilih kotak centang untuk menyetujui ketentuan penggunaan lalu pilih Berikutnya.
Pilih Sebarkan untuk menyebarkan model.

Dari sini, Anda dapat menggunakan model suara lite CNV sama seperti Anda akan menggunakan model suara profesional CNV. Misalnya, Anda dapat menangguhkan atau melanjutkan titik akhir setelah dibuat, untuk membatasi pengeluaran dan menghemat sumber daya yang tidak digunakan. Anda juga dapat mengakses suara di alat Pembuatan Konten Audio di Speech Studio.