Kontainer teks ke ucapan dengan Docker

Artikel
01/22/2024

Kontainer teks neural ke ucapan mengonversi teks menjadi ucapan yang terdengar alami dengan menggunakan teknologi jaringan neural mendalam, yang memungkinkan ucapan yang disintesis yang lebih alami. Dalam artikel ini, Anda mempelajari cara mengunduh, menginstal, dan menjalankan kontainer Teks ke ucapan.

Untuk informasi selengkapnya tentang prasyarat, memvalidasi bahwa kontainer sedang berjalan, menjalankan beberapa kontainer pada host yang sama, dan menjalankan kontainer yang terputus, lihat Menginstal dan menjalankan kontainer Ucapan dengan Docker.

Gambar kontainer

Gambar kontainer teks neural ke ucapan untuk semua versi dan lokal yang didukung dapat ditemukan pada sindikat Microsoft Container Registry (MCR ). Itu berada di dalam repositori azure-cognitive-services/speechservices/ dan dinamai neural-text-to-speech.

Nama gambar kontainer yang sepenuhnya memenuhi syarat adalah, mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech. Tambahkan versi tertentu atau tambahkan :latest untuk mendapatkan versi terbaru.

Versi	Jalur
terbaru	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` `latest`Tag menarik lokal `en-US` dan suara `en-us-arianeural`.
3.1.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.1.0-amd64-en-us-arianeural`

Semua tag, kecuali latest, berada dalam format berikut dan peka huruf besar/kecil:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

Tag juga tersedia dalam format JSON untuk kenyamanan Anda. Isinya mencakup jalur kontainer dan daftar tag. Tag tidak diurutkan menurut versi, tetapi "latest" selalu disertakan di akhir daftar seperti yang ditunjukkan dalam cuplikan ini:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.1.0-amd64-en-us-arianeural",
    "3.1.0-amd64-en-us-guyneural",
    "3.1.0-amd64-en-us-jennymultilingualneural",
    "3.1.0-amd64-en-us-jennyneural",
    "3.1.0-amd64-en-us-michelleneural",
    "3.1.0-amd64-es-es-alvaroneural",
    "3.1.0-amd64-es-es-elviraneural",
    "3.1.0-amd64-es-mx-candelaneural",
    "3.1.0-amd64-es-mx-dalianeural",
    "3.1.0-amd64-es-mx-jorgeneural",
    <--redacted for brevity-->
    "latest"
  ]
}

Penting

Kami menghentikan suara sintesis ucapan standar dan kontainer teks ke ucapan standar pada 31 Agustus 2021. Anda harus menggunakan suara neural dengan kontainer neural-text-to-speech versi 3.0 dan yang lebih tinggi.

Mulai 29 Februari 2024, teks ke teks ucapan dan teks neural ke kontainer ucapan versi 2.19 dan yang lebih lama tidak didukung. Untuk informasi selengkapnya tentang memperbarui aplikasi Anda, lihat Bermigrasi dari suara standar ke suara neural bawaan.

Dapatkan gambar kontainer dengan penarikan docker

Anda memerlukan prasyarat termasuk perangkat keras yang diperlukan. Lihat juga alokasi sumber daya yang direkomendasikan untuk setiap kontainer Ucapan.

Gunakan perintah penarikan docker untuk mengunduh citra kontainer dari Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Penting

latestTag menarik lokal en-US dan suara en-us-arianeural. Untuk lokal dan suara tambahan, lihat gambar kontainer teks ke ucapan.

Jalankan kontainer dengan docker run

Gunakan perintah eksekusi docker untuk menjalankan kontainer.

Teks neural ke ucapan
Teks neural terputus ke ucapan

Tabel berikut ini menunjukkan berbagai parameter docker run dan deskripsi terkait:

Parameter	Deskripsi
`{ENDPOINT_URI}`	Titik akhir diperlukan untuk pengukuran dan penagihan. Untuk informasi selengkapnya, lihat argumen penagihan.
`{API_KEY}`	Kunci API diperlukan. Untuk informasi selengkapnya, lihat argumen penagihan.

Saat Anda menjalankan kontainer teks ke ucapan, konfigurasikan port, memori, dan CPU sesuai dengan persyaratan dan rekomendasi kontainer teks ke ucapan.

Berikut adalah contoh docker run perintah dengan nilai tempat penampung. Anda harus menentukan ENDPOINT_URI nilai dan API_KEY :

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Perintah ini:

Menjalankan teks neural ke kontainer ucapan dari gambar kontainer.
Mengalokasikan 6 inti CPU dan memori 12 GB.
Mengekspos port TCP 5000 dan mengalokasikan pseudo-TTY untuk kontainer.
Menghapus kontainer secara otomatis setelah kontainer keluar. Gambar kontainer masih tersedia di komputer host.

Untuk menjalankan kontainer yang terputus (tidak tersambung ke internet), Anda harus mengirimkan formulir permintaan ini dan menunggu persetujuan. Untuk informasi selengkapnya tentang menerapkan dan membeli rencana komitmen untuk menggunakan kontainer di lingkungan yang terputus, lihat Menggunakan kontainer di lingkungan yang terputus dalam dokumentasi layanan Azure AI.

Jika Anda disetujui untuk menjalankan kontainer yang terputus dari internet, contoh berikut menunjukkan pemformatan perintah yang docker run akan digunakan, dengan nilai tempat penampung. Ganti nilai tempat penampung dengan nilai Anda sendiri.

Parameter DownloadLicense=True dalam perintah Anda docker run mengunduh file lisensi untuk memungkinkan kontainer Docker Anda berjalan saat tidak tersambung ke internet. Ini juga berisi tanggal kedaluwarsa, setelah itu file lisensi tidak valid untuk menjalankan kontainer. Anda hanya dapat menggunakan file lisensi dengan kontainer yang sesuai yang disetujui. Misalnya, Anda tidak dapat menggunakan file lisensi untuk speech-to-text kontainer dengan neural-text-to-speech kontainer.

Placeholder	Deskripsi
`{IMAGE}`	Gambar kontainer yang ingin Anda gunakan. Misalnya: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	Jalur tempat lisensi diunduh, dan dipasang. Misalnya: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	Titik akhir untuk mengautentikasi permintaan layanan Anda. Anda dapat menemukannya di halaman Kunci dan titik akhir sumber daya, di portal Azure. Misalnya: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Kunci untuk sumber daya Ucapan Anda. Anda dapat menemukannya di halaman Kunci dan titik akhir sumber daya, di portal Azure.
`{CONTAINER_LICENSE_DIRECTORY}`	Lokasi folder lisensi pada filesystem lokal kontainer. Misalnya: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Setelah file lisensi diunduh, Anda dapat menjalankan kontainer di lingkungan yang terputus. Contoh berikut menunjukkan pemformatan perintah yang docker run Anda gunakan, dengan nilai tempat penampung. Ganti nilai tempat penampung dengan nilai Anda sendiri.

Di mana pun kontainer dijalankan, file lisensi harus dipasang ke kontainer dan lokasi folder lisensi pada sistem file lokal kontainer harus ditentukan dengan Mounts:License=. Mount output juga harus ditentukan sehingga catatan penggunaan penagihan dapat ditulis.

Placeholder	Nilai	Format atau contoh
`{IMAGE}`	Gambar kontainer yang ingin Anda gunakan. Misalnya: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	Ukuran memori yang sesuai untuk dialokasikan untuk kontainer Anda. Misalnya: `4g`
`{NUMBER_CPUS}`	Jumlah CPU yang sesuai untuk dialokasikan untuk kontainer Anda. Misalnya: `4`
`{LICENSE_MOUNT}`	Jalur tempat lisensi berada dan dipasang. Misalnya: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	Jalur output untuk pengelogan. Misalnya: `/host/output:/path/to/output/directory` Untuk informasi selengkapnya, lihat catatan penggunaan dalam dokumentasi layanan Azure AI.
`{CONTAINER_LICENSE_DIRECTORY}`	Lokasi folder lisensi pada filesystem lokal kontainer. Misalnya: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Lokasi folder output pada filesystem lokal kontainer. Misalnya: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Kontainer ucapan menyediakan direktori default untuk menulis file lisensi dan log penagihan saat runtime. Direktori default masing-masing adalah /license dan /output.

Saat Anda memasang direktori ini ke kontainer dengan perintah docker run -v, pastikan direktori mesin lokal diatur kepemilikannya ke user:group nonroot:nonroot sebelum menjalankan kontainer.

Berikut adalah contoh perintah untuk mengatur kepemilikan file/direktori.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Untuk informasi selengkapnya tentang docker run kontainer Ucapan, lihat Menginstal dan menjalankan kontainer Ucapan dengan Docker.

Gunakan kontainer

Kontainer ucapan menyediakan API titik akhir kueri berbasis websocket yang diakses melalui Speech SDK dan Speech CLI. Secara default, Speech SDK dan Speech CLI menggunakan layanan Ucapan publik. Untuk menggunakan kontainer, Anda perlu mengubah metode inisialisasi.

Penting

Saat Anda menggunakan layanan Ucapan dengan kontainer, pastikan untuk menggunakan autentikasi host. Jika Anda mengonfigurasi kunci dan wilayah, permintaan akan masuk ke layanan Ucapan publik. Hasil dari layanan Ucapan mungkin bukan yang Anda harapkan. Permintaan dari kontainer yang terputus akan gagal.