Kontainer identifikasi bahasa dengan Docker

Kontainer identifikasi bahasa Ucapan mendeteksi bahasa yang diucapkan dalam file audio. Anda bisa mendapatkan rekaman audio ucapan atau batch real time dengan hasil perantara. Dalam artikel ini, Anda mempelajari cara mengunduh, menginstal, dan menjalankan kontainer identifikasi bahasa.

Catatan

Kontainer identifikasi bahasa Ucapan tersedia dalam pratinjau publik. Kontainer dalam pratinjau masih dalam pengembangan dan tidak memenuhi persyaratan stabilitas dan dukungan Microsoft.

Untuk informasi selengkapnya tentang prasyarat, memvalidasi bahwa kontainer sedang berjalan, menjalankan beberapa kontainer pada host yang sama, dan menjalankan kontainer yang terputus, lihat Menginstal dan menjalankan kontainer Ucapan dengan Docker.

Tip

Untuk mendapatkan hasil yang paling berguna, gunakan kontainer identifikasi bahasa Ucapan dengan ucapan ke teks atau ucapan kustom ke kontainer teks .

Gambar kontainer

Gambar kontainer identifikasi bahasa Ucapan untuk semua versi dan lokal yang didukung dapat ditemukan pada sindikat Microsoft Container Registry (MCR ). Itu berada di dalam repositori azure-cognitive-services/speechservices/ dan dinamai language-detection.

A screenshot of the search connectors and triggers dialog.

Nama gambar kontainer yang sepenuhnya memenuhi syarat adalah, mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection. Tambahkan versi tertentu atau tambahkan :latest untuk mendapatkan versi terbaru.

Versi Jalur
terbaru mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest
1.12.0 mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:1.12.0-amd64-preview

Semua tag, kecuali latest, berada dalam format berikut dan peka huruf besar/kecil:

<major>.<minor>.<patch>-<platform>-<prerelease>

Tag juga tersedia dalam format JSON untuk kenyamanan Anda. Isinya mencakup jalur kontainer dan daftar tag. Tag tidak diurutkan menurut versi, tetapi "latest" selalu disertakan di akhir daftar seperti yang ditunjukkan dalam cuplikan ini:

{
  "name": "azure-cognitive-services/speechservices/language-detection",
  "tags": [
    "1.1.0-amd64-preview",
    "1.11.0-amd64-preview",
    "1.12.0-amd64-preview",
    "1.3.0-amd64-preview",
    "1.5.0-amd64-preview",
    <--redacted for brevity-->
    "1.8.0-amd64-preview",
    "latest"
  ]
}

Dapatkan gambar kontainer dengan penarikan docker

Anda memerlukan prasyarat termasuk perangkat keras yang diperlukan. Lihat juga alokasi sumber daya yang direkomendasikan untuk setiap kontainer Ucapan.

Gunakan perintah penarikan docker untuk mengunduh citra kontainer dari Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest

Jalankan kontainer dengan docker run

Gunakan perintah eksekusi docker untuk menjalankan kontainer.

Tabel berikut ini menunjukkan berbagai parameter docker run dan deskripsi terkait:

Parameter Deskripsi
{ENDPOINT_URI} Titik akhir diperlukan untuk pengukuran dan penagihan. Untuk informasi selengkapnya, lihat argumen penagihan.
{API_KEY} Kunci API diperlukan. Untuk informasi selengkapnya, lihat argumen penagihan.

Saat Anda menjalankan kontainer identifikasi bahasa Ucapan, konfigurasikan port, memori, dan CPU sesuai dengan persyaratan dan rekomendasi kontainer identifikasi bahasa.

Berikut adalah contoh docker run perintah dengan nilai tempat penampung. Anda harus menentukan ENDPOINT_URI nilai dan API_KEY :

docker run --rm -it -p 5000:5003 --memory 1g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Perintah ini:

  • Menjalankan kontainer identifikasi bahasa Ucapan dari gambar kontainer.
  • Mengalokasikan 1 inti CPU dan memori 1 GB.
  • Mengekspos port TCP 5000 dan mengalokasikan pseudo-TTY untuk kontainer.
  • Menghapus kontainer secara otomatis setelah kontainer keluar. Gambar kontainer masih tersedia di komputer host.

Untuk informasi selengkapnya tentang docker run kontainer Ucapan, lihat Menginstal dan menjalankan kontainer Ucapan dengan Docker.

Jalankan dengan kontainer ucapan ke teks

Jika Anda ingin menjalankan kontainer identifikasi bahasa dengan kontainer ucapan ke teks, Anda dapat menggunakan gambar docker ini. Setelah kedua kontainer dimulai, gunakan perintah ini docker run untuk menjalankan speech-to-text-with-languagedetection-client:

docker run --rm -v ${HOME}:/root -ti antsu/on-prem-client:latest ./speech-to-text-with-languagedetection-client ./audio/LanguageDetection_en-us.wav --host localhost --lport 5003 --sport 5000

Meningkatkan jumlah panggilan bersamaan dapat memengaruhi keandalan dan latensi. Untuk identifikasi bahasa, kami merekomendasikan maksimum empat panggilan bersamaan menggunakan 1 CPU dengan memori 1 GB. Untuk host dengan 2 CPU dan memori 2 GB, kami merekomendasikan maksimum enam panggilan bersamaan.

Gunakan kontainer

Kontainer ucapan menyediakan API titik akhir kueri berbasis websocket yang diakses melalui Speech SDK dan Speech CLI. Secara default, Speech SDK dan Speech CLI menggunakan layanan Ucapan publik. Untuk menggunakan kontainer, Anda perlu mengubah metode inisialisasi.

Penting

Saat Anda menggunakan layanan Ucapan dengan kontainer, pastikan untuk menggunakan autentikasi host. Jika Anda mengonfigurasi kunci dan wilayah, permintaan akan masuk ke layanan Ucapan publik. Hasil dari layanan Ucapan mungkin bukan yang Anda harapkan. Permintaan dari kontainer yang terputus akan gagal.

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

var config = SpeechConfig.FromSubscription(...);

Gunakan konfigurasi ini dengan host kontainer:

var config = SpeechConfig.FromHost(
    new Uri("http://localhost:5000"));

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

auto speechConfig = SpeechConfig::FromSubscription(...);

Gunakan konfigurasi ini dengan host kontainer:

auto speechConfig = SpeechConfig::FromHost("http://localhost:5000");

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

speechConfig, err := speech.NewSpeechConfigFromSubscription(...)

Gunakan konfigurasi ini dengan host kontainer:

speechConfig, err := speech.NewSpeechConfigFromHost("http://localhost:5000")

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

SpeechConfig speechConfig = SpeechConfig.fromSubscription(...);

Gunakan konfigurasi ini dengan host kontainer:

SpeechConfig speechConfig = SpeechConfig.fromHost("http://localhost:5000");

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

const speechConfig = sdk.SpeechConfig.fromSubscription(...);

Gunakan konfigurasi ini dengan host kontainer:

const speechConfig = sdk.SpeechConfig.fromHost("http://localhost:5000");

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithSubscription:...];

Gunakan konfigurasi ini dengan host kontainer:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithHost:"http://localhost:5000"];

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

let speechConfig = SPXSpeechConfiguration(subscription: "", region: "");

Gunakan konfigurasi ini dengan host kontainer:

let speechConfig = SPXSpeechConfiguration(host: "http://localhost:5000");

Alih-alih menggunakan konfigurasi inisialisasi Azure-cloud ini:

speech_config = speechsdk.SpeechConfig(
    subscription=speech_key, region=service_region)

Gunakan konfigurasi ini dengan titik akhir kontainer:

speech_config = speechsdk.SpeechConfig(
    host="http://localhost:5000")

Saat Anda menggunakan Speech CLI dalam kontainer, sertakan --host http://localhost:5000/ opsi . Anda juga harus menentukan --key none untuk memastikan bahwa CLI tidak mencoba menggunakan kunci Ucapan untuk autentikasi. Untuk informasi tentang cara mengonfigurasi Speech CLI, lihat Mulai menggunakan Azure AI Speech CLI.

Coba identifikasi bahasa menggunakan autentikasi host alih-alih kunci dan wilayah. Saat Anda menjalankan ID bahasa dalam kontainer, gunakan SourceLanguageRecognizer objek alih-alih SpeechRecognizer atau TranslationRecognizer.

Langkah berikutnya