Mengunggah himpunan data pelatihan dan pengujian untuk Ucapan Kustom

Anda memerlukan data audio atau teks untuk menguji akurasi pengenalan ucapan Microsoft atau melatih model kustom Anda. Untuk informasi tentang jenis data yang didukung untuk menguji atau melatih model Anda, lihat Pelatihan dan pengujian himpunan data.

Tip

Anda juga dapat menggunakan editor transkripsi online untuk membuat dan memperbaiki himpunan data audio berlabel.

Mengunggah himpunan data

Untuk mengunggah himpunan data Anda sendiri di Speech Studio, ikuti langkah-langkah berikut:

  1. Masuk ke Speech Studio.
  2. Pilih Unggah data> Himpunan data Ucapan >Nama proyek Anda>Ucapan Kustom.
  3. Pilih tab Data pelatihan atau Data pengujian.
  4. Pilih jenis himpunan data, lalu pilih Berikutnya.
  5. Tentukan lokasi himpunan data, lalu pilih Berikutnya. Anda dapat memilih file lokal atau memasukkan lokasi jarak jauh seperti URL akses publik Azure Blob.
  6. Masukkan nama dan deskripsi himpunan data, lalu pilih Berikutnya.
  7. Tinjau pengaturan Anda, lalu pilih Simpan dan tutup.

Setelah himpunan data Anda diunggah, buka halaman Latih model kustom untuk melatih model kustom

Dengan CLI Azure Cognitive Service untuk Ucapan dan REST API Ucapan ke teks v3.0, tidak seperti Studio Azure Cognitive Service untuk Ucapan, Anda tidak memilih apakah kumpulan data untuk pengujian atau pelatihan pada saat mengunggah. Anda menentukan bagaimana himpunan data digunakan saat Anda melatih model atau menjalankan pengujian.

Meskipun Anda tidak menunjukkan apakah himpunan data tersebut untuk pengujian atau pelatihan, Anda harus menentukan jenis himpunan data tersebut. Jenis himpunan data digunakan untuk menentukan jenis himpunan data yang dibuat. Dalam beberapa kasus, jenis himpunan data hanya digunakan untuk pengujian atau pelatihan, tetapi Anda tidak boleh bergantung padanya. Nilai CLI dan REST API Azure Cognitive Service untuk Ucapan kind sesuai dengan opsi di Studio Azure Cognitive Service untuk Ucapan seperti yang dijelaskan dalam tabel berikut:

Jenis CLI dan API Opsi Studio Azure Cognitive Service untuk Ucapan
Akustik Data pelatihan: Audio + transkrip berlabel manusia
Data pengujian: Transkrip (sintesis audio otomatis)
Data pengujian: Audio + transkrip berlabel manusia
AudioFiles Data pengujian: Audio
Bahasa Data pelatihan: Teks biasa
Pengucapan Data pelatihan: Pengucapan

Catatan

Teks terstruktur dalam himpunan data pelatihan format markdown tidak didukung oleh CLI Azure Cognitive Service untuk Ucapan atau REST API Ucapan ke teks v3.0.

Untuk membuat himpunan data dan menyambungkannya ke proyek yang ada, gunakan perintah spx csr dataset create. Buat parameter permintaan sesuai dengan instruksi berikut:

  • Atur parameter project ke ID proyek yang ada. Ini direkomendasikan agar Anda juga dapat melihat dan mengelola himpunan data di Studio Azure Cognitive Service untuk Ucapan. Anda dapat menjalankan perintah spx csr project list untuk mendapatkan proyek yang tersedia.
  • Atur parameter kind yang diperlukan. Kumpulan nilai yang mungkin untuk jenis himpunan data adalah: Bahasa, Akustik, Pengucapan, dan AudioFiles.
  • Atur parameter contentUrl yang diperlukan. Ini adalah lokasi himpunan data.
  • Atur parameter language yang diperlukan. Lokal himpunan data harus cocok dengan lokal proyek. Lokal tidak dapat diubah nanti. Parameter language Speech CLI sesuai dengan properti locale dalam permintaan dan respons JSON.
  • Atur parameter name yang diperlukan. Ini adalah nama yang akan ditampilkan di Speech Studio. Parameter name Speech CLI sesuai dengan properti displayName dalam permintaan dan respons JSON.

Berikut adalah contoh perintah CLI Azure Cognitive Service untuk Ucapan yang membuat himpunan data dan menyambungkannya ke proyek yang sudah ada:

spx csr dataset create --kind "Acoustic" --name "My Acoustic Dataset" --description "My Acoustic Dataset Description" --project YourProjectId --content YourContentUrl --language "en-US"

Anda akan menerima isi respons dalam format berikut:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Properti self tingkat atas di isi respons adalah URI himpunan data. Gunakan URI ini untuk mendapatkan detail tentang proyek dan file himpunan data. Anda juga menggunakan URI ini untuk memperbarui atau menghapus himpunan data.

Untuk bantuan CLI Azure Cognitive Service untuk Ucapan dengan himpunan data, jalankan perintah berikut:

spx help csr dataset

Dengan CLI Azure Cognitive Service untuk Ucapan dan REST API Ucapan ke teks v3.0, tidak seperti Studio Azure Cognitive Service untuk Ucapan, Anda tidak memilih apakah kumpulan data untuk pengujian atau pelatihan pada saat mengunggah. Anda menentukan bagaimana himpunan data digunakan saat Anda melatih model atau menjalankan pengujian.

Meskipun Anda tidak menunjukkan apakah himpunan data tersebut untuk pengujian atau pelatihan, Anda harus menentukan jenis himpunan data tersebut. Jenis himpunan data digunakan untuk menentukan jenis himpunan data yang dibuat. Dalam beberapa kasus, jenis himpunan data hanya digunakan untuk pengujian atau pelatihan, tetapi Anda tidak boleh bergantung padanya. Nilai CLI dan REST API Azure Cognitive Service untuk Ucapan kind sesuai dengan opsi di Studio Azure Cognitive Service untuk Ucapan seperti yang dijelaskan dalam tabel berikut:

Jenis CLI dan API Opsi Studio Azure Cognitive Service untuk Ucapan
Akustik Data pelatihan: Audio + transkrip berlabel manusia
Data pengujian: Transkrip (sintesis audio otomatis)
Data pengujian: Audio + transkrip berlabel manusia
AudioFiles Data pengujian: Audio
Bahasa Data pelatihan: Teks biasa
Pengucapan Data pelatihan: Pengucapan

Catatan

Teks terstruktur dalam himpunan data pelatihan format markdown tidak didukung oleh CLI Azure Cognitive Service untuk Ucapan atau REST API Ucapan ke teks v3.0.

Untuk membuat himpunan data dan menyambungkannya ke proyek yang ada, gunakan operasi CreateDataset dari REST API Ucapan ke teks v3.0. Buat isi permintaan sesuai dengan instruksi berikut:

  • Atur properti project ke URI proyek yang ada. Ini direkomendasikan agar Anda juga dapat melihat dan mengelola himpunan data di Studio Azure Cognitive Service untuk Ucapan. Anda dapat membuat permintaan GetProjects untuk mendapatkan proyek yang tersedia.
  • Atur properti kind yang diperlukan. Kumpulan nilai yang mungkin untuk jenis himpunan data adalah: Bahasa, Akustik, Pengucapan, dan AudioFiles.
  • Atur properti contentUrl yang diperlukan. Ini adalah lokasi himpunan data.
  • Atur properti locale yang diperlukan. Lokal himpunan data harus cocok dengan lokal proyek. Lokal tidak dapat diubah nanti.
  • Atur properti displayName yang diperlukan. Ini adalah nama yang akan ditampilkan di Speech Studio.

Buat permintaan HTTP POST menggunakan URI seperti yang ditunjukkan dalam contoh berikut. Ganti YourSubscriptionKey dengan kunci sumber daya Ucapan Anda, ganti YourServiceRegion dengan wilayah sumber daya Ucapan Anda, dan atur properti isi permintaan seperti yang dijelaskan sebelumnya.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "kind": "Acoustic",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description",
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "locale": "en-US",
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.0/datasets"

Anda akan menerima isi respons dalam format berikut:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Properti self tingkat atas di isi respons adalah URI himpunan data. Gunakan URI ini untuk mendapatkan detail tentang proyek dan file himpunan data. Anda juga menggunakan URI ini untuk memperbarui atau menghapus himpunan data.

Penting

Menyambungkan himpunan data ke proyek Ucapan Kustom tidak diperlukan untuk melatih dan menguji model kustom menggunakan REST API atau Speech CLI. Namun jika himpunan data tidak tersambung ke proyek apa pun, Anda tidak dapat memilihnya untuk pelatihan atau pengujian di Studio Azure Cognitive Service untuk Ucapan.

Langkah berikutnya