speech Paket

Microsoft Speech SDK untuk Python

Modul

audio

Kelas yang berkaitan dengan penanganan input audio ke berbagai pengenal, dan output audio dari synthesizer ucapan.

dialog

Kelas yang terkait dengan konektor layanan dialog.

enums

Microsoft Speech SDK untuk Python

intent

Kelas yang terkait dengan pengenalan niat dari ucapan.

interop

Microsoft Speech SDK untuk Python

languageconfig

Kelas yang berkaitan dengan penanganan konfigurasi bahasa

properties

Microsoft Speech SDK untuk Python

speech

Kelas yang terkait dengan mengenali teks dari ucapan, mensintesis ucapan dari teks, dan kelas umum yang digunakan dalam berbagai pengenal.

transcription

Kelas yang terkait dengan transkripsi percakapan.

translation

Kelas yang terkait dengan terjemahan ucapan ke bahasa lain.

version

Microsoft Speech SDK untuk Python

Kelas

AudioDataStream

Mewakili aliran data audio yang digunakan untuk mengoperasikan data audio sebagai aliran.

Menghasilkan aliran data audio dari hasil sintesis ucapan (ketik SpeechSynthesisResult) atau hasil pengenalan kata kunci (ketik KeywordRecognitionResult).

AutoDetectSourceLanguageResult

Mewakili hasil bahasa sumber deteksi otomatis.

Hasilnya dapat diinisialisasi dari hasil pengenalan ucapan.

CancellationDetails

Microsoft Speech SDK untuk Python

Connection

Kelas proksi untuk mengelola koneksi ke layanan ucapan dari yang ditentukan Recognizer.

Secara default, secara Recognizer otonom mengelola koneksi ke layanan saat diperlukan. Kelas ini Connection menyediakan metode tambahan bagi pengguna untuk secara eksplisit membuka atau menutup koneksi dan berlangganan perubahan status koneksi. Penggunaan Connection bersifat opsional. Ini ditujukan untuk skenario di mana penyempurnaan perilaku aplikasi berdasarkan status koneksi diperlukan. Pengguna dapat secara opsional memanggil open untuk memulai koneksi layanan secara manual sebelum memulai pengenalan pada yang Recognizer terkait dengan ini Connection. Setelah memulai pengenalan open , panggilan atau close mungkin gagal. Ini tidak akan berdampak pada Recognizer atau pengenalan yang sedang berlangsung. Koneksi mungkin hilang karena berbagai alasan, Recognizer akan selalu mencoba untuk mengganti koneksi sebagaimana diperlukan untuk menjamin operasi yang sedang berlangsung. Dalam semua kasus connected/disconnected ini, peristiwa akan menunjukkan perubahan status koneksi.

Catatan

Diperbarui dalam versi 1.17.0.

Konstruktor untuk penggunaan internal.

ConnectionEventArgs

Menyediakan data untuk ConnectionEvent.

Catatan

Ditambahkan dalam versi 1.2.0

Konstruktor untuk penggunaan internal.

EventSignal

Klien dapat terhubung ke sinyal peristiwa untuk menerima peristiwa, atau memutuskan sambungan dari sinyal peristiwa untuk berhenti menerima peristiwa.

Konstruktor untuk penggunaan internal.

KeywordRecognitionEventArgs

Kelas untuk argumen peristiwa pengenalan kata kunci.

Konstruktor untuk penggunaan internal.

KeywordRecognitionModel

Mewakili model pengenalan kata kunci.

KeywordRecognitionResult

Hasil operasi pengenalan kata kunci.

Konstruktor untuk penggunaan internal.

KeywordRecognizer

Pengenal kata kunci.

NoMatchDetails

Microsoft Speech SDK untuk Python

PhraseListGrammar

Kelas yang memungkinkan penambahan runtime petunjuk frasa untuk membantu pengenalan ucapan.

Frasa yang ditambahkan ke pengenal efektif pada awal pengenalan berikutnya, atau lain kali pengenal ucapan harus terhubung kembali ke layanan ucapan.

Catatan

Ditambahkan dalam versi 1.5.0.

Konstruktor untuk penggunaan internal.

PronunciationAssessmentConfig

Mewakili konfigurasi penilaian pengucapan

Catatan

Ditambahkan dalam versi 1.14.0.

Konfigurasi dapat diinisialisasi dengan dua cara:

  • dari parameter: meneruskan teks referensi, sistem penilaian, granularitas, mengaktifkan kesalahan tindakan dan id skenario.

  • dari json: meneruskan string json

Untuk detail parameter, lihat https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

Berisi hasil penilaian pengucapan tingkat fonem

Catatan

Ditambahkan dalam versi 1.14.0.

PronunciationAssessmentResult

Mewakili hasil penilaian pengucapan.

Catatan

Ditambahkan dalam versi 1.14.0.

Hasilnya dapat diinisialisasi dari hasil pengenalan ucapan.

PronunciationAssessmentWordResult

Berisi hasil penilaian pengucapan tingkat kata

Catatan

Ditambahkan dalam versi 1.14.0.

PropertyCollection

Kelas untuk mengambil atau mengatur nilai properti dari koleksi properti.

RecognitionEventArgs

Menyediakan data untuk RecognitionEvent.

Konstruktor untuk penggunaan internal.

RecognitionResult

Informasi terperinci tentang hasil operasi pengenalan.

Konstruktor untuk penggunaan internal.

Recognizer

Kelas dasar untuk pengenal yang berbeda

ResultFuture

Hasil dari operasi asinkron.

konstruktor privat

SessionEventArgs

Kelas dasar untuk argumen peristiwa sesi.

Konstruktor untuk penggunaan internal.

SourceLanguageRecognizer

Pengenal bahasa sumber - pengenal bahasa mandiri, dapat digunakan untuk deteksi bahasa tunggal atau bahasa berkelanjutan.

Catatan

Ditambahkan dalam versi 1.18.0.

SpeechConfig

Kelas yang menentukan konfigurasi untuk pengenalan ucapan/niat dan sintesis ucapan.

Konfigurasi dapat diinisialisasi dengan cara yang berbeda:

  • dari langganan: meneruskan kunci langganan dan wilayah

  • dari titik akhir: meneruskan titik akhir. Kunci langganan atau token otorisasi bersifat opsional.

  • dari host: teruskan alamat host. Kunci langganan atau token otorisasi bersifat opsional.

  • dari token otorisasi: meneruskan token otorisasi dan wilayah

SpeechRecognitionCanceledEventArgs

Kelas untuk pengenalan ucapan membatalkan argumen peristiwa.

Konstruktor untuk penggunaan internal.

SpeechRecognitionEventArgs

Kelas untuk argumen peristiwa pengenalan ucapan.

Konstruktor untuk penggunaan internal.

SpeechRecognitionResult

Kelas dasar untuk hasil pengenalan ucapan.

Konstruktor untuk penggunaan internal.

SpeechRecognizer

Pengenal ucapan. Jika Anda perlu menentukan informasi bahasa sumber, tentukan salah satu dari tiga parameter, bahasa, source_language_config, atau auto_detect_source_language_config ini.

SpeechSynthesisBookmarkEventArgs

Kelas untuk argumen peristiwa bookmark sintesis ucapan.

Catatan

Ditambahkan dalam versi 1.16.0.

Konstruktor untuk penggunaan internal.

SpeechSynthesisCancellationDetails

Berisi informasi terperinci tentang mengapa hasil dibatalkan.

SpeechSynthesisEventArgs

Kelas untuk argumen peristiwa sintesis ucapan.

Konstruktor untuk penggunaan internal.

SpeechSynthesisResult

Hasil operasi sintesis ucapan.

Konstruktor untuk penggunaan internal.

SpeechSynthesisVisemeEventArgs

Kelas untuk argumen peristiwa viseme sintesis ucapan.

Catatan

Ditambahkan dalam versi 1.16.0.

Konstruktor untuk penggunaan internal.

SpeechSynthesisWordBoundaryEventArgs

Kelas untuk argumen peristiwa batas kata sintesis ucapan.

Catatan

Diperbarui dalam versi 1.21.0.

Konstruktor untuk penggunaan internal.

SpeechSynthesizer

Penyintesis ucapan.

SyllableLevelTimingResult

Berisi hasil pengaturan waktu tingkat suku kata

Catatan

Ditambahkan dalam versi 1.20.0.

SynthesisVoicesResult

Berisi informasi terperinci tentang daftar suara sintesis yang diambil.

Catatan

Ditambahkan dalam versi 1.16.0.

Konstruktor untuk penggunaan internal.

VoiceInfo

Berisi informasi terperinci tentang informasi suara sintesis.

Catatan

Diperbarui dalam versi 1.17.0.

Konstruktor untuk penggunaan internal.

Enum

AudioStreamContainerFormat

Menentukan format kontainer aliran audio yang didukung.

AudioStreamWaveFormat

Mewakili format yang ditentukan di dalam kontainer WAV.

CancellationErrorCode

Menentukan kode kesalahan jika CancellationReason adalah Kesalahan.

CancellationReason

Menentukan kemungkinan alasan hasil pengenalan mungkin dibatalkan.

NoMatchReason

Menentukan kemungkinan alasan hasil pengenalan mungkin tidak dikenali.

OutputFormat

Format output.

ProfanityOption

Menghapus kata-kata kotor (bersumpah), atau mengganti huruf kata-kata tidak fasik dengan bintang.

PronunciationAssessmentGradingSystem

Menentukan sistem titik untuk kalibrasi skor pengucapan; nilai defaultnya adalah FivePoint.

PronunciationAssessmentGranularity

Mendefinisikan granularitas evaluasi pengucapan; nilai defaultnya adalah Phoneme.

PropertyId

Menentukan id properti ucapan.

ResultReason

Menentukan kemungkinan alasan hasil pengenalan mungkin dihasilkan.

ServicePropertyChannel

Menentukan saluran yang digunakan untuk meneruskan pengaturan properti ke layanan.

SpeechSynthesisOutputFormat

Menentukan kemungkinan format audio output sintesis ucapan.

StreamStatus

Menentukan kemungkinan status aliran data audio.

SynthesisVoiceGender

Mendefinisikan jenis kelamin suara sintesis

SynthesisVoiceType

Menentukan jenis suara sintesis