speech 套件

參考

適用于 Python 的 Microsoft 語音 SDK

單元

audio	與處理各種辨識器音訊輸入相關的類別，以及語音合成器的音訊輸出。
dialog	與對話方塊服務連接器相關的類別。
enums	適用于 Python 的 Microsoft 語音 SDK
intent	與語音辨識意圖相關的類別。
interop	適用于 Python 的 Microsoft 語音 SDK
languageconfig	與語言組態處理相關的類別
properties	適用于 Python 的 Microsoft 語音 SDK
speech	與辨識語音中的文字、從文字合成語音，以及各種辨識器中使用的一般類別相關的類別。
transcription	與交談轉譯相關的類別。
translation	與語音翻譯至其他語言相關的類別。
version	適用于 Python 的 Microsoft 語音 SDK

類別

AudioDataStream	表示用來以資料流程方式操作音訊資料的音訊資料流程。從語音合成結果產生音訊資料流程， (類型 SpeechSynthesisResult) 或關鍵字辨識結果 (類型 KeywordRecognitionResult) 。
AutoDetectSourceLanguageResult	表示自動偵測來來源語言結果。您可以從語音辨識結果初始化結果。
CancellationDetails	適用于 Python 的 Microsoft 語音 SDK
Connection	用來管理所指定 Recognizer 之語音服務的連線的 Proxy 類別。根據預設，會 Recognizer 視需要自動管理服務的連線。類別 Connection 會提供其他方法，讓使用者明確開啟或關閉連線，以及訂閱線上狀態變更。您可以選擇使用或不使用 Connection。它適用于需要根據線上狀態微調應用程式行為的案例。使用者可以選擇性地呼叫 open 以手動起始服務連線，再開始辨識 Recognizer 與此 Connection 相關聯的。啟動辨識之後，呼叫 open 或 close 可能會失敗。這不會影響辨識器或進行中的辨識。連線可能會因為各種原因而中斷，辨識器一律會嘗試視需要重新建立連線，以確保進行中的作業。在所有情況下， connected/disconnected 事件都會指出線上狀態的變更。注意已在 1.17.0 版中更新。用於內部使用的建構函式。
ConnectionEventArgs	提供 ConnectionEvent 的資料。注意已在 1.2.0 版中新增用於內部使用的建構函式。
EventSignal	用戶端可以連線到事件訊號來接收事件，或中斷事件訊號的連線，以停止接收事件。用於內部使用的建構函式。
KeywordRecognitionEventArgs	關鍵字辨識事件引數的類別。用於內部使用的建構函式。
KeywordRecognitionModel	表示關鍵字辨識模型。
KeywordRecognitionResult	關鍵字辨識作業的結果。用於內部使用的建構函式。
KeywordRecognizer	關鍵字辨識器。
NoMatchDetails	適用于 Python 的 Microsoft 語音 SDK
PhraseListGrammar	類別，允許執行時間新增片語提示來協助語音辨識。新增至辨識器的片語會在下一次辨識開始時生效，或下次語音辨識器必須重新連線到語音服務時生效。注意已在 1.5.0 版中新增。用於內部使用的建構函式。
PronunciationAssessmentConfig	代表發音評估組態注意已在 1.14.0 版中新增。組態可以透過兩種方式初始化：來自參數：傳遞參考文字、分級系統、細微性、啟用誤判和案例識別碼。 from json：傳遞 json 字串如需參數詳細資料，請參閱 https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters
PronunciationAssessmentPhonemeResult	包含音素等級發音評估結果注意已在 1.14.0 版中新增。
PronunciationAssessmentResult	表示發音評估結果。注意已在 1.14.0 版中新增。您可以從語音辨識結果初始化結果。
PronunciationAssessmentWordResult	包含字級發音評估結果注意已在 1.14.0 版中新增。
PropertyCollection	從屬性集合擷取或設定屬性值的類別。
RecognitionEventArgs	提供 RecognitionEvent 的資料。用於內部使用的建構函式。
RecognitionResult	辨識作業結果的詳細資訊。用於內部使用的建構函式。
Recognizer	不同辨識器的基類
ResultFuture	非同步作業的結果。 private 建構函式
SessionEventArgs	會話事件引數的基類。用於內部使用的建構函式。
SourceLanguageRecognizer	來來源語言辨識器 - 獨立語言辨識器，可用於單一語言或連續語言偵測。注意已在 1.18.0 版中新增。
SpeechConfig	類別，定義語音/意圖辨識和語音合成的組態。組態可以透過不同的方式初始化：從訂用帳戶：傳遞訂用帳戶金鑰和區域從端點：傳遞端點。訂用帳戶金鑰或授權權杖是選擇性的。來自主機：傳遞主機位址。訂用帳戶金鑰或授權權杖是選擇性的。從授權權杖：傳遞授權權杖和區域
SpeechRecognitionCanceledEventArgs	語音辨識已取消事件引數的類別。用於內部使用的建構函式。
SpeechRecognitionEventArgs	語音辨識事件引數的類別。用於內部使用的建構函式。
SpeechRecognitionResult	語音辨識結果的基類。用於內部使用的建構函式。
SpeechRecognizer	語音辨識器。如果您需要指定來來源語言資訊，請只指定這三個參數之一、語言、source_language_config或auto_detect_source_language_config。
SpeechSynthesisBookmarkEventArgs	語音合成書簽事件引數的類別。注意已在 1.16.0 版中新增。用於內部使用的建構函式。
SpeechSynthesisCancellationDetails	包含為何取消結果的詳細資訊。
SpeechSynthesisEventArgs	語音合成事件引數的類別。用於內部使用的建構函式。
SpeechSynthesisResult	語音合成作業的結果。用於內部使用的建構函式。
SpeechSynthesisVisemeEventArgs	語音合成 viseme 事件引數的類別。注意已在 1.16.0 版中新增。用於內部使用的建構函式。
SpeechSynthesisWordBoundaryEventArgs	語音合成文字界限事件引數的類別。注意已在 1.21.0 版中更新。用於內部使用的建構函式。
SpeechSynthesizer	語音合成器。
SyllableLevelTimingResult	包含可音調的計時結果注意已在 1.20.0 版中新增。
SynthesisVoicesResult	包含所擷取合成語音清單的詳細資訊。注意已在 1.16.0 版中新增。用於內部使用的建構函式。
VoiceInfo	包含合成語音資訊的詳細資訊。注意已在 1.17.0 版中更新。用於內部使用的建構函式。

列舉

AudioStreamContainerFormat	定義支援的音訊資料流程容器格式。
AudioStreamWaveFormat	表示 WAV 容器內指定的格式。
CancellationErrorCode	定義錯誤碼，以防 CancellationReason 為 Error。
CancellationReason	定義辨識結果可能會取消的可能原因。
NoMatchReason	定義無法辨識辨識結果的可能原因。
OutputFormat	輸出格式。
ProfanityOption	移除粗話 (戴) ，或以星號取代不雅字的字母。
PronunciationAssessmentGradingSystem	定義發音分數校正的點系統;預設值為 FivePoint。
PronunciationAssessmentGranularity	定義發音評估資料細微性;預設值為 Phoneme。
PropertyId	定義語音屬性識別碼。
ResultReason	指定可能產生辨識結果的原因。
ServicePropertyChannel	定義用來將屬性設定傳遞至服務的通道。
SpeechSynthesisOutputFormat	定義可能的語音合成輸出音訊格式。
StreamStatus	定義音訊資料流程的可能狀態。
SynthesisVoiceGender	定義合成語音的性別
SynthesisVoiceType	定義合成語音的類型

共用方式為

speech 套件

單元

類別

列舉

意見反應

其他資源