microsoft-cognitiveservices-speech-sdk package

類別

ActivityReceivedEventArgs

定義已接收訊息/事件的內容。

AudioConfig

表示用來指定要使用何種輸入類型的音訊輸入組態, (麥克風、檔案、資料流程) 。

AudioInputStream

表示用於自訂音訊輸入組態的音訊輸入資料流程。

AudioOutputStream

表示用於自訂音訊輸出組態的音訊輸出資料流程。

AudioStreamFormat

表示用於自訂音訊輸入組態的音訊資料流程格式。

AutoDetectSourceLanguageConfig

語言自動偵測組態。

AutoDetectSourceLanguageResult

輸出格式

AvatarConfig

定義交談虛擬人偶組態。

AvatarEventArgs

定義交談虛擬人偶事件的內容。

AvatarSynthesizer

定義虛擬人偶合成器。

AvatarVideoFormat

定義虛擬人偶輸出視訊格式。

AvatarWebRTCConnectionResult

定義虛擬人偶 WebRTC 連線結果。

BaseAudioPlayer

基底音訊播放程式類別 TODO:目前僅播放 PCM。

BotFrameworkConfig

類別,定義使用 Bot Framework 後端之對話方塊服務連接器物件的組態。

CancellationDetails

包含取消結果原因的詳細資訊。

CancellationDetailsBase

包含取消結果原因的詳細資訊。

Connection

Connection 是一種 Proxy 類別,可用來管理與指定辨識器之語音服務的連線。 根據預設,辨識器會在需要時自動管理服務的連線。 Connection 類別會提供其他方法,讓使用者明確開啟或關閉連線,以及訂閱線上狀態變更。 使用 Connection 是選擇性的,主要是針對需要根據線上狀態微調應用程式行為的案例。 使用者可以選擇性地呼叫 Open () ,在開始辨識與此連線相關聯的辨識器之前,事先手動設定連線。 如果辨識器需要連線或中斷連線至服務,則會獨立設定或關閉連線。 在此情況下,連線會透過連線/已中斷線上活動變更來收到通知。 已在 1.2.1 版中新增。

ConnectionEventArgs

定義線上活動的承載,例如 Connected/Disconnected。 已在 1.2.0 版中新增

ConnectionMessage

ConnectionMessage 代表傳送至語音服務及從語音服務接收的實作特定訊息。 這些訊息是為了偵錯而提供,不應用於 Azure 認知服務語音服務的生產使用案例。 傳送至語音服務及從語音服務接收的訊息可能會變更,而不需通知。 這包括訊息內容、標頭、承載、排序等。已在 1.11.0 版中新增。

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationParticipantsChangedEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

ConversationTranscriber

使用麥克風、檔案或其他音訊輸入串流的說話者分隔來執行語音辨識,並取得轉譯的文字。

ConversationTranscriptionCanceledEventArgs

定義 RecognitionErrorEvent 的內容。

ConversationTranscriptionEventArgs

定義交談轉譯/轉譯事件的內容。

ConversationTranscriptionResult

定義交談轉譯的結果。

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

ConversationTranslationResult

翻譯文字結果。

ConversationTranslator

加入、離開或連線至交談。

Coordinate

定義 2D 空間中的座標。

CustomCommandsConfig

類別,定義使用 CustomCommands 後端之對話方塊服務連接器物件的組態。

Diagnostics

定義診斷 API 以管理 1.21.0 版中新增的主控台輸出

DialogServiceConfig

定義對話服務連接器基底組態的類別

DialogServiceConnector

對話方塊服務連接器

IntentRecognitionCanceledEventArgs

定義意圖辨識已取消結果事件的承載。

IntentRecognitionEventArgs

意圖辨識結果事件引數。

IntentRecognitionResult

意圖辨識結果。

IntentRecognizer

意圖辨識器。

KeywordRecognitionModel

表示當使用者說出關鍵字來起始進一步語音辨識時,用於辨識的關鍵字辨識模型。

LanguageUnderstandingModel

語言理解模型

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

定義 MeetingTranscriptionCanceledEvent 的內容。

MeetingTranscriptionEventArgs

定義會議轉譯/轉譯事件的內容。

NoMatchDetails

包含 NoMatch 辨識結果的詳細資訊。

Participant

代表交談中的參與者。 已在 1.4.0 版中新增

PhraseListGrammar

允許新增片語以改善語音辨識。

新增至辨識器的片語在下一次辨識開始時有效,或下次 SpeechSDK 必須重新連線到語音服務時有效。

PronunciationAssessmentConfig

發音評定組態。

PronunciationAssessmentResult

發音評定結果。

PropertyCollection

表示屬性及其值的集合。

PullAudioInputStream

表示用於自訂音訊輸入組態的音訊輸入資料流程。

PullAudioInputStreamCallback

抽象基類,定義自訂音訊輸入資料流程) (read () 和 close () ) 的回呼方法。

PullAudioOutputStream

表示用於自訂音訊輸出組態的記憶體支援推播音訊輸出資料流程。

PushAudioInputStream

表示用於自訂音訊輸入組態的記憶體支援推播音訊輸入資料流程。

PushAudioOutputStream

表示用於自訂音訊輸出組態的音訊輸出資料流程。

PushAudioOutputStreamCallback

抽象基類,定義自訂音訊輸出資料流程) (寫入 () 和 close () ) 的回呼方法。

RecognitionEventArgs

定義會話事件的承載,例如偵測到語音開始/結束

RecognitionResult

定義語音辨識的結果。

Recognizer

定義基類辨識器,主要包含常見的事件處理常式。

ServiceEventArgs

定義 1.9.0 版中新增的任何服務訊息事件的承載

SessionEventArgs

定義會話事件的內容,例如 SessionStarted/Stopped、SoundStarted/Stopped。

SourceLanguageConfig

來來源語言組態。

SpeakerAudioDestination

代表喇叭播放音訊目的地,其僅適用于瀏覽器。 注意:SDK 會嘗試使用 媒體來源延伸模組 播放音訊。 Mp3 格式在 Microsoft Edge、Chrome 和 Safari (桌面) 上具有更好的支援,因此最好指定 mp3 格式來播放。

SpeakerIdentificationModel

定義說話者辨識模型的 SpeakerIdentificationModel 類別包含一組設定檔,用來識別說話者 ()

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

輸出格式

SpeakerRecognizer

針對語音設定檔作業 (的使用者定義 SpeakerRecognizer 類別,例如 createProfile、deleteProfile)

SpeakerVerificationModel

定義說話者辨識模型的 SpeakerVerificationModel 類別包含用來驗證說話者的設定檔

SpeechConfig

語音設定。

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

定義語音辨識/辨識事件的內容。

SpeechRecognitionResult

定義語音辨識的結果。

SpeechRecognizer

從麥克風、檔案或其他音訊輸入資料流程執行語音辨識,並取得轉譯的文字。

SpeechSynthesisBookmarkEventArgs

定義語音合成書簽事件的內容。

SpeechSynthesisEventArgs

定義語音合成事件的內容。

SpeechSynthesisResult

定義語音合成的結果。

SpeechSynthesisVisemeEventArgs

定義語音合成 viseme 事件的內容。

SpeechSynthesisWordBoundaryEventArgs

定義語音合成文字界限事件的內容。

SpeechSynthesizer

定義語音轉換文字的 SpeechSynthesizer 類別。 1.16.0 版已更新

SpeechTranslationConfig

語音翻譯組態。

SynthesisResult

合成結果的基類

SynthesisVoicesResult

定義語音合成的結果。

Synthesizer
TranslationRecognitionCanceledEventArgs

定義語音辨識已取消結果事件的承載。

TranslationRecognitionEventArgs

翻譯文字結果事件引數。

TranslationRecognitionResult

翻譯文字結果。

TranslationRecognizer

翻譯辨識器

TranslationSynthesisEventArgs

翻譯合成事件引數

TranslationSynthesisResult

定義翻譯合成結果,也就是目的語言中翻譯文字的語音輸出。

Translations

表示參數及其值的集合。

TurnStatusReceivedEventArgs

定義已接收訊息/事件的內容。

User
VoiceInfo

在 1.20.0 版中新增的語音合成語音相關資訊。

VoiceProfile

定義說話者辨識的語音設定檔類別

VoiceProfileCancellationDetails
VoiceProfileClient

針對語音設定檔作業的使用者定義 VoiceProfileClient 類別 (,例如 createProfile、deleteProfile)

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

輸出格式

VoiceProfilePhraseResult

輸出格式

VoiceProfileResult

輸出格式

介面

CancellationEventArgs
ConversationInfo
IParticipant

代表交談中的參與者。 已在 1.4.0 版中新增

IPlayer

表示用來控制音訊播放的音訊播放程式介面,例如暫停、繼續等等。

MeetingInfo
VoiceSignature

列舉

AudioFormatTag
CancellationErrorCode

定義當 CancellationReason 為 Error 時的錯誤碼。 已在 1.1.0 版中新增。

CancellationReason

定義可能取消辨識結果的可能原因。

LanguageIdMode

語言識別模式

LogLevel
NoMatchReason

定義無法辨識辨識結果的可能原因。

OutputFormat

定義語音辨識器輸出格式。

ParticipantChangedReason
ProfanityOption

粗話選項。 已在 1.7.0 版中新增。

PronunciationAssessmentGradingSystem

定義發音分數校正的點系統;預設值為 FivePoint。 已在 1.15.0 版中新增

PronunciationAssessmentGranularity

定義發音評估資料細微性;預設值為 Phoneme。 已在 1.15.0 版中新增

PropertyId

定義語音屬性識別碼。

ResultReason

定義可能產生辨識結果的可能原因。

ServicePropertyChannel

定義用來將屬性設定傳遞至服務的通道。 已在 1.7.0 版中新增。

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

定義語音合成界限事件的界限類型。

SpeechSynthesisOutputFormat

定義語音合成音訊輸出格式。 SpeechSynthesisOutputFormat 1.17.0 版已更新

VoiceProfileType

輸出格式