microsoft-cognitiveservices-speech-sdk package

Třídy

ActivityReceivedEventArgs

Definuje obsah přijatých zpráv nebo událostí.

AudioConfig

Představuje konfiguraci zvukového vstupu, která se používá k určení typu vstupu, který se má použít (mikrofon, soubor, stream).

AudioInputStream

Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku.

AudioOutputStream

Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu.

AudioStreamFormat

Představuje formát zvukového streamu, který se používá pro vlastní konfigurace vstupu zvuku.

AutoDetectSourceLanguageConfig

Automatická detekce konfigurace jazyka

AutoDetectSourceLanguageResult

Formát výstupu

AvatarConfig

Definuje konfiguraci mluvícího avatara.

AvatarEventArgs

Definuje obsah pro mluvící události avatarů.

AvatarSynthesizer

Definuje syntezátor avatara.

AvatarVideoFormat

Definuje výstupní formát videa avatara.

AvatarWebRTCConnectionResult

Definuje výsledek připojení WebRTC avatara.

BaseAudioPlayer

Základní třída přehrávače zvuku TODO: Prozatím přehrává pouze PCM.

BotFrameworkConfig

Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu Bot Framework.

CancellationDetails

Obsahuje podrobné informace o tom, proč byl výsledek zrušen.

CancellationDetailsBase

Obsahuje podrobné informace o tom, proč byl výsledek zrušen.

Connection

Připojení je třída proxy pro správu připojení k řečové službě zadaného rozpoznávání. Rozpoznávání ve výchozím nastavení v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití funkce Připojení je volitelné, a to hlavně ve scénářích, kdy je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open(), aby předem ručně nastavili připojení před zahájením rozpoznávání v rozpoznávání přidruženém k tomuto připojení. Pokud se rozpoznávání potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle na sobě. V takovém případě bude připojení upozorněno na změnu stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1.

ConnectionEventArgs

Definuje datovou část pro události připojení, jako je Připojeno/Odpojeno. Přidáno ve verzi 1.2.0

ConnectionMessage

ConnectionMessage představuje zprávy specifické pro implementaci odesílané do služby speech a přijaté z této služby. Tyto zprávy jsou poskytovány pro účely ladění a neměly by se používat pro produkční případy použití se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté z této služby se můžou změnit bez předchozího upozornění. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0.

ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs

Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

ConversationParticipantsChangedEventArgs

Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

ConversationTranscriber

Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných zvukových vstupních streamů a jako výsledek získá přepis textu.

ConversationTranscriptionCanceledEventArgs

Definuje obsah RecognitionErrorEvent.

ConversationTranscriptionEventArgs

Definuje obsah události přepisu/přepisu konverzace.

ConversationTranscriptionResult

Definuje výsledek přepisu konverzace.

ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs

Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči.

ConversationTranslationResult

Výsledek textu překladu.

ConversationTranslator

Připojte se ke konverzaci, odejděte nebo se k ní připojte.

Coordinate

Definuje souřadnici ve 2D prostoru.

CustomCommandsConfig

Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands.

Diagnostics

Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0.

DialogServiceConfig

Třída, která definuje základní konfigurace pro konektor služby dialogů

DialogServiceConnector

Konektor služby dialogového okna

IntentRecognitionCanceledEventArgs

Definujte datovou část událostí zrušených výsledků rozpoznávání záměru.

IntentRecognitionEventArgs

Argumenty události výsledku rozpoznávání záměru.

IntentRecognitionResult

Výsledek rozpoznávání záměru.

IntentRecognizer

Rozpoznávání záměru.

KeywordRecognitionModel

Představuje model rozpoznávání klíčových slov, který rozpozná, když uživatel řekne klíčové slovo pro zahájení dalšího rozpoznávání řeči.

LanguageUnderstandingModel

Model pro porozumění jazyku

Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs

Definuje obsah MeetingTranscriptionCanceledEvent.

MeetingTranscriptionEventArgs

Definuje obsah události přepisu/přepisu schůzky.

NoMatchDetails

Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.

Participant

Představuje účastníka konverzace. Přidáno ve verzi 1.4.0

PhraseListGrammar

Umožňuje přidání nových frází, aby se zlepšilo rozpoznávání řeči.

Fráze přidané do rozpoznávání se projeví na začátku dalšího rozpoznávání nebo při příštím připojení sady SpeechSDK k řečové službě.

PronunciationAssessmentConfig

Konfigurace posouzení výslovnosti.

PronunciationAssessmentResult

Výsledky posouzení výslovnosti.

PropertyCollection

Představuje kolekci vlastností a jejich hodnot.

PullAudioInputStream

Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku.

PullAudioInputStreamCallback

Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy).

PullAudioOutputStream

Představuje stream výstupu nabízeného zvuku s podporou paměti, který se používá pro vlastní konfigurace zvukového výstupu.

PushAudioInputStream

Představuje stream nabízeného zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu.

PushAudioOutputStream

Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu.

PushAudioOutputStreamCallback

Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy).

RecognitionEventArgs

Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči.

RecognitionResult

Definuje výsledek rozpoznávání řeči.

Recognizer

Definuje rozpoznávání základní třídy, která obsahuje hlavně běžné obslužné rutiny událostí.

ServiceEventArgs

Definuje datovou část pro všechny události zprávy služby přidané ve verzi 1.9.0.

SessionEventArgs

Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.

SourceLanguageConfig

Konfigurace zdrojového jazyka.

SpeakerAudioDestination

Představuje cíl přehrávání zvuku reproduktoru, který funguje pouze v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší zadat formát mp3 pro přehrávání.

SpeakerIdentificationModel

Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, podle kterých lze identifikovat mluvčí.

SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult

Formát výstupu

SpeakerRecognizer

Definuje třídu SpeakerRecognizer pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).

SpeakerVerificationModel

Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí.

SpeechConfig

Konfigurace řeči.

SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs

Definuje obsah rozpoznávání/rozpoznané události řeči.

SpeechRecognitionResult

Definuje výsledek rozpoznávání řeči.

SpeechRecognizer

Rozpoznává řeč z mikrofonu, souboru nebo jiných vstupních zvukových proudů a jako výsledek získá přepis textu.

SpeechSynthesisBookmarkEventArgs

Definuje obsah události záložky syntézy řeči.

SpeechSynthesisEventArgs

Definuje obsah událostí syntézy řeči.

SpeechSynthesisResult

Definuje výsledek syntézy řeči.

SpeechSynthesisVisemeEventArgs

Definuje obsah události viseme syntézy řeči.

SpeechSynthesisWordBoundaryEventArgs

Definuje obsah události hranice slova syntézy řeči.

SpeechSynthesizer

Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizace ve verzi 1.16.0

SpeechTranslationConfig

Konfigurace překladu řeči.

SynthesisResult

Základní třída pro výsledky syntézy

SynthesisVoicesResult

Definuje výsledek syntézy řeči.

Synthesizer
TranslationRecognitionCanceledEventArgs

Definujte datovou část událostí zrušených výsledků rozpoznávání řeči.

TranslationRecognitionEventArgs

Argumenty události výsledku překladu textu

TranslationRecognitionResult

Výsledek textu překladu.

TranslationRecognizer

Rozpoznávání překladu

TranslationSynthesisEventArgs

Argumenty události syntézy překladu

TranslationSynthesisResult

Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce.

Translations

Představuje kolekci parametrů a jejich hodnot.

TurnStatusReceivedEventArgs

Definuje obsah přijatých zpráv nebo událostí.

User
VoiceInfo

Informace o hlasové syntéze řeči přidané ve verzi 1.20.0.

VoiceProfile

Definuje třídu hlasového profilu pro rozpoznávání mluvčího.

VoiceProfileCancellationDetails
VoiceProfileClient

Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).

VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult

Formát výstupu

VoiceProfilePhraseResult

Formát výstupu

VoiceProfileResult

Formát výstupu

Rozhraní

CancellationEventArgs
ConversationInfo
IParticipant

Představuje účastníka konverzace. Přidáno ve verzi 1.4.0

IPlayer

Představuje rozhraní přehrávače zvuku pro ovládání přehrávání zvuku, jako je pozastavení, obnovení atd.

MeetingInfo
VoiceSignature

Výčty

AudioFormatTag
CancellationErrorCode

Definuje kód chyby v případě, že CancellationReason je Error. Přidáno ve verzi 1.1.0.

CancellationReason

Definuje možné důvody zrušení výsledku rozpoznávání.

LanguageIdMode

Režim identifikace jazyka

LogLevel
NoMatchReason

Definuje možné důvody, proč nemusí být rozpoznán výsledek rozpoznávání.

OutputFormat

Definujte výstupní formáty Rozpoznávání řeči.

ParticipantChangedReason
ProfanityOption

Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0.

PronunciationAssessmentGradingSystem

Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0

PronunciationAssessmentGranularity

Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0

PropertyId

Definuje ID vlastností řeči.

ResultReason

Definuje možné důvody, proč může být vygenerován výsledek rozpoznávání.

ServicePropertyChannel

Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0.

SpeakerRecognitionResultType
SpeechSynthesisBoundaryType

Definuje typ hranice události hranice syntézy řeči.

SpeechSynthesisOutputFormat

Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat Aktualizováno ve verzi 1.17.0

VoiceProfileType

Formát výstupu