microsoft-cognitiveservices-speech-sdk package

Reference

Třídy

ActivityReceivedEventArgs	Definuje obsah přijatých zpráv nebo událostí.
AudioConfig	Představuje konfiguraci zvukového vstupu, která se používá k určení typu vstupu, který se má použít (mikrofon, soubor, stream).
AudioInputStream	Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku.
AudioOutputStream	Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu.
AudioStreamFormat	Představuje formát zvukového streamu, který se používá pro vlastní konfigurace vstupu zvuku.
AutoDetectSourceLanguageConfig	Automatická detekce konfigurace jazyka
AutoDetectSourceLanguageResult	Formát výstupu
AvatarConfig	Definuje konfiguraci mluvícího avatara.
AvatarEventArgs	Definuje obsah pro mluvící události avatarů.
AvatarSynthesizer	Definuje syntezátor avatara.
AvatarVideoFormat	Definuje výstupní formát videa avatara.
AvatarWebRTCConnectionResult	Definuje výsledek připojení WebRTC avatara.
BaseAudioPlayer	Základní třída přehrávače zvuku TODO: Prozatím přehrává pouze PCM.
BotFrameworkConfig	Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu Bot Framework.
CancellationDetails	Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
CancellationDetailsBase	Obsahuje podrobné informace o tom, proč byl výsledek zrušen.
Connection	Připojení je třída proxy pro správu připojení k řečové službě zadaného rozpoznávání. Rozpoznávání ve výchozím nastavení v případě potřeby samostatně spravuje připojení ke službě. Třída Connection poskytuje uživatelům další metody, jak explicitně otevřít nebo zavřít připojení a přihlásit se k odběru změn stavu připojení. Použití funkce Připojení je volitelné, a to hlavně ve scénářích, kdy je potřeba jemně doladit chování aplikace na základě stavu připojení. Uživatelé můžou volitelně volat Open(), aby předem ručně nastavili připojení před zahájením rozpoznávání v rozpoznávání přidruženém k tomuto připojení. Pokud se rozpoznávání potřebuje připojit nebo odpojit ke službě, nastaví nebo vypne připojení nezávisle na sobě. V takovém případě bude připojení upozorněno na změnu stavu připojení prostřednictvím událostí Připojeno/Odpojeno. Přidáno ve verzi 1.2.1.
ConnectionEventArgs	Definuje datovou část pro události připojení, jako je Připojeno/Odpojeno. Přidáno ve verzi 1.2.0
ConnectionMessage	ConnectionMessage představuje zprávy specifické pro implementaci odesílané do služby speech a přijaté z této služby. Tyto zprávy jsou poskytovány pro účely ladění a neměly by se používat pro produkční případy použití se službou Azure Cognitive Services Speech Service. Zprávy odeslané službě Speech a přijaté z této služby se můžou změnit bez předchozího upozornění. To zahrnuje obsah zpráv, záhlaví, datové části, řazení atd. Přidáno ve verzi 1.11.0.
ConnectionMessageEventArgs
Conversation
ConversationExpirationEventArgs	Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
ConversationParticipantsChangedEventArgs	Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
ConversationTranscriber	Provádí rozpoznávání řeči s oddělením reproduktoru od mikrofonu, souboru nebo jiných zvukových vstupních streamů a jako výsledek získá přepis textu.
ConversationTranscriptionCanceledEventArgs	Definuje obsah RecognitionErrorEvent.
ConversationTranscriptionEventArgs	Definuje obsah události přepisu/přepisu konverzace.
ConversationTranscriptionResult	Definuje výsledek přepisu konverzace.
ConversationTranslationCanceledEventArgs
ConversationTranslationEventArgs	Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči.
ConversationTranslationResult	Výsledek textu překladu.
ConversationTranslator	Připojte se ke konverzaci, odejděte nebo se k ní připojte.
Coordinate	Definuje souřadnici ve 2D prostoru.
CustomCommandsConfig	Třída, která definuje konfigurace pro objekt konektoru služby dialogového okna pro použití back-endu CustomCommands.
Diagnostics	Definuje rozhraní API diagnostiky pro správu výstupu konzoly přidaného ve verzi 1.21.0.
DialogServiceConfig	Třída, která definuje základní konfigurace pro konektor služby dialogů
DialogServiceConnector	Konektor služby dialogového okna
IntentRecognitionCanceledEventArgs	Definujte datovou část událostí zrušených výsledků rozpoznávání záměru.
IntentRecognitionEventArgs	Argumenty události výsledku rozpoznávání záměru.
IntentRecognitionResult	Výsledek rozpoznávání záměru.
IntentRecognizer	Rozpoznávání záměru.
KeywordRecognitionModel	Představuje model rozpoznávání klíčových slov, který rozpozná, když uživatel řekne klíčové slovo pro zahájení dalšího rozpoznávání řeči.
LanguageUnderstandingModel	Model pro porozumění jazyku
Meeting
MeetingTranscriber
MeetingTranscriptionCanceledEventArgs	Definuje obsah MeetingTranscriptionCanceledEvent.
MeetingTranscriptionEventArgs	Definuje obsah události přepisu/přepisu schůzky.
NoMatchDetails	Obsahuje podrobné informace o výsledcích rozpoznávání NoMatch.
Participant	Představuje účastníka konverzace. Přidáno ve verzi 1.4.0
PhraseListGrammar	Umožňuje přidání nových frází, aby se zlepšilo rozpoznávání řeči. Fráze přidané do rozpoznávání se projeví na začátku dalšího rozpoznávání nebo při příštím připojení sady SpeechSDK k řečové službě.
PronunciationAssessmentConfig	Konfigurace posouzení výslovnosti.
PronunciationAssessmentResult	Výsledky posouzení výslovnosti.
PropertyCollection	Představuje kolekci vlastností a jejich hodnot.
PullAudioInputStream	Představuje datový proud vstupu zvuku, který se používá pro vlastní konfigurace vstupu zvuku.
PullAudioInputStreamCallback	Abstraktní základní třída, která definuje metody zpětného volání (read() a close()) pro vlastní zvukové vstupní streamy).
PullAudioOutputStream	Představuje stream výstupu nabízeného zvuku s podporou paměti, který se používá pro vlastní konfigurace zvukového výstupu.
PushAudioInputStream	Představuje stream nabízeného zvukového vstupu s podporou paměti, který se používá pro vlastní konfigurace zvukového vstupu.
PushAudioOutputStream	Představuje zvukový výstupní stream používaný pro vlastní konfigurace zvukového výstupu.
PushAudioOutputStreamCallback	Abstraktní základní třída, která definuje metody zpětného volání (write() a close()) pro vlastní zvukové výstupní streamy).
RecognitionEventArgs	Definuje datovou část pro události relace, jako je zjištění zahájení/ukončení řeči.
RecognitionResult	Definuje výsledek rozpoznávání řeči.
Recognizer	Definuje rozpoznávání základní třídy, která obsahuje hlavně běžné obslužné rutiny událostí.
ServiceEventArgs	Definuje datovou část pro všechny události zprávy služby přidané ve verzi 1.9.0.
SessionEventArgs	Definuje obsah pro události relace, jako jsou SessionStarted/Stopped, SoundStarted/Stopped.
SourceLanguageConfig	Konfigurace zdrojového jazyka.
SpeakerAudioDestination	Představuje cíl přehrávání zvuku reproduktoru, který funguje pouze v prohlížeči. Poznámka: Sada SDK se pokusí použít rozšíření zdroje médií k přehrávání zvuku. Formát Mp3 má lepší podporu pro Microsoft Edge, Chrome a Safari (desktop), takže je lepší zadat formát mp3 pro přehrávání.
SpeakerIdentificationModel	Definuje třídu SpeakerIdentificationModel pro model rozpoznávání mluvčího obsahuje sadu profilů, podle kterých lze identifikovat mluvčí.
SpeakerRecognitionCancellationDetails
SpeakerRecognitionResult	Formát výstupu
SpeakerRecognizer	Definuje třídu SpeakerRecognizer pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).
SpeakerVerificationModel	Definuje třídu SpeakerVerificationModel pro model rozpoznávání mluvčího obsahuje profil, proti kterému se má ověřit mluvčí.
SpeechConfig	Konfigurace řeči.
SpeechConfigImpl
SpeechRecognitionCanceledEventArgs
SpeechRecognitionEventArgs	Definuje obsah rozpoznávání/rozpoznané události řeči.
SpeechRecognitionResult	Definuje výsledek rozpoznávání řeči.
SpeechRecognizer	Rozpoznává řeč z mikrofonu, souboru nebo jiných vstupních zvukových proudů a jako výsledek získá přepis textu.
SpeechSynthesisBookmarkEventArgs	Definuje obsah události záložky syntézy řeči.
SpeechSynthesisEventArgs	Definuje obsah událostí syntézy řeči.
SpeechSynthesisResult	Definuje výsledek syntézy řeči.
SpeechSynthesisVisemeEventArgs	Definuje obsah události viseme syntézy řeči.
SpeechSynthesisWordBoundaryEventArgs	Definuje obsah události hranice slova syntézy řeči.
SpeechSynthesizer	Definuje třídu SpeechSynthesizer pro převod textu na řeč. Aktualizace ve verzi 1.16.0
SpeechTranslationConfig	Konfigurace překladu řeči.
SynthesisResult	Základní třída pro výsledky syntézy
SynthesisVoicesResult	Definuje výsledek syntézy řeči.
Synthesizer
TranslationRecognitionCanceledEventArgs	Definujte datovou část událostí zrušených výsledků rozpoznávání řeči.
TranslationRecognitionEventArgs	Argumenty události výsledku překladu textu
TranslationRecognitionResult	Výsledek textu překladu.
TranslationRecognizer	Rozpoznávání překladu
TranslationSynthesisEventArgs	Argumenty události syntézy překladu
TranslationSynthesisResult	Definuje výsledek syntézy překladu, tj. hlasový výstup přeloženého textu v cílovém jazyce.
Translations	Představuje kolekci parametrů a jejich hodnot.
TurnStatusReceivedEventArgs	Definuje obsah přijatých zpráv nebo událostí.
User
VoiceInfo	Informace o hlasové syntéze řeči přidané ve verzi 1.20.0.
VoiceProfile	Definuje třídu hlasového profilu pro rozpoznávání mluvčího.
VoiceProfileCancellationDetails
VoiceProfileClient	Definuje třídu VoiceProfileClient pro operace rozpoznávání mluvčího od uživatele pro operace hlasového profilu (např. createProfile, deleteProfile).
VoiceProfileEnrollmentCancellationDetails
VoiceProfileEnrollmentResult	Formát výstupu
VoiceProfilePhraseResult	Formát výstupu
VoiceProfileResult	Formát výstupu

Rozhraní

CancellationEventArgs
ConversationInfo
IParticipant	Představuje účastníka konverzace. Přidáno ve verzi 1.4.0
IPlayer	Představuje rozhraní přehrávače zvuku pro ovládání přehrávání zvuku, jako je pozastavení, obnovení atd.
MeetingInfo
VoiceSignature

Výčty

AudioFormatTag
CancellationErrorCode	Definuje kód chyby v případě, že CancellationReason je Error. Přidáno ve verzi 1.1.0.
CancellationReason	Definuje možné důvody zrušení výsledku rozpoznávání.
LanguageIdMode	Režim identifikace jazyka
LogLevel
NoMatchReason	Definuje možné důvody, proč nemusí být rozpoznán výsledek rozpoznávání.
OutputFormat	Definujte výstupní formáty Rozpoznávání řeči.
ParticipantChangedReason
ProfanityOption	Možnost vulgárních výrazů. Přidáno ve verzi 1.7.0.
PronunciationAssessmentGradingSystem	Definuje bodový systém pro kalibraci skóre výslovnosti; výchozí hodnota je FivePoint. Přidáno ve verzi 1.15.0
PronunciationAssessmentGranularity	Definuje členitost vyhodnocení výslovnosti; výchozí hodnota je Phoneme. Přidáno ve verzi 1.15.0
PropertyId	Definuje ID vlastností řeči.
ResultReason	Definuje možné důvody, proč může být vygenerován výsledek rozpoznávání.
ServicePropertyChannel	Definuje kanály používané k předávání nastavení vlastností do služby. Přidáno ve verzi 1.7.0.
SpeakerRecognitionResultType
SpeechSynthesisBoundaryType	Definuje typ hranice události hranice syntézy řeči.
SpeechSynthesisOutputFormat	Definujte formáty zvukového výstupu syntézy řeči. SpeechSynthesisOutputFormat Aktualizováno ve verzi 1.17.0
VoiceProfileType	Formát výstupu

microsoft-cognitiveservices-speech-sdk package

Třídy

Rozhraní

Výčty

Další materiály