Przestrzeń nazw Microsoft::CognitiveServices::Speech

Artykuł
03/19/2024

Podsumowanie

Elementy członkowskie	Opisy
enum PropertyId	Definiuje identyfikatory właściwości mowy. Zmieniono wersję 1.4.0.
enum OutputFormat	Format danych wyjściowych.
wyliczenie wulgaryzmówOption	Usuwa wulgaryzmy (przeklinanie) lub zastępuje litery wulgarnych słów gwiazdami. Dodano element w wersji 1.5.0.
wyliczenie ResultReason	Określa możliwe przyczyny wygenerowania wyniku rozpoznawania.
wyliczenie CancellationReason	Definiuje możliwe przyczyny anulowania wyniku rozpoznawania.
enum CancellationErrorCode	Definiuje kod błędu w przypadku, gdy wartość CancellationReason to Błąd. Dodano element w wersji 1.1.0.
enum NoMatchReason	Definiuje możliwe przyczyny, dla których wynik rozpoznawania może nie zostać rozpoznany.
enum ActivityJSONType	Definiuje możliwe typy dla wartości json działania. Dodano element w wersji 1.5.0.
enum SpeechSynthesisOutputFormat	Definiuje możliwe formaty dźwięku wyjściowego syntezy mowy. Zaktualizowano w wersji 1.19.0.
enum StreamStatus	Definiuje możliwy stan strumienia danych audio. Dodano element w wersji 1.4.0.
enum ServicePropertyChannel	Definiuje kanały używane do przekazywania ustawień właściwości do usługi. Dodano element w wersji 1.5.0.
enum VoiceProfileType	Definiuje typy profilów głosowych.
Enum RecognitionFactorScope	Definiuje zakres, do którego jest stosowany współczynnik rozpoznawania.
enum WymowaAssessmentGradingSystem	Definiuje system punktów do kalibracji wyniku wymowy; wartość domyślna to FivePoint. Dodano element w wersji 1.14.0.
enum WymowaAssessmentGranularity	Definiuje stopień szczegółowości oceny wymowy; wartość domyślna to Phoneme. Dodano element w wersji 1.14.0.
enum SynthesisVoiceType	Definiuje typ głosów syntezy dodanych w wersji 1.16.0.
enum SynthesisVoiceGender	Definiuje płeć głosów syntezy Dodane w wersji 1.17.0.
enum SpeechSynthesisBoundaryType	Definiuje typ granicy zdarzenia granicy syntezy mowy Dodane w wersji 1.21.0.
klasa AsyncRecognizer	AsyncRecognizer abstrakcyjna klasa bazowa.
klasa AudioDataStream	Reprezentuje strumień danych audio używany do obsługi danych audio jako strumienia. Dodano element w wersji 1.4.0.
class AutoDetectSourceLanguageConfig	Klasa, która definiuje konfigurację źródła wykrywania automatycznego zaktualizowaną w wersji 1.13.0.
class AutoDetectSourceLanguageResult	Zawiera automatycznie wykryty wynik języka źródłowego Dodany w wersji 1.8.0.
class BaseAsyncRecognizer	BaseAsyncRecognizer, klasa.
class CancellationDetails	Zawiera szczegółowe informacje o przyczynie anulowania wyniku.
class ClassLanguageModel	Reprezentuje listę gramatyki dla dynamicznych scenariuszy gramatycznych. Dodano element w wersji 1.7.0.
class Connection (połączenie klasy)	Połączenie to klasa serwera proxy do zarządzania połączeniem z usługą rozpoznawania mowy określonego rozpoznawania. Domyślnie aparat rozpoznawania autonomicznie zarządza połączeniem z usługą w razie potrzeby. Klasa Connection udostępnia dodatkowe metody umożliwiające użytkownikom jawne otwieranie lub zamykanie połączenia oraz subskrybowanie zmian stanu połączenia. Użycie połączenia jest opcjonalne. Jest ona przeznaczona dla scenariuszy, w których potrzebne jest dostrajanie zachowania aplikacji na podstawie stanu połączenia. Użytkownicy mogą opcjonalnie wywołać metodę Open(), aby ręcznie zainicjować połączenie z usługą przed rozpoczęciem rozpoznawania w usłudze Recognizer skojarzonej z tym połączeniem. Po uruchomieniu rozpoznawania wywołanie metody Open() lub Close() może zakończyć się niepowodzeniem. Nie będzie to miało wpływu na rozpoznawanie ani bieżące rozpoznawanie. Połączenie może zostać porzucene z różnych powodów. Usługa Recognizer zawsze podejmie próbę przywrócenia połączenia zgodnie z wymaganiami w celu zagwarantowania bieżących operacji. We wszystkich tych przypadkach zdarzenia Połączone/Rozłączone będą wskazywać zmianę stanu połączenia. Zaktualizowano w wersji 1.17.0.
class ConnectionEventArgs	Dostarcza dane dla parametru ConnectionEvent. Dodano element w wersji 1.2.0.
class ConnectionMessage	Komunikat ConnectionMessage reprezentuje implementację określonych komunikatów wysyłanych do usługi rozpoznawania mowy i odbieranych z tej usługi. Te komunikaty są udostępniane do celów debugowania i nie powinny być używane w przypadku przypadków użycia w środowisku produkcyjnym w usłudze Mowa w usługach Azure Cognitive Services. Komunikaty wysyłane do usługi Rozpoznawanie mowy i odbierane z tej usługi mogą ulec zmianie bez powiadomienia. Obejmuje to zawartość wiadomości, nagłówki, ładunki, kolejność itp. Dodano element w wersji 1.10.0.
class ConnectionMessageEventArgs	Dostarcza dane dla parametru ConnectionMessageEvent.
class EmbeddedSpeechConfig	Klasa, która definiuje konfigurację mowy osadzonej (offline).
eventArgs klasy	Klasa bazowa argumentów zdarzeń.
class EventSignal	Klienci mogą łączyć się z sygnałem zdarzenia w celu odbierania zdarzeń lub odłączyć się od sygnału zdarzenia, aby zatrzymać odbieranie zdarzeń.
klasa EventSignalBase	Klienci mogą łączyć się z sygnałem zdarzenia w celu odbierania zdarzeń lub odłączyć się od sygnału zdarzenia, aby zatrzymać odbieranie zdarzeń.
gramatyka klasy	Reprezentuje gramatykę klasy bazowej do dostosowywania rozpoznawania mowy. Dodano element w wersji 1.5.0.
class GrammarList	Reprezentuje listę gramatyki dla dynamicznych scenariuszy gramatycznych. Dodano element w wersji 1.7.0.
class GrammarPhrase	Reprezentuje frazę, która może być wypowiadana przez użytkownika. Dodano element w wersji 1.5.0.
class HybridSpeechConfig	Klasa, która definiuje konfiguracje hybrydowe (chmurowe i osadzone) na potrzeby rozpoznawania mowy lub syntezy mowy.
class KeywordRecognitionEventArgs	Klasa dla zdarzeń wyemitowanych przez Słowo kluczoweRecognizer.
class KeywordRecognitionModel	Reprezentuje model rozpoznawania słów kluczowych używany z metodami StartKeywordRecognitionAsync.
class KeywordRecognitionResult	Klasa, która definiuje wyniki emitowane przez słowo kluczoweRecognizer.
class KeywordRecognizer	Typ rozpoznawania, który jest wyspecjalizowany do obsługi aktywacji słów kluczowych.
class NoMatchDetails	Zawiera szczegółowe informacje dotyczące wyników rozpoznawania NoMatch.
class PhraseListGrammar	Reprezentuje gramatykę listy fraz dla dynamicznych scenariuszy gramatycznych. Dodano element w wersji 1.5.0.
class WymowaAssessmentConfig	Klasa definiująca konfigurację oceny wymowy Dodana w wersji 1.14.0.
class WymowaAssessmentResult	Klasa wyników oceny wymowy.
class PronunciationContentAssessmentResult	Klasa wyników oceny zawartości.
class PropertyCollection	Klasa do pobrania lub ustawienia wartości właściwości z kolekcji właściwości.
class RecognitionEventArgs	Dostarcza dane dla funkcji RecognitionEvent.
rozpoznawanie klasResult	Zawiera szczegółowe informacje o wyniku operacji rozpoznawania.
rozpoznawanie klas	Recognizer, klasa bazowa.
class SessionEventArgs	Klasa bazowa argumentów zdarzeń sesji.
class SmartHandle	Klasa inteligentnego uchwytu.
class SourceLanguageConfig	Klasa, która definiuje konfigurację języka źródłowego, dodana w wersji 1.8.0.
class SourceLanguageRecognizer	Klasa rozpoznawania języka źródłowego. Tej klasy można użyć do wykrywania języka autonomicznego. Dodano element w wersji 1.17.0.
class SpeechConfig	Klasa, która definiuje konfiguracje rozpoznawania mowy/intencji lub syntezy mowy.
class SpeechRecognitionCanceledEventArgs	Klasa do rozpoznawania mowy anulowanych argumentów zdarzeń.
class SpeechRecognitionEventArgs	Klasa argumentów zdarzeń rozpoznawania mowy.
class SpeechRecognitionModel	Informacje o modelu rozpoznawania mowy.
class SpeechRecognitionResult	Klasa bazowa na potrzeby wyników rozpoznawania mowy.
class SpeechRecognizer	Klasa rozpoznawania mowy.
class SpeechSynthesisBookmarkEventArgs	Klasa argumentów zdarzeń zakładki syntezy mowy. Dodano element w wersji 1.16.0.
class SpeechSynthesisCancellationDetails	Zawiera szczegółowe informacje o przyczynie anulowania wyniku. Dodano element w wersji 1.4.0.
class SpeechSynthesisEventArgs	Klasa argumentów zdarzeń syntezy mowy. Dodano element w wersji 1.4.0.
class SpeechSynthesisResult	Zawiera informacje o wyniku syntezy zamiany tekstu na mowę. Dodano element w wersji 1.4.0.
class SpeechSynthesisVisemeEventArgs	Klasa dla argumentów zdarzeń syntezy mowy viseme. Dodano element w wersji 1.16.0.
class SpeechSynthesisWordBoundaryEventArgs	Klasa argumentów zdarzeń granicy słowa syntezy mowy. Dodano element w wersji 1.7.0.
klasa SpeechSynthesizer	Klasa syntezatora mowy. Zaktualizowano w wersji 1.14.0.
class SpeechTranslationModel	Informacje o modelu tłumaczenia mowy.
class SynthesisVoicesResult	Zawiera informacje o wynikach z listy głosów syntezatorów mowy. Dodano element w wersji 1.16.0.
class VoiceInfo	Zawiera informacje o syntezie informacji głosowych zaktualizowane w wersji 1.17.0.

Elementy członkowskie

enum PropertyId

Wartości	Opisy
SpeechServiceConnection_Key	Klucz subskrypcji usługi Mowa w usługach Cognitive Services. Jeśli używasz rozpoznawania intencji, musisz określić klucz punktu końcowego usługi LUIS dla określonej aplikacji usługi LUIS. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint	Punkt końcowy usługi Mowa w usługach Cognitive Services (url). W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia SpeechConfig::FromEndpoint. UWAGA: Ten punkt końcowy nie jest taki sam jak punkt końcowy używany do uzyskiwania tokenu dostępu.
SpeechServiceConnection_Region	Region usługi Mowa w usługach Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig ::FromAuthorizationToken.
SpeechServiceAuthorization_Token	Token autoryzacji usługi Speech Service usług Cognitive Services (czyli token dostępu). W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken, IntentRecognizer::SetAuthorizationToken, TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type	Typ autoryzacji usługi Mowa w usługach Cognitive Services. Obecnie nieużywane.
SpeechServiceConnection_EndpointId	Identyfikator punktu końcowego usługi Custom Speech lub Custom Voice Service w usługach Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetEndpointId. UWAGA: identyfikator punktu końcowego jest dostępny w witrynie Custom Speech Portal na liście w obszarze Szczegóły punktu końcowego.
SpeechServiceConnection_Host	Host usługi Mowa w usługach Cognitive Services (url). W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName	Nazwa hosta serwera proxy używanego do nawiązywania połączenia z usługą Speech Service usług Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetProxy. UWAGA: ten identyfikator właściwości został dodany w wersji 1.1.0.
SpeechServiceConnection_ProxyPort	Port serwera proxy używany do nawiązywania połączenia z usługą Speech Service usług Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetProxy. UWAGA: ten identyfikator właściwości został dodany w wersji 1.1.0.
SpeechServiceConnection_ProxyUserName	Nazwa użytkownika serwera proxy używanego do nawiązywania połączenia z usługą Speech Service usług Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetProxy. UWAGA: ten identyfikator właściwości został dodany w wersji 1.1.0.
SpeechServiceConnection_ProxyPassword	Hasło serwera proxy używanego do nawiązywania połączenia z usługą Speech Service usług Cognitive Services. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetProxy. UWAGA: ten identyfikator właściwości został dodany w wersji 1.1.0.
SpeechServiceConnection_Url	Ciąg adresu URL utworzony na podstawie konfiguracji mowy. Ta właściwość ma być tylko do odczytu. Zestaw SDK używa go wewnętrznie. UWAGA: Dodano w wersji 1.5.0.
SpeechServiceConnection_TranslationToLanguages	Lista języków rozdzielanych przecinkami używanych jako języki tłumaczenia docelowego. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechTranslationConfig::AddTargetLanguage i SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice	Nazwa tekstu usługi Cognitive Service na głos usługi Mowa. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechTranslationConfig::SetVoiceName. UWAGA: Prawidłowe nazwy głosu można znaleźć tutaj.
SpeechServiceConnection_TranslationFeatures	Funkcje tłumaczenia. Do użytku wewnętrznego.
SpeechServiceConnection_IntentRegion	Region usługi Language Understanding. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj elementu LanguageUnderstandingModel.
SpeechServiceConnection_RecoMode	Tryb rozpoznawania usługi Mowa w usługach Cognitive Services. Może to być "INTERACTIVE", "CONVERSATION", "DICTATION". Ta właściwość ma być tylko do odczytu. Zestaw SDK używa go wewnętrznie.
SpeechServiceConnection_RecoLanguage	Język mówiony rozpoznawany (w formacie BCP-47). W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId	Identyfikator sesji. Ten identyfikator jest powszechnie unikatowym identyfikatorem (aka UUID) reprezentującym określone powiązanie strumienia wejściowego audio i bazowego wystąpienia rozpoznawania mowy, do którego jest powiązana. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj parametru SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters	Parametry zapytania udostępniane przez użytkowników. Zostaną one przekazane do usługi jako parametry zapytania adresu URL. Dodano w wersji 1.5.0.
SpeechServiceConnection_RecoBackend	Ciąg określający zaplecze do użycia na potrzeby rozpoznawania mowy; dozwolone opcje są w trybie online i offline. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Obecnie opcja offline jest prawidłowa tylko wtedy, gdy jest używana konfiguracja EmbeddedSpeechConfig. Dodano w wersji 1.19.0.
SpeechServiceConnection_RecoModelName	Nazwa modelu, który ma być używany do rozpoznawania mowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana konfiguracja EmbeddedSpeechConfig. Dodano w wersji 1.19.0.
SpeechServiceConnection_RecoModelKey	Klucz odszyfrowywania modelu do użycia na potrzeby rozpoznawania mowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana konfiguracja EmbeddedSpeechConfig. Dodano w wersji 1.19.0.
SpeechServiceConnection_RecoModelIniFile	Ścieżka do pliku ini modelu, który ma być używany do rozpoznawania mowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana konfiguracja EmbeddedSpeechConfig. Dodano w wersji 1.19.0.
SpeechServiceConnection_SynthLanguage	Język mówiony, który ma być syntetyzowany (np. en-US) Dodany w wersji 1.4.0.
SpeechServiceConnection_SynthVoice	Nazwa głosu TTS, który ma być używany do syntezy mowy Dodano w wersji 1.4.0.
SpeechServiceConnection_SynthOutputFormat	Ciąg określający format dźwięku wyjściowego TTS Dodany w wersji 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission	Wskazuje, czy używasz skompresowanego formatu audio do transmisji dźwięku syntezy mowy. Ta właściwość ma wpływ tylko wtedy, gdy SpeechServiceConnection_SynthOutputFormat jest ustawiona na format pcm. Jeśli ta właściwość nie jest ustawiona i zestaw GStreamer jest dostępny, zestaw SDK będzie używać skompresowanego formatu do syntetyzowanej transmisji audio i dekodować go. Tę właściwość można ustawić na "false", aby używać nieprzetworzonego formatu pcm do transmisji na przewodach. Dodano w wersji 1.16.0.
SpeechServiceConnection_SynthBackend	Ciąg do określenia zaplecza TTS; prawidłowe opcje są w trybie online i offline. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia EmbeddedSpeechConfig::FromPath lub EmbeddedSpeechConfig::FromPaths , aby ustawić zaplecze syntezy na offline. Dodano w wersji 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath	Ścieżki plików danych dla aparatu syntezy offline; tylko wtedy, gdy zaplecze syntezy jest w trybie offline. W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia EmbeddedSpeechConfig::FromPath lub EmbeddedSpeechConfig::FromPaths. Dodano w wersji 1.19.0.
SpeechServiceConnection_SynthOfflineVoice	Nazwa głosu TTS w trybie offline, który ma być używany do syntezy mowy W normalnych okolicznościach, nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia EmbeddedSpeechConfig::SetSpeechSynthesisVoice i EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Dodano w wersji 1.19.0.
SpeechServiceConnection_SynthModelKey	Klucz odszyfrowywania głosu do użycia na potrzeby syntezy mowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia EmbeddedSpeechConfig::SetSpeechSynthesisVoice. Dodano w wersji 1.19.0.
SpeechServiceConnection_VoicesListEndpoint	Punkt końcowy interfejsu API interfejsu API listy głosów usług Cognitive Services (url). W normalnych okolicznościach nie musisz określać tej właściwości, zestaw SDK utworzy go na podstawie regionu/hosta/punktu końcowego usługi SpeechConfig. Dodano w wersji 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs	Początkowa wartość limitu czasu ciszy (w milisekundach) używana przez usługę. Dodano w wersji 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs	Wartość limitu czasu zakończenia ciszy (w milisekundach) używana przez usługę. Dodano w wersji 1.5.0.
SpeechServiceConnection_EnableAudioLogging	Wartość logiczna określająca, czy rejestrowanie audio jest włączone w usłudze, czy nie. Dzienniki audio i zawartości są przechowywane w magazynie należącym do firmy Microsoft lub na własnym koncie magazynu połączonym z subskrypcją usług Cognitive Services (Bring Your Own Storage (BYOS) z włączoną usługą Mowa. Dodano w wersji 1.5.0.
SpeechServiceConnection_LanguageIdMode	Tryb identyfikatora języka połączenia usługi mowa. Może to być "AtStart" (wartość domyślna) lub "Continuous". Zobacz dokument identyfikacji języka . Dodano w wersji 1.25.0.
SpeechServiceConnection_AutoDetectSourceLanguages	Automatycznie wykrywaj języki źródłowe Dodane w wersji 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult	Wynik automatycznego wykrywania języka źródłowego Dodano w wersji 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse	Żądany format danych wyjściowych odpowiedzi usługi Mowa w usługach Cognitive Services (prosty lub szczegółowy). W normalnych okolicznościach nie należy bezpośrednio używać tej właściwości. Zamiast tego użyj polecenia SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse	Żądany poziom wulgaryzmów odpowiedzi usługi Mowa w usługach Cognitive Services. Obecnie nieużywane.
SpeechServiceResponse_ProfanityOption	Żądane ustawienie wulgaryzmów odpowiedzi usługi Mowa w usługach Cognitive Services. Dozwolone wartości to "maskowane", "usunięte" i "nieprzetworzone". Dodano w wersji 1.5.0.
SpeechServiceResponse_PostProcessingOption	Wartość ciągu określająca, która opcja przetwarzania końcowego powinna być używana przez usługę. Dozwolone wartości to "TrueText". Dodano w wersji 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps	Wartość logiczna określająca, czy należy uwzględnić znaczniki czasu na poziomie wyrazu w wyniku odpowiedzi. Dodano w wersji 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold	Liczba przypadków zwracania wyrazu w częściowych wynikach. Dodano w wersji 1.5.0.
SpeechServiceResponse_OutputFormatOption	Wartość ciągu określająca opcję formatu wyjściowego w wyniku odpowiedzi. Tylko do użytku wewnętrznego. Dodano w wersji 1.5.0.
SpeechServiceResponse_RequestSnr	Wartość logiczna określająca, czy należy uwzględnić snr (współczynnik sygnału do szumu) w wyniku odpowiedzi. Dodano w wersji 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult	Wartość logiczna do żądania stabilizacji wyników częściowych tłumaczenia przez pominięcie wyrazów w końcu. Dodano w wersji 1.5.0.
SpeechServiceResponse_RequestWordBoundary	Wartość logiczna określająca, czy żądać zdarzeń programu WordBoundary. Dodano w wersji 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary	Wartość logiczna określająca, czy żądać granicy interpunkcyjnej w zdarzeniach WordBoundary. Wartość domyślna to „true”. Dodano w wersji 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary	Wartość logiczna określająca, czy żądać granicy zdań w zdarzeniach WordBoundary. Wartość domyślna to false. Dodano w wersji 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio	Wartość logiczna określająca, czy zestaw SDK powinien synchronizować zdarzenia metadanych syntezy( np. granicę słowa, viseme itp.) do odtwarzania audio. Ma to zastosowanie tylko wtedy, gdy dźwięk jest odtwarzany za pośrednictwem zestawu SDK. Wartość domyślna to „true”. Jeśli zostanie ustawiona wartość false, zestaw SDK uruchomi zdarzenia, ponieważ pochodzą z usługi, co może nie być zsynchronizowane z odtwarzaniem dźwięku. Dodano w wersji 1.31.0.
SpeechServiceResponse_JsonResult	Dane wyjściowe odpowiedzi usługi Mowa w usługach Cognitive Services (w formacie JSON). Ta właściwość jest dostępna tylko dla obiektów wyników rozpoznawania.
SpeechServiceResponse_JsonErrorDetails	Szczegóły błędu usługi Mowa w usługach Cognitive Services (w formacie JSON). W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs	Opóźnienie rozpoznawania w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach mowy/tłumaczenia/intencji. Mierzy to opóźnienie między odebraniem danych wejściowych audio przez zestaw SDK, a momentem odebrania wyniku końcowego z usługi. Zestaw SDK oblicza różnicę czasu między ostatnim fragmentem dźwięku z danych wejściowych dźwięku, które przyczyniają się do wyniku końcowego, a czasem odebrania wyniku końcowego z usługi rozpoznawania mowy. Dodano element w wersji 1.3.0.
SpeechServiceResponse_RecognitionBackend	Zaplecze rozpoznawania. Dostępne tylko do odczytu w wynikach rozpoznawania mowy. Wskazuje to, czy do wygenerowania wyniku użyto rozpoznawania chmury (online), czy osadzonego (offline).
SpeechServiceResponse_SynthesisFirstByteLatencyMs	Opóźnienie pierwszego bajtu syntezy mowy w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach syntezy mowy. Mierzy to opóźnienie między rozpoczęciem przetwarzania syntezy, a momentem udostępnienia pierwszego bajtu dźwięku. Dodano element w wersji 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs	Synteza mowy wszystkie bajty opóźnienia w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach syntezy mowy. Mierzy to opóźnienie między rozpoczęciem przetwarzania syntezy, a momentem syntezy całego dźwięku. Dodano element w wersji 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs	Underrun czas syntezy mowy w milisekundach. Dostępne tylko do odczytu wyniki zdarzeń SynthesisCompleted. To mierzy całkowity czas underrun z PropertyId::AudioConfig_PlaybackBufferLengthInMs jest wypełniony w celu ukończenia syntezy. Dodano element w wersji 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs	Opóźnienie połączenia syntezy mowy w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach syntezy mowy. Mierzy to opóźnienie między rozpoczęciem przetwarzania syntezy, a momentem ustanowienia połączenia HTTP/WebSocket. Dodano element w wersji 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs	Opóźnienie sieci syntezy mowy w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach syntezy mowy. Mierzy to czas rundy sieciowej. Dodano element w wersji 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs	Opóźnienie usługi syntezy mowy w milisekundach. Tylko do odczytu, dostępne na końcowych wynikach syntezy mowy. Mierzy to czas przetwarzania usługi, aby zsyntetyzować pierwszy bajt dźwięku. Dodano element w wersji 1.26.0.
SpeechServiceResponse_SynthesisBackend	Wskazuje, które zaplecze syntezy zostało zakończone. Tylko do odczytu, dostępne w wynikach syntezy mowy, z wyjątkiem wyniku zdarzenia SynthesisStarted Dodano w wersji 1.17.0.
CancellationDetails_Reason	Przyczyna anulowania. Obecnie nieużywane.
CancellationDetails_ReasonText	Tekst anulowania. Obecnie nieużywane.
CancellationDetails_ReasonDetailedText	Szczegółowy tekst anulowania. Obecnie nieużywane.
LanguageUnderstandingServiceResponse_JsonResult	Dane wyjściowe odpowiedzi usługi Language Understanding Service (w formacie JSON). Dostępne za pośrednictwem intentRecognitionResult.Properties.
AudioConfig_DeviceNameForCapture	Nazwa urządzenia do przechwytywania dźwięku. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia AudioConfig::FromMicrophoneInput. UWAGA: ten identyfikator właściwości został dodany w wersji 1.3.0.
AudioConfig_NumberOfChannelsForCapture	Liczba kanałów do przechwytywania dźwięku. Tylko do użytku wewnętrznego. UWAGA: ten identyfikator właściwości został dodany w wersji 1.3.0.
AudioConfig_SampleRateForCapture	Częstotliwość próbkowania (w Hz) na potrzeby przechwytywania dźwięku. Tylko do użytku wewnętrznego. UWAGA: ten identyfikator właściwości został dodany w wersji 1.3.0.
AudioConfig_BitsPerSampleForCapture	Liczba bitów każdego przykładu na potrzeby przechwytywania dźwięku. Tylko do użytku wewnętrznego. UWAGA: ten identyfikator właściwości został dodany w wersji 1.3.0.
AudioConfig_AudioSource	Źródło audio. Dozwolone wartości to "Mikrofony", "Plik" i "Stream". Dodano element w wersji 1.3.0.
AudioConfig_DeviceNameForRender	Nazwa urządzenia do renderowania audio. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj elementu AudioConfig::FromSpeakerOutput. Dodano element w wersji 1.14.0.
AudioConfig_PlaybackBufferLengthInMs	Długość buforu odtwarzania w milisekundach domyślna to 50 milisekund.
AudioConfig_AudioProcessingOptions	Opcje przetwarzania dźwięku w formacie JSON.
Speech_LogFilename	Nazwa pliku do zapisywania dzienników. Dodano element w wersji 1.4.0.
Speech_SegmentationSilenceTimeoutMs	Czas trwania wykrytej ciszy mierzony w milisekundach, po którym funkcja zamiany mowy na tekst określi, że fraza mówiona została zakończona i wygeneruje końcowy wynik rozpoznany. Skonfigurowanie tego limitu czasu może być przydatne w sytuacjach, gdy mówione dane wejściowe są znacznie szybsze lub wolniejsze niż zwykle, a domyślne zachowanie segmentacji stale daje wyniki zbyt długie lub zbyt krótkie. Wartości limitu czasu segmentacji, które są nieodpowiednio wysokie lub niskie, mogą negatywnie wpływać na dokładność zamiany mowy na tekst; Ta właściwość powinna być starannie skonfigurowana, a wynikowe zachowanie powinno zostać dokładnie zweryfikowane zgodnie z oczekiwaniami.
Conversation_ApplicationId	Identyfikator używany do nawiązywania połączenia z usługą zaplecza. Dodano element w wersji 1.5.0.
Conversation_DialogType	Typ zaplecza okna dialogowego, z którymi chcesz nawiązać połączenie. Dodano element w wersji 1.7.0.
Conversation_Initial_Silence_Timeout	Limit czasu milczenia na potrzeby nasłuchiwania Dodano w wersji 1.5.0.
Conversation_From_Id	Od identyfikatora do użycia w działaniach rozpoznawania mowy Dodano w wersji 1.5.0.
Conversation_Conversation_Id	ConversationId sesji. Dodano element w wersji 1.8.0.
Conversation_Custom_Voice_Deployment_Ids	Rozdzielona przecinkami lista niestandardowych identyfikatorów wdrożenia głosowego. Dodano element w wersji 1.8.0.
Conversation_Speech_Activity_Template	Szablon działania mowy, właściwości sygnatury w szablonie dla działania wygenerowanego przez usługę dla mowy. Dodano element w wersji 1.10.0.
Conversation_ParticipantId	Identyfikator uczestnika w bieżącej konwersacji. Dodano element w wersji 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp	Sygnatura czasowa skojarzona z buforem danych zapisanym przez klienta podczas korzystania ze strumieni wejściowych ściągnięcia/wypychania audio. Sygnatura czasowa jest wartością 64-bitową o rozdzielczości 90 kHz. Jest taka sama jak sygnatura czasowa prezentacji w strumieniu transportu MPEG. Zobacz https://en.wikipedia.org/wiki/Presentation_timestamp Dodano w wersji 1.5.0.
DataBuffer_UserId	Identyfikator użytkownika skojarzony z buforem danych zapisanym przez klienta podczas korzystania ze strumieni wejściowych ściągnięcia/wypychania dźwięku. Dodano element w wersji 1.5.0.
PronunciationAssessment_ReferenceText	Tekst referencyjny dźwięku do oceny wymowy. Aby uzyskać te i następujące parametry oceny wymowy, zobacz tabelę Parametry oceny wymowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::Create lub WymowaAssessmentConfig::SetReferenceText. Dodano element w wersji 1.14.0.
PronunciationAssessment_GradingSystem	System punktów kalibracji wyniku wymowy (FivePoint lub HundredMark). W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::Create. Dodano element w wersji 1.14.0.
PronunciationAssessment_Granularity	Stopień szczegółowości oceny wymowy (Phoneme, Word lub FullText). W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::Create. Dodano element w wersji 1.14.0.
PronunciationAssessment_EnableMiscue	Określa, czy włączyć błędne obliczenie. Po włączeniu tej opcji wymawiane wyrazy zostaną porównane z tekstem referencyjnym i zostaną oznaczone pominięciem/wstawianiem na podstawie porównania. Ustawieniem domyślnym jest Fałsz. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::Create. Dodano element w wersji 1.14.0.
PronunciationAssessment_PhonemeAlphabet	Alfabet fonetyczny oceny wymowy. Prawidłowe wartości to "SAPI" (wartość domyślna) i "IPA" W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::SetPhonemeAlphabet. Dodano element w wersji 1.20.0.
PronunciationAssessment_NBestPhonemeCount	Ocena wymowy nbest liczba phoneme. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::SetNBestPhonemeCount. Dodano element w wersji 1.20.0.
PronunciationAssessment_EnableProsodyAssessment	Czy włączyć ocenę prosody. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::EnableProsodyAssessment. Dodano element w wersji 1.33.0.
PronunciationAssessment_Json	Ciąg json parametrów oceny wymowy W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::Create. Dodano element w wersji 1.14.0.
PronunciationAssessment_Params	Parametry oceny wymowy. Ta właściwość jest przeznaczona tylko do odczytu. Zestaw SDK używa go wewnętrznie. Dodano element w wersji 1.14.0.
PronunciationAssessment_ContentTopic	Temat treści oceny wymowy. W normalnych okolicznościach nie należy używać tej właściwości bezpośrednio. Zamiast tego użyj polecenia WymowaAssessmentConfig::EnableContentAssessmentWithTopic. Dodano element w wersji 1.33.0.
SpeakerRecognition_Api_Version	Wersja interfejsu API rozpoznawania osoby mówiącej. Ta właściwość jest dodawana w celu umożliwienia testowania i używania poprzednich wersji interfejsów API rozpoznawania osoby mówiącej, jeśli ma to zastosowanie. Dodano element w wersji 1.18.0.
SpeechTranslation_ModelName	Nazwa modelu, który ma być używany do tłumaczenia mowy. Nie używaj tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana funkcja EmbeddedSpeechConfig.
SpeechTranslation_ModelKey	Klucz odszyfrowywania modelu, który ma być używany do tłumaczenia mowy. Nie używaj tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana funkcja EmbeddedSpeechConfig.
KeywordRecognition_ModelName	Nazwa modelu, który ma być używany do rozpoznawania słów kluczowych. Nie używaj tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana funkcja EmbeddedSpeechConfig.
KeywordRecognition_ModelKey	Klucz odszyfrowywania modelu, który ma być używany do rozpoznawania słów kluczowych. Nie używaj tej właściwości bezpośrednio. Obecnie jest to prawidłowe tylko wtedy, gdy jest używana funkcja EmbeddedSpeechConfig.
EmbeddedSpeech_EnablePerformanceMetrics	Włącz zbieranie osadzonych metryk wydajności mowy, których można użyć do oceny możliwości urządzenia do korzystania z osadzonej mowy. Zebrane dane są uwzględniane w wynikach z określonych scenariuszy, takich jak rozpoznawanie mowy. Ustawieniem domyślnym jest "false". Należy pamiętać, że metryki mogą nie być dostępne we wszystkich scenariuszach osadzonej mowy.

Definiuje identyfikatory właściwości mowy. Zmieniono wersję 1.4.0.

enum OutputFormat

Wartości	Opisy
Prostota
szczegółowo

Format danych wyjściowych.

wyliczenie wulgaryzmówOption

Wartości	Opisy
Zamaskowany	Zamienia litery w wulgarnych wyrazach na znaki star.
Zostaną usunięte	Usuwa wulgarne słowa.
Nieprzetworzone	Nie robi nic, aby wulgaryzmować słowa.

Usuwa wulgaryzmy (przeklinanie) lub zastępuje litery wulgarnych słów gwiazdami. Dodano element w wersji 1.5.0.

wyliczenie ResultReason

Wartości	Opisy
NoMatch	Wskazuje, że nie można rozpoznać mowy. Więcej szczegółów można znaleźć w obiekcie NoMatchDetails.
Anulowane	Wskazuje, że rozpoznawanie zostało anulowane. Więcej szczegółów można znaleźć przy użyciu obiektu CancellationDetails.
Rozpoznawaniepeech	Wskazuje wynik mowy zawiera tekst hipotezy.
RecognizedSpeech	Wskazuje wynik mowy zawiera ostatni tekst, który został rozpoznany. Rozpoznawanie mowy jest teraz kompletne dla tej frazy.
Rozpoznawanie intencja	Wskazuje wynik intencji zawiera tekst hipotezy i intencję.
RecognizedIntent	Wskazuje wynik intencji zawiera ostateczny tekst i intencję. Rozpoznawanie mowy i określanie intencji są teraz kompletne dla tej frazy.
Tłumaczeniepeech	Wskazuje wynik tłumaczenia zawiera tekst hipotezy i jego tłumaczenia.
TranslatedSpeech	Wskazuje wynik tłumaczenia zawiera końcowy tekst i odpowiadające im tłumaczenia. Rozpoznawanie mowy i tłumaczenie są teraz kompletne dla tej frazy.
SynthesizingAudio	Wskazuje syntetyzowany wynik audio zawiera niezerową ilość danych audio.
SynthesizingAudioCompleted	Wskazuje, że syntetyzowany dźwięk jest teraz kompletny dla tej frazy.
Rozpoznawaniekeyword	Wskazuje wynik mowy zawiera (niezweryfikowany) tekst słowa kluczowego. Dodano element w wersji 1.3.0.
RecognizedKeyword	Wskazuje, że rozpoznawanie słów kluczowych zakończyło rozpoznawanie danego słowa kluczowego. Dodano element w wersji 1.3.0.
SynthesizingAudioStarted	Wskazuje, że synteza mowy została uruchomiona w wersji 1.4.0.
Tłumaczenie elementuParticipantSpeech	Wskazuje wynik transkrypcji zawiera tekst hipotezy i jego tłumaczenia dla innych uczestników konwersacji. Dodano element w wersji 1.8.0.
TranslatedParticipantSpeech	Wskazuje wynik transkrypcji zawiera końcowy tekst i odpowiadające im tłumaczenia dla innych uczestników konwersacji. Rozpoznawanie mowy i tłumaczenie są teraz kompletne dla tej frazy. Dodano element w wersji 1.8.0.
TranslatedInstantMessage	Wskazuje wynik transkrypcji zawiera komunikat błyskawiczny i odpowiednie tłumaczenia. Dodano element w wersji 1.8.0.
TranslatedParticipantInstantMessage	Wskazuje wynik transkrypcji zawiera wiadomość błyskawiczną dla innych uczestników konwersacji i odpowiednich tłumaczeń. Dodano element w wersji 1.8.0.
Rejestrowanie aplikacjiVoiceProfile	Wskazuje, że profil głosowy jest rejestrowane, a klienci muszą wysłać więcej dźwięku, aby utworzyć profil głosowy. Dodano element w wersji 1.12.0.
EnrolledVoiceProfile	Profil głosowy został zarejestrowany. Dodano element w wersji 1.12.0.
Osoby rozpoznane	Wskazuje pomyślną identyfikację niektórych osób mówiących. Dodano element w wersji 1.12.0.
RecognizedSpeaker	Wskazuje pomyślne zweryfikowanie jednego osoby mówiącej. Dodano element w wersji 1.12.0.
ResetVoiceProfile	Wskazuje, że profil głosowy został pomyślnie zresetowany. Dodano element w wersji 1.12.0.
DeletedVoiceProfile	Wskazuje, że profil głosowy został pomyślnie usunięty. Dodano element w wersji 1.12.0.
VoicesListRetrieved	Wskazuje, że lista głosów została pomyślnie pobrana. Dodano element w wersji 1.16.0.

Określa możliwe przyczyny wygenerowania wyniku rozpoznawania.

wyliczenie CancellationReason

Wartości	Opisy
Błąd	Wskazuje, że wystąpił błąd podczas rozpoznawania mowy.
EndOfStream	Wskazuje, że osiągnięto koniec strumienia audio.
CancelledByUser	Wskazuje, że żądanie zostało anulowane przez użytkownika. Dodano w wersji 1.14.0.

Definiuje możliwe przyczyny anulowania wyniku rozpoznawania.

enum CancellationErrorCode

Wartości	Opisy
NoError	Brak błędu. Jeśli wartość CancellationReason to EndOfStream, wartość CancellationErrorCode jest ustawiona na Wartość NoError.
AuthenticationFailure	Wskazuje błąd uwierzytelniania. Błąd uwierzytelniania występuje, jeśli klucz subskrypcji lub token autoryzacji jest nieprawidłowy, wygasł lub nie jest zgodny z używanym regionem.
BadRequest	Wskazuje, że co najmniej jeden parametr rozpoznawania jest nieprawidłowy lub format audio nie jest obsługiwany.
TooManyRequests	Wskazuje, że liczba żądań równoległych przekroczyła liczbę dozwolonych współbieżnych transkrypcji dla subskrypcji.
Forbidden	Wskazuje, że bezpłatna subskrypcja używana przez żądanie wyczerpała limit przydziału.
ConnectionFailure	Wskazuje błąd połączenia.
ServiceTimeout	Wskazuje błąd przekroczenia limitu czasu podczas oczekiwania na odpowiedź z usługi.
ServiceError	Wskazuje, że usługa zwraca błąd.
ServiceUnavailable	Wskazuje, że usługa jest obecnie niedostępna.
RuntimeError	Wskazuje nieoczekiwany błąd środowiska uruchomieniowego.
ServiceRedirectTemporary	Wskazuje, że usługa mowa tymczasowo żąda ponownego połączenia z innym punktem końcowym.
ServiceRedirectPermanent	Wskazuje, że usługa mowa na stałe żąda ponownego połączenia z innym punktem końcowym.
EmbeddedModelError	Wskazuje, że model mowy osadzonej (SR lub TTS) jest niedostępny lub uszkodzony.

Definiuje kod błędu w przypadku, gdy element CancellationReason to Błąd. Dodano w wersji 1.1.0.

enum NoMatchReason

Wartości	Opisy
NotRecognized	Wskazuje, że mowa została wykryta, ale nie została rozpoznana.
Initialsilencetimeout	Wskazuje, że początek strumienia audio zawierał tylko milczenie, a usługa upłynął limit czasu oczekiwania na mowę.
InitialBabbleTimeout	Wskazuje, że początek strumienia audio zawierał tylko szum, a usługa upłynął limit czasu oczekiwania na mowę.
Słowo kluczoweNotRecognized	Wskazuje, że zauważone słowo kluczowe zostało odrzucone przez usługę weryfikacji słowa kluczowego. Dodano w wersji 1.5.0.
EndSilenceTimeout	Wskazuje, że strumień dźwiękowy zawierał tylko milczenie po ostatnim rozpoznaniu frazy.

Definiuje możliwe przyczyny, dla których wynik rozpoznawania może nie zostać rozpoznany.

enum ActivityJSONType

Wartości	Opisy
Null
Obiekt
Tablica
Ciąg
Double
Uint
int
Wartość logiczna

Definiuje możliwe typy dla wartości json działania. Dodano w wersji 1.5.0.

enum SpeechSynthesisOutputFormat

Wartości	Opisy
Raw8Khz8BitMonoMULaw	raw-8khz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren	riff-16khz-16 kbps-mono-syrena Nieobsługiwana przez usługę. Nie używaj tej wartości.
Audio16Khz16KbpsMonoSiren	audio-16khz-16 kbps-mono-syrena Nieobsługiwane przez usługę. Nie używaj tej wartości.
Audio16Khz32KBitRateMonoMp3	audio-16khz-32kbitrate-mono-mp3
Audio16Khz128KBitRateMonoMp3	audio-16khz-128kbitrate-mono-mp3
Audio16Khz64KBitRateMonoMp3	audio-16khz-64kbitrate-mono-mp3
Audio24Khz48KBitRateMonoMp3	audio-24khz-48kbitrate-mono-mp3
Audio24Khz96KBitRateMonoMp3	audio-24khz-96kbitrate-mono-mp3
Audio24Khz160KBitRateMonoMp3	audio-24khz-160kbitrate-mono-mp3
Raw16Khz16BitMonoTrueSilk	raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm	riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm	riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm	riff-24khz-16bit-mono-pcm
Riff8Khz8BitMonoMULaw	riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm	raw-16khz-16bit-mono-pcm
Raw24Khz16BitMonoPcm	raw-24khz-16bit-mono-pcm
Raw8Khz16BitMonoPcm	raw-8khz-16bit-mono-pcm
Ogg16Khz16BitMonoOpus	ogg-16khz-16bit-mono-opus
Ogg24Khz16BitMonoOpus	ogg-24khz-16bit-mono-opus
Raw48Khz16BitMonoPcm	raw-48khz-16bit-mono-pcm
Riff48Khz16BitMonoPcm	riff-48khz-16bit-mono-pcm
Audio48Khz96KBitRateMonoMp3	audio-48khz-96kbitrate-mono-mp3
Audio48Khz192KBitRateMonoMp3	audio-48khz-192kbitrate-mono-mp3
Ogg48Khz16BitMonoOpus	ogg-48khz-16bit-mono-opus Dodano w wersji 1.16.0
Webm16Khz16BitMonoOpus	webm-16khz-16bit-mono-opus Dodano w wersji 1.16.0
Webm24Khz16BitMonoOpus	webm-24khz-16bit-mono-opus Dodano w wersji 1.16.0
Raw24Khz16BitMonoTrueSilk	raw-24khz-16bit-mono-truesilk dodano w wersji 1.17.0
Raw8Khz8BitMonoALaw	raw-8khz-8bit-mono-alaw Dodano w wersji 1.17.0
Riff8Khz8BitMonoALaw	riff-8khz-8bit-mono-alaw Dodano w wersji 1.17.0
Webm24Khz16Bit24KbpsMonoOpus	webm-24khz-16bit-24kbps-mono-opus Audio skompresowany przez koder-dekoder PLIKÓW PST w kontenerze WebM z szybkością transmisji bitów 24 kb/s zoptymalizowaną pod kątem scenariusza IoT. (Dodano w wersji 1.19.0)
Audio16Khz16Bit32KbpsMonoOpus	audio-16khz-16bit-32kbps-mono-opus Audio skompresowane przez koder-dekodera PST bez kontenera, z szybkością transmisji bitów 32 kb/s. (Dodano w wersji 1.20.0)
Audio24Khz16Bit48KbpsMonoOpus	audio-24khz-16bit-48kbps-mono-opus Audio skompresowane przez koder-dekodera PST bez kontenera, z szybkością transmisji bitów 48 kb/s. (Dodano w wersji 1.20.0)
Audio24Khz16Bit24KbpsMonoOpus	audio-24khz-16bit-24kbps-mono-opus Audio skompresowane przez koder-dekodera PST bez kontenera, z szybkością transmisji bitów 24 kb/s. (Dodano w wersji 1.20.0)
Raw22050Hz16BitMonoPcm	raw-22050hz-16bit-mono-pcm Nieprzetworzone audio PCM przy częstotliwości próbkowania 22050Hz i głębokości 16-bitowej. (Dodano w wersji 1.22.0)
Riff22050Hz16BitMonoPcm	riff-22050hz-16bit-mono-pcm pcm dźwięk PCM z częstotliwością próbkowania 22050Hz i głębokością 16-bitową, z nagłówkiem RIFF. (Dodano w wersji 1.22.0)
Raw44100Hz16BitMonoPcm	raw-44100hz-16bit-mono-pcm Nieprzetworzone audio PCM przy częstotliwości próbkowania 44100Hz i głębokości 16-bitowej. (Dodano w wersji 1.22.0)
Riff44100Hz16BitMonoPcm	riff-44100hz-16bit-mono-pcm pcm dźwięk PCM z częstotliwością próbkowania 44100Hz i głębokością 16-bitową, z nagłówkiem RIFF. (Dodano w wersji 1.22.0)
AmrWb16000Hz	amr-wb-16000hz dźwięk AMR-WB z częstotliwością próbkowania 16kHz. (Dodano w wersji 1.24.0)

Definiuje możliwe formaty dźwięku wyjściowego syntezy mowy. Zaktualizowano w wersji 1.19.0.

enum StreamStatus

Wartości	Opisy
Nieznane	Stan strumienia danych audio jest nieznany.
NoData	Strumień danych audio nie zawiera żadnych danych.
PartialData	Strumień danych audio zawiera częściowe dane żądania wypowiedzi.
AllData	Strumień danych audio zawiera wszystkie dane żądania wypowiedzi.
Anulowane	Strumień danych audio został anulowany.

Definiuje możliwy stan strumienia danych audio. Dodano element w wersji 1.4.0.

enum ServicePropertyChannel

Wartości	Opisy
UriQueryParameter	Używa parametru zapytania identyfikatora URI do przekazywania ustawień właściwości do usługi.
HttpHeader	Używa elementu HttpHeader do ustawiania klucza/wartości w nagłówku HTTP.

Definiuje kanały używane do przekazywania ustawień właściwości do usługi. Dodano element w wersji 1.5.0.

enum VoiceProfileType

Wartości	Opisy
TextIndependentIdentIfication	Identyfikacja osoby mówiącej niezależna od tekstu.
TextDependentVerification	Weryfikacja osoby mówiącej zależna od tekstu.
TextIndependentVerification	Weryfikacja niezależna od tekstu.

Definiuje typy profilów głosowych.

Enum RecognitionFactorScope

Wartości	Opisy
PartialPhrase	Współczynnik rozpoznawania będzie dotyczyć gramatyki, do których można się odwoływać jako pojedyncze frazy częściowe.

Definiuje zakres, do którego jest stosowany współczynnik rozpoznawania.

enum WymowaAssessmentGradingSystem

Wartości	Opisy
Pięć punktów	Pięć punktów kalibracji.
HundredMark	Sto znaków.

Definiuje system punktów do kalibracji wyniku wymowy; wartość domyślna to FivePoint. Dodano w wersji 1.14.0.

enum WymowaAssessmentGranularity

Wartości	Opisy
Fonem	Pokazuje wynik na poziomie pełnotekstu, wyrazów i phoneme.
Word	Pokazuje wynik na poziomie pełnego tekstu i wyrazów.
Pełnotekstowe	Pokazuje wynik tylko na poziomie pełnotekstowym.

Definiuje stopień szczegółowości oceny wymowy; wartość domyślna to Phoneme. Dodano w wersji 1.14.0.

enum SynthesisVoiceType

Wartości	Opisy
OnlineNeural	Głos neuronowy online.
OnlineStandard	Standardowy głos online.
OfflineNeural	Głos neuronowy w trybie offline.
Standard w trybie offline	Standardowy głos w trybie offline.

Definiuje typ głosów syntezy dodanych w wersji 1.16.0.

enum SynthesisVoiceGender

Wartości	Opisy
Nieznane	Nieznana płeć.
Kobiety	Głos kobiet.
Mężczyźni	Męski głos.

Definiuje płeć głosów syntezy dodanych w wersji 1.17.0.

enum SpeechSynthesisBoundaryType

Wartości	Opisy
Word	Word granicy.
Znaki interpunkcyjne	Granica interpunkcji.
Zdanie	Granica zdań.

Definiuje typ granicy zdarzenia granicy syntezy mowy Dodane w wersji 1.21.0.