speech Csomag

Pythonhoz készült Microsoft Speech SDK

Modulok

audio

A különböző felismerőkhöz érkező hangbemenetek kezelésével és a beszédszintetizátor hangkimenetével foglalkozó osztályok.

dialog

A párbeszédpanel-szolgáltatás összekötőjével kapcsolatos osztályok.

enums

Pythonhoz készült Microsoft Speech SDK

intent

A beszédből származó szándékfelismeréshez kapcsolódó osztályok.

interop

Pythonhoz készült Microsoft Speech SDK

languageconfig

A nyelvi konfigurációk kezelésével kapcsolatos osztályok

properties

Pythonhoz készült Microsoft Speech SDK

speech

A szöveg beszédből való felismeréséhez, a szövegből való szintetizáláshoz és a különböző felismerőkben használt általános osztályokhoz kapcsolódó osztályok.

transcription

A beszélgetés átírásához kapcsolódó osztályok.

translation

A beszéd más nyelvekre történő fordításához kapcsolódó osztályok.

version

Pythonhoz készült Microsoft Speech SDK

Osztályok

AudioDataStream

A hangadatok streamként való üzemeltetéséhez használt hangadatfolyamot jelöli.

Hangadatfolyamot hoz létre egy beszédszintézis eredményéből (a SpeechSynthesisResult típus) vagy egy kulcsszófelismerési eredményből (a KeywordRecognitionResult típus).

AutoDetectSourceLanguageResult

Az automatikus észlelési forrásnyelv eredményét jelöli.

Az eredmény inicializálható egy beszédfelismerési eredményből.

CancellationDetails

Pythonhoz készült Microsoft Speech SDK

Connection

Proxyosztály a megadott Recognizerbeszédszolgáltatással való kapcsolat kezeléséhez.

Alapértelmezés szerint egy Recognizer autonóm módon kezeli a szolgáltatáshoz való kapcsolatot, ha szükséges. Az Connection osztály további módszereket biztosít a felhasználók számára a kapcsolat explicit megnyitásához vagy bezárásához, valamint a kapcsolat állapotváltozására való feliratkozáshoz. A használata Connection nem kötelező. Olyan helyzetekhez készült, amikor szükség van az alkalmazás viselkedésének finomhangolására a kapcsolat állapota alapján. A felhasználók igény szerint felhívhatják open , hogy manuálisan kezdeményezhessenek szolgáltatáskapcsolatot, mielőtt elkezdenének felismerni az Recognizer ehhez Connectiontársítottat. A felismerés elindítása után hívás open vagy close sikertelen lehet. Ez nem befolyásolja a Felismerőt vagy a folyamatban lévő felismerést. A kapcsolat több okból is megszakadhat, a Recognizer mindig megpróbálja újra létrehozni a kapcsolatot a folyamatos műveletek garantálásához szükséges módon. Ezekben az esetekben connected/disconnected az események a kapcsolat állapotának változását jelzik.

Megjegyzés

Frissítve az 1.17.0-s verzióban.

Konstruktor belső használatra.

ConnectionEventArgs

Adatokat biztosít a ConnectionEventhez.

Megjegyzés

Hozzáadva az 1.2.0-s verzióhoz

Konstruktor belső használatra.

EventSignal

Az ügyfelek csatlakozhatnak az eseményjelhez az események fogadásához, vagy leválaszthatják az eseményjelet az események fogadásának leállításához.

Konstruktor belső használatra.

KeywordRecognitionEventArgs

A kulcsszófelismerő eseményargumentumok osztálya.

Konstruktor belső használatra.

KeywordRecognitionModel

Kulcsszófelismerő modellt jelöl.

KeywordRecognitionResult

Kulcsszófelismerő művelet eredménye.

Konstruktor belső használatra.

KeywordRecognizer

Egy kulcsszó-felismerő.

NoMatchDetails

Pythonhoz készült Microsoft Speech SDK

PhraseListGrammar

Osztály, amely lehetővé teszi a futásidejű hozzáadása kifejezés tippeket, hogy segítse a beszédfelismerést.

A felismerőhöz hozzáadott kifejezések a következő felismerés kezdetén, vagy amikor a beszédfelismerőnek legközelebb újra csatlakoznia kell a beszédszolgáltatáshoz.

Megjegyzés

Hozzáadva az 1.5.0-s verzióhoz.

Konstruktor belső használatra.

PronunciationAssessmentConfig

A kiejtésértékelés konfigurációját jelöli

Megjegyzés

Hozzáadva az 1.14.0-s verzióhoz.

A konfiguráció kétféleképpen inicializálható:

  • paraméterekből: adjon át referenciaszöveget, osztályozási rendszert, részletességet, engedélyezze a hibás állapotot és a forgatókönyv azonosítóját.

  • json-ból: json-sztring átadása

A paraméterek részleteiért lásd: https://docs.microsoft.com/azure/cognitive-services/speech-service/rest-speech-to-text#pronunciation-assessment-parameters

PronunciationAssessmentPhonemeResult

Fonetikai szintű kiejtésértékelés eredményét tartalmazza

Megjegyzés

Hozzáadva az 1.14.0-s verzióhoz.

PronunciationAssessmentResult

A kiejtésértékelés eredményét jelöli.

Megjegyzés

Hozzáadva az 1.14.0-s verzióhoz.

Az eredmény inicializálható egy beszédfelismerési eredményből.

PronunciationAssessmentWordResult

Szószintű kiejtésértékelés eredményét tartalmazza

Megjegyzés

Hozzáadva az 1.14.0-s verzióhoz.

PropertyCollection

Tulajdonságértékek tulajdonsággyűjteményből való lekéréséhez vagy beállításához osztály.

RecognitionEventArgs

Adatokat biztosít a RecognitionEventhez.

Konstruktor belső használatra.

RecognitionResult

Részletes információk a felismerési művelet eredményéről.

Konstruktor belső használatra.

Recognizer

Alaposztály különböző felismerőkhöz

ResultFuture

Egy aszinkron művelet eredménye.

privát konstruktor

SessionEventArgs

A munkamenetesemény-argumentumok alaposztálya.

Konstruktor belső használatra.

SourceLanguageRecognizer

A forrásnyelv-felismerő – önálló nyelvfelismerő – egyetlen nyelvhez vagy folyamatos nyelvfelismeréshez használható.

Megjegyzés

Hozzáadva az 1.18.0-s verzióhoz.

SpeechConfig

A beszéd-/szándékfelismerési és beszédszintézis-konfigurációkat meghatározó osztály.

A konfiguráció különböző módokon inicializálható:

  • előfizetésből: adjon át egy előfizetési kulcsot és egy régiót

  • végpontról: adjon át egy végpontot. Az előfizetési kulcs vagy az engedélyezési jogkivonat megadása nem kötelező.

  • a gazdagépről: adjon meg egy gazdagépcímet. Az előfizetési kulcs vagy az engedélyezési jogkivonat megadása nem kötelező.

  • engedélyezési jogkivonatból: adjon át egy engedélyezési jogkivonatot és egy régiót

SpeechRecognitionCanceledEventArgs

A beszédfelismerési osztály megszakította az eseményargumentumokat.

Konstruktor belső használatra.

SpeechRecognitionEventArgs

A beszédfelismerési eseményargumentumok osztálya.

Konstruktor belső használatra.

SpeechRecognitionResult

A beszédfelismerési eredmények alaposztálya.

Konstruktor belső használatra.

SpeechRecognizer

Egy beszédfelismerő. Ha forrásnyelvi adatokat kell megadnia, csak a három paraméter, nyelv, source_language_config vagy auto_detect_source_language_config egyikét adja meg.

SpeechSynthesisBookmarkEventArgs

A beszédszintézis könyvjelző-eseményargumentumainak osztálya.

Megjegyzés

Hozzáadva az 1.16.0-s verzióhoz.

Konstruktor belső használatra.

SpeechSynthesisCancellationDetails

Részletes információkat tartalmaz arról, hogy miért lett megszakítva egy eredmény.

SpeechSynthesisEventArgs

A beszédszintézis eseményargumentumainak osztálya.

Konstruktor belső használatra.

SpeechSynthesisResult

Beszédszintézisi művelet eredménye.

Konstruktor belső használatra.

SpeechSynthesisVisemeEventArgs

A beszédszintézis viseme eseményargumentumainak osztálya.

Megjegyzés

Hozzáadva az 1.16.0-s verzióhoz.

Konstruktor belső használatra.

SpeechSynthesisWordBoundaryEventArgs

A beszédszintézis szóhatár eseményargumentumainak osztálya.

Megjegyzés

Frissítve az 1.21.0-s verzióban.

Konstruktor belső használatra.

SpeechSynthesizer

Egy beszédszintetizátor.

SyllableLevelTimingResult

Szótagszintű időzítési eredményt tartalmaz

Megjegyzés

Hozzáadva az 1.20.0-s verzióhoz.

SynthesisVoicesResult

Részletes információkat tartalmaz a lekért szintézishangok listájáról.

Megjegyzés

Hozzáadva az 1.16.0-s verzióhoz.

Konstruktor belső használatra.

VoiceInfo

Részletes információkat tartalmaz a szintézis hanginformációiról.

Megjegyzés

Frissítve az 1.17.0-s verzióban.

Konstruktor belső használatra.

Enumerációk

AudioStreamContainerFormat

A támogatott hangstream tárolóformátumát határozza meg.

AudioStreamWaveFormat

A WAV-tárolóban megadott formátumot jelöli.

CancellationErrorCode

Hibakódot határoz meg abban az esetben, ha a CancellationReason hiba.

CancellationReason

Meghatározza azokat a lehetséges okokat, amelyek miatt a felismerési eredmény megszakadhat.

NoMatchReason

Meghatározza azokat a lehetséges okokat, amelyek miatt a felismerési eredmény nem ismerhető fel.

OutputFormat

Kimeneti formátum.

ProfanityOption

Eltávolítja a káromkodást (káromkodást), vagy a trágár szavak betűit csillagokra cseréli.

PronunciationAssessmentGradingSystem

Meghatározza a kiejtési pontszám kalibrálásának pontrendszerét; az alapértelmezett érték a FivePoint.

PronunciationAssessmentGranularity

Meghatározza a kiejtés-kiértékelési részletességet; az alapértelmezett érték a Phoneme.

PropertyId

Beszédtulajdonság-azonosítókat definiál.

ResultReason

Megadja a felismerési eredmény lehetséges okait.

ServicePropertyChannel

Meghatározza azokat a csatornákat, amelyekkel a tulajdonságbeállításokat átadhatja a szolgáltatásnak.

SpeechSynthesisOutputFormat

Meghatározza a lehetséges beszédszintézis kimeneti hangformátumait.

StreamStatus

Meghatározza a hangadatfolyam lehetséges állapotát.

SynthesisVoiceGender

Meghatározza a szintézishangok nemét

SynthesisVoiceType

A szintézishangok típusát határozza meg