Mi az a beszédszolgáltatás?What is the Speech service?

A beszédfelismerési szolgáltatás a beszéd-szöveg, a szöveg és a beszéd egyesítése, valamint a beszédfelismerés egyetlen Azure-előfizetésbe való fordítása.The Speech service is the unification of speech-to-text, text-to-speech, and speech-translation into a single Azure subscription. A Speech SDK, a SPEECH Devices SDKvagy a REST API-k segítségével egyszerűen elvégezheti az alkalmazások, eszközök és eszközök használatát.It's easy to speech enable your applications, tools, and devices with the Speech SDK, Speech Devices SDK, or REST APIs.

Fontos

A beszédfelismerési szolgáltatás Bing Speech API, Translator Speech és Custom Speech váltotta fel.The Speech service has replaced Bing Speech API, Translator Speech, and Custom Speech. Tekintse át az áttelepítési utasítások > áttelepítési útmutatókat.See How-to guides > Migration for migration instructions.

Ezek a funkciók alkotják a beszédfelismerési szolgáltatást.These features make up the Speech service. Az ebben a táblázatban található hivatkozásokkal többet tudhat meg az egyes funkciók általános használati eseteiről, vagy böngészhet az API-referenciában.Use the links in this table to learn more about common use cases for each feature or browse the API reference.

SzolgáltatásService SzolgáltatásFeature LeírásDescription SDKSDK RESTREST
Beszéd – szövegSpeech-to-Text DiktálásSpeech-to-text A beszéd-szöveg szöveggé átmásolja a hangadatfolyamokat valós időben a szöveggé, hogy alkalmazásai, eszközei vagy eszközei képesek legyenek a felhasználásra vagy a megjelenítésre.Speech-to-text transcribes audio streams to text in real time that your applications, tools, or devices can consume or display. A beszéd-szöveg és a Language Understanding (Luis) használatával származtatott beszédből származó felhasználói leképezéseket származtathat, és hangparancsokat alkalmazhat.Use speech-to-text with Language Understanding (LUIS) to derive user intents from transcribed speech and act on voice commands. IgenYes IgenYes
Kötegelt átírásBatch Transcription A Batch-átírás lehetővé teszi a nagy mennyiségű adatforgalom aszinkron beszéd-szöveggé átírását.Batch transcription enables asynchronous speech-to-text transcription of large volumes of data. Ez egy REST-alapú szolgáltatás, amely ugyanazt a végpontot használja, mint a Testreszabás és a modell kezelése.This is a REST-based service, which uses same endpoint as customization and model management. NemNo IgenYes
Több eszközre kiterjedő beszélgetésMulti-device Conversation Több eszköz vagy ügyfél csatlakoztatása egy beszélgetésben beszéd-vagy szöveges üzenetek küldéséhez egyszerű támogatással a transzkripció és a fordítás számáraConnect multiple devices or clients in a conversation to send speech- or text-based messages, with easy support for transcription and translation IgenYes NemNo
Beszélgetés átirataConversation Transcription Lehetővé teszi a valós idejű beszédfelismerést, a hangszórók azonosítását és a diarization.Enables real-time speech recognition, speaker identification, and diarization. A személyes értekezletek átírása tökéletes választás a hangszórók megkülönböztetésére.It's perfect for transcribing in-person meetings with the ability to distinguish speakers. IgenYes NemNo
Custom Speech modellek létrehozásaCreate Custom Speech Models Ha egy egyedi környezetben beszéd-szövegeket használ az elismeréshez és az átíráshoz, létrehozhat és betaníthat egyéni akusztikai, nyelvi és kiejtési modelleket a környezeti zajok vagy az iparági specifikus szókincsek kezeléséhez.If you are using speech-to-text for recognition and transcription in a unique environment, you can create and train custom acoustic, language, and pronunciation models to address ambient noise or industry-specific vocabulary. NemNo IgenYes
Szöveg – beszédText-to-Speech SzövegfelolvasásText-to-speech A szöveg és a beszéd szöveggé alakítja át a bemeneti szöveget az emberi környezetbe, például a Speech szintézis Markup Language (SSML)használatával.Text-to-speech converts input text into human-like synthesized speech using Speech Synthesis Markup Language (SSML). A standard hangok és a neurális hangok közül választhat (lásd a nyelvi támogatást).Choose from standard voices and neural voices (see Language support). IgenYes IgenYes
Egyéni hangok létrehozásaCreate Custom Voices Egyedi hangbetűkészletek létrehozása a márka vagy a termék számára.Create custom voice fonts unique to your brand or product. NemNo IgenYes
BeszédfordításSpeech Translation BeszédfordításSpeech translation A beszédfelismerés valós idejű, többnyelvű fordítást tesz lehetővé alkalmazásaihoz, eszközeihez és eszközeihez.Speech translation enables real-time, multi-language translation of speech to your applications, tools, and devices. Használja ezt a szolgáltatást beszéd – beszéd és beszéd – szöveg fordításához.Use this service for speech-to-speech and speech-to-text translation. IgenYes NemNo
Hangvezérelt asszisztensekVoice assistants Hangvezérelt asszisztensekVoice assistants A beszédfelismerési szolgáltatást használó hangsegédek lehetővé teszik a fejlesztők számára, hogy természetes, emberi jellegű társalgási felületet hozzanak létre alkalmazásaikban és tapasztalataikban.Voice assistants using the Speech service empower developers to create natural, human-like conversational interfaces for their applications and experiences. A hangsegéd szolgáltatás gyors, megbízható interakciót biztosít egy eszköz és egy asszisztens implementáció között, amely a bot Framework közvetlen vonalas vagy integrált egyéni parancsait (előzetes verzió) használja a feladatok befejezéséhez.The voice assistant service provides fast, reliable interaction between a device and an assistant implementation that uses the Bot Framework's Direct Line Speech channel or the integrated Custom Commands (Preview) service for task completion. IgenYes NemNo

Hírek és frissítésekNews and updates

Ismerje meg a beszédfelismerési szolgáltatás újdonságait.Learn what's new with the Speech service.

A beszédfelismerési szolgáltatás kipróbálásaTry the Speech service

A legnépszerűbb programozási nyelveken gyors útmutatókat ajánlunk, amelyek mindegyike kevesebb, mint 10 perc alatt futtathatja a kódot.We offer quickstarts in most popular programming languages, each designed to have you running code in less than 10 minutes. Ez a táblázat az egyes szolgáltatásokhoz tartozó legnépszerűbb gyors útmutatókat tartalmazza.This table contains the most popular quickstarts for each feature. A bal oldali navigációs sávon további nyelveket és platformokat is felhasználhat.Use the left-hand navigation to explore additional languages and platforms.

Beszéd – szöveg (SDK)Speech-to-text (SDK) Szöveg – beszéd (SDK)Text-to-Speech (SDK) Fordítás (SDK)Translation (SDK)
Hangfájlból származó beszéd felismeréseRecognize speech from an audio file Beszéd szintetizálása hangfájlbaSynthesize speech into an audio file Beszéd fordítása szöveggéTranslate speech to text
Beszéd felismerése mikrofonnalRecognize speech with a microphone Beszéd szintetizálása egy beszélő számáraSynthesize speech to a speaker Beszéd fordítása több megcélzott nyelvreTranslate speech to multiple target languages
BLOB Storage-ban tárolt beszéd felismeréseRecognize speech stored in blob storage Aszinkron szintézis a hosszú formátumú hangokhozAsync synthesis for long-form audio Beszéd – beszéd fordításaTranslate speech-to-speech

Megjegyzés

A beszédfelismerés és a szöveg beszéde is a REST-végpontokkal és a hozzájuk kapcsolódó gyors útmutatókkal is rendelkezik.Speech-to-text and text-to-speech also have REST endpoints and associated quickstarts.

A beszédfelismerési szolgáltatás használatának lehetősége után próbálja ki az oktatóanyagot, amely bemutatja, hogyan ismerheti fel a beszédfelismerési szándékokat a Speech SDK és a LUIS használatával.After you've had a chance to use the Speech service, try our tutorial that teaches you how to recognize intents from speech using the Speech SDK and LUIS.

Mintakód letöltéseGet sample code

Mintakód elérhető a GitHubon a Speech Service-hez.Sample code is available on GitHub for the Speech service. Ezek a minták olyan gyakori forgatókönyveket érintenek, mint például a hang fájlból vagy streamből való olvasása, a folyamatos és az egyszeri felvétel felismerése, valamint az egyéni modellek használata.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition, and working with custom models. Az alábbi hivatkozásokkal megtekintheti az SDK-t és a REST-mintákat:Use these links to view SDK and REST samples:

A beszédfelismerési élmény testreszabásaCustomize your speech experience

A beszédfelismerési szolgáltatás a beépített modellekkel jól működik, azonban érdemes lehet tovább testreszabni és hangolni a termék vagy a környezet élményét.The Speech service works well with built-in models, however, you may want to further customize and tune the experience for your product or environment. A testreszabási lehetőségek köre az akusztikus modell finomhangolása és a márka egyedi hangbetűkészletei között.Customization options range from acoustic model tuning to unique voice fonts for your brand.

BeszédszolgáltatásSpeech Service PlatformPlatform LeírásDescription
Hang-szöveg transzformációSpeech-to-Text Custom SpeechCustom Speech Testreszabhatja a beszédfelismerési modelleket igényeihez és rendelkezésre álló adataihoz.Customize speech recognition models to your needs and available data. Kiküszöbölheti a beszédfelismerést akadályozó tényezőket, például a különféle beszédstílusok, a háttérzaj vagy a szókincs által okozott problémákat.Overcome speech recognition barriers such as speaking style, vocabulary and background noise.
Szöveg-hang transzformációText-to-Speech Egyéni hangCustom Voice Létrehozhat egy felismerhető és egyedülálló hangot szövegfelolvasási alkalmazásaihoz az elérhető beszédadatokkal.Build a recognizable, one-of-a-kind voice for your Text-to-Speech apps with your speaking data available. A hangkimeneteket tovább finomíthatja a hangparaméterek készletének módosításával.You can further fine-tune the voice outputs by adjusting a set of voice parameters.

SegédanyagokReference docs

Következő lépésekNext steps