Wat zijn de Speech Services?What are the Speech Services?

Azure Speech Services zijn van spraak naar tekst, tekst naar spraak en spraakomzetting combineert in een enkel Azure-abonnement.Azure Speech Services are the unification of speech-to-text, text-to-speech, and speech-translation into a single Azure subscription. Spraak eenvoudig inschakelen van uw toepassingen, hulpprogramma's en apparaten met de spraak SDK, spraak Devices SDK, of REST-API's.It's easy to speech enable your applications, tools, and devices with the Speech SDK, Speech Devices SDK, or REST APIs.

Belangrijk

Bing Speech-API, Translator Speech- en aangepaste spraak vervangen spraakservices.Speech Services have replaced Bing Speech API, Translator Speech, and Custom Speech. Zie instructies begeleidt > migratie voor migratie-instructies.See How-to guides > Migration for migration instructions.

Deze functies zijn vormen van de Azure-Services voor spraak.These features make up the Azure Speech Services. Gebruik de koppelingen in deze tabel voor meer informatie over algemene scenario's voor elke functie of de API-verwijzing bladeren.Use the links in this table to learn more about common use cases for each feature or browse the API reference.

ServiceService FunctieFeature DescriptionDescription SDKSDK RESTREST
Spraak-naar-tekstSpeech-to-Text Spraak-naar-tekstSpeech-to-text Spraak-naar-tekst transcribes audiostreams naar tekst in realtime die uw toepassingen, hulpprogramma's of apparaten kunnen gebruiken of weergeven.Speech-to-text transcribes audio streams to text in real time that your applications, tools, or devices can consume or display. Gebruik spraak-naar-tekst met Language Understanding (LUIS) worden afgeleid van de gebruiker intents van getranscribeerde spraak- en act op gesproken opdrachten.Use speech-to-text with Language Understanding (LUIS) to derive user intents from transcribed speech and act on voice commands. JaYes JaYes
Batch transcriptieBatch Transcription Batch transcriptie kunt asynchrone transcriptie van spraak-naar-tekst van grote hoeveelheden gegevens.Batch transcription enables asynchronous speech-to-text transcription of large volumes of data. Dit is een REST gebaseerde service die gebruikmaakt van hetzelfde eindpunt als aanpassing en Modelbeheer.This is a REST-based service, which uses same endpoint as customization and model management. NeeNo JaYes
Conversatie transcriptieConversation Transcription Maakt een realtime spraakherkenning, sprekeridentificatie en diarization.Enables real-time speech recognition, speaker identification, and diarization. Dit is ideaal voor het te vergaderingen in met de mogelijkheid om onderscheid sprekers te transcriberen.It's perfect for transcribing in-person meetings with the ability to distinguish speakers. JaYes NeeNo
Aangepaste Spraakmodellen makenCreate Custom Speech Models Als u van spraak-naar-tekst voor de opname- en schrijffouten in een unieke omgeving gebruikmaakt, kunt u maken en trainen aangepaste akoestische, taal en de uitspraak modellen adres omgevingsgeluid of branchespecifieke vocabulaire.If you are using speech-to-text for recognition and transcription in a unique environment, you can create and train custom acoustic, language, and pronunciation models to address ambient noise or industry-specific vocabulary. NeeNo JaYes
Tekst naar spraakText-to-Speech Tekst naar spraakText-to-speech Tekst naar spraak zet invoertekst in met behulp van kunstmatige spraak menselijke spraak synthese Markup Language (SSML).Text-to-speech converts input text into human-like synthesized speech using Speech Synthesis Markup Language (SSML). Kies uit de standard stemmen en neurale stemmen (Zie taalondersteuning).Choose from standard voices and neural voices (see Language support). JaYes JaYes
Maken van aangepaste stemmenCreate Custom Voices Maak aangepaste spraakstijlen uniek is voor uw merk of product.Create custom voice fonts unique to your brand or product. NeeNo JaYes
SpraakomzettingSpeech Translation SpraakomzettingSpeech translation Spraakomzetting kan realtime, meerdere talen vertaling van spraak naar uw toepassingen, hulpprogramma's en apparaten.Speech translation enables real-time, multi-language translation of speech to your applications, tools, and devices. Deze service voor spraak-naar-spraak- en spraak-naar-tekst vertalen gebruiken.Use this service for speech-to-speech and speech-to-text translation. JaYes NeeNo
Stem op de eerste virtuele assistentVoice-first Virtual Assistants Stem op de eerste virtuele assistentVoice-first virtual assistants Aangepaste virtuele assistenten met behulp van Azure Speech Services meer mogelijkheden bieden ontwikkelaars voor het maken van de natuurlijke, menselijke conversatie-interfaces voor hun toepassingen en ervaringen.Custom virtual assistants using Azure Speech Services empower developers to create natural, human-like conversational interfaces for their applications and experiences. De Bot Framework directe regel spraak kanaal verbetert deze mogelijkheden door te geven van een gecoördineerde, gecoördineerd toegangspunt een compatibel bot waarmee spraak in spraak van interactie met lage latentie en hoge betrouwbaarheid.The Bot Framework's Direct Line Speech channel enhances these capabilities by providing a coordinated, orchestrated entry point to a compatible bot that enables voice in, voice out interaction with low latency and high reliability. JaYes NeeNo

Nieuws en updatesNews and updates

Meer informatie over wat is er nieuw in de Azure-Services voor spraak.Learn what's new with the Azure Speech Services.

  • Juni 2019June 2019
    • Spraak SDK 1.6.0 uitgebracht.Released Speech SDK 1.6.0. Zie voor een volledige lijst van updates, verbeteringen en bekende problemen, opmerkingen bij de Release.For a full list of updates, enhancements, and known issues, see Release notes.
  • Mei 2019 - documentatie is nu beschikbaar voor conversatie transcriptie, Call Center transcriptie, en stem op de eerste virtuele assistenten.May 2019 - Documentation is now available for Conversation Transcription, Call Center Transcription, and Voice-first Virtual Assistants.
  • Mei 2019May 2019
    • Spraak SDK 1.5.1 uitgebracht.Released Speech SDK 1.5.1. Zie voor een volledige lijst van updates, verbeteringen en bekende problemen, opmerkingen bij de Release.For a full list of updates, enhancements, and known issues, see Release notes.
    • Spraak SDK 1.5.0 uitgebracht.Released Speech SDK 1.5.0. Zie voor een volledige lijst van updates, verbeteringen en bekende problemen, opmerkingen bij de Release.For a full list of updates, enhancements, and known issues, see Release notes.
  • April 2019 - die zijn uitgebracht spraak SDK 1.4.0 met ondersteuning voor tekst naar spraak (bèta) voor C++ C#, en Java in Windows en Linux.April 2019 - Released Speech SDK 1.4.0 with support for text-to-speech (Beta) for C++, C#, and Java on Windows and Linux. Bovendien de SDK biedt nu ondersteuning voor MP3- en Opus/Ogg audio-indelingen voor C++ en C# op Linux.Additionally, the SDK now supports MP3 and Opus/Ogg audio formats for C++ and C# on Linux. Zie voor een volledige lijst van updates, verbeteringen en bekende problemen, opmerkingen bij de Release.For a full list of updates, enhancements, and known issues, see Release notes.
  • Maart 2019 - is een nieuw eindpunt voor spraak die als resultaat een volledige lijst met beschikbare stemmen in een bepaalde regio geeft nu beschikbaar.March 2019 - A new endpoint for text-to-speech (TTS) that returns a full list of voices available in a specific region is now available. Bovendien worden nieuwe regio's worden nu ondersteund voor TTS.Additionally, new regions are now supported for TTS. Zie voor meer informatie, Text to Speech-API reference (REST).For more information, see Text-to-speech API reference (REST).

Speech Services proberenTry Speech Services

We bieden snelstartgidsen in de populairste programmeertalen, elk ontworpen dat u de uitvoering van code in minder dan 10 minuten.We offer quickstarts in most popular programming languages, each designed to have you running code in less than 10 minutes. Deze tabel bevat de meest populaire snelstartgidsen voor elke functie.This table contains the most popular quickstarts for each feature. Extra talen en platforms verkennen met behulp van de navigatiebalk aan de linkerkant.Use the left-hand navigation to explore additional languages and platforms.

Spraak-naar-tekst (SDK)Speech-to-text (SDK) Text to Speech (SDK)Text-to-Speech (SDK) Vertaling (SDK)Translation (SDK)
C#, .NET core (Windows)C#, .NET Core (Windows) C#, .NET framework (Windows)C#, .NET Framework (Windows) Java (Windows, Linux)Java (Windows, Linux)
JavaScript (Browser)JavaScript (Browser) C++ (Windows)C++ (Windows) C#, .NET core (Windows)C#, .NET Core (Windows)
Python (Windows, Linux, macOS)Python (Windows, Linux, macOS) C++ (Linux)C++ (Linux) C#, .NET framework (Windows)C#, .NET Framework (Windows)
Java (Windows, Linux)Java (Windows, Linux) C++ (Windows)C++ (Windows)

Notitie

Spraak-naar-tekst en spraak ook hebben REST-eindpunten en bijbehorende snelstartgidsen.Speech-to-text and text-to-speech also have REST endpoints and associated quickstarts.

Nadat u een kans om de spraak-Services te gebruiken hebt, Probeer onze zelfstudie u hoe u leert voor het herkennen van intenties van gesproken inhoud met behulp van de SDK van spraak en LUIS.After you've had a chance to use the Speech Services, try our tutorial that teaches you how to recognize intents from speech using the Speech SDK and LUIS.

Voorbeeldcode ophalenGet sample code

Voorbeeldcode is beschikbaar op GitHub voor elk van de Azure-Services voor spraak.Sample code is available on GitHub for each of the Azure Speech Services. Deze voorbeelden voor algemene scenario's, zoals lezen van audio van een bestand of de stroom, herkenning van doorlopende en één en werken met aangepaste modellen.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition, and working with custom models. Gebruik deze koppelingen om weer te geven SDK en REST-voorbeelden:Use these links to view SDK and REST samples:

Uw spraakherkenning aanpassenCustomize your speech experience

Azure Speech Services werkt goed met ingebouwde modellen, kunt u echter verder aanpassen en afstemmen van de ervaring voor het product of de omgeving.Azure Speech Services works well with built-in models, however, you may want to further customize and tune the experience for your product or environment. Aanpassing van opties voor het bereik van akoestisch model afstemmen op de unieke spraakstijlen voor uw merk.Customization options range from acoustic model tuning to unique voice fonts for your brand. Nadat u een aangepast model hebt gemaakt, kunt u deze kunt gebruiken met een van de Azure-Services voor spraak.After you've built a custom model, you can use it with any of the Azure Speech Services.

Speech ServiceSpeech Service ModelModel DescriptionDescription
Spraak naar tekstSpeech-to-Text Akoestisch modelAcoustic model Maak een aangepast akoestisch model voor toepassingen, hulpprogramma's, of apparaten die worden gebruikt in het bijzonder omgevingen, zoals in een auto of op een fabriek, elk met specifieke opname voorwaarden.Create a custom acoustic model for applications, tools, or devices that are used in particular environments like in a car or on a factory floor, each with specific recording conditions. Voorbeelden zijn onder meer accenten zijn niet toegestaan spraak, specifieke achtergrondgeluiden of met behulp van een specifieke microfoon voor de opname.Examples include accented speech, specific background noises, or using a specific microphone for recording.
TaalmodelLanguage model Maak een aangepast taalmodel ter verbetering van transcriptie van veld-specifieke vocabulaire en grammatica, zoals medische terminologie of IT-jargon.Create a custom language model to improve transcription of field-specific vocabulary and grammar, such as medical terminology, or IT jargon.
UitspraakmodelPronunciation model Met een aangepaste uitspraak-model, kunt u de fonetische vorm en de weergave van een woord of een term kunt definiëren.With a custom pronunciation model, you can define the phonetic form and display of a word or term. Dit is handig voor het verwerken van aangepaste voorwaarden, zoals productnamen of afkortingen.It's useful for handling customized terms, such as product names or acronyms. Alles wat u nodig hebt om te beginnen is een uitspraak van bestand--een eenvoudige txt-bestand.All you need to get started is a pronunciation file -- a simple .txt file.
Tekst naar spraakText-to-Speech SpraakstijlVoice font Aangepaste spraakstijlen kunnen u een herkenbare, één van een unieke stem voor uw merk maken.Custom voice fonts allow you to create a recognizable, one-of-a-kind voice for your brand. Het duurt slechts een kleine hoeveelheid gegevens aan de slag.It only takes a small amount of data to get started. Hoe meer gegevens dat u opgeeft, wordt de meer natuurlijke en menselijke uw spraakstijl klinkt.The more data that you provide, the more natural and human-like your voice font will sound.

ReferentiedocumentenReference docs

Volgende stappenNext steps