Vad är Speech Services?What are the Speech Services?

Tal tjänsterna är arbetskonton av tal-till-text, text till tal och tal översättning till en enda Azure-prenumeration.The Speech Services are the unification of speech-to-text, text-to-speech, and speech-translation into a single Azure subscription. Det är enkelt att aktivera program, verktyg och enheter med tal-SDK, tal enheter SDKeller REST API: er.It's easy to speech enable your applications, tools, and devices with the Speech SDK, Speech Devices SDK, or REST APIs.

Viktigt

Tal tjänster har ersatt API för Bing-taligenkänning, Translator Speech och Custom Speech.Speech Services have replaced Bing Speech API, Translator Speech, and Custom Speech. Se instruktions guider > migrering för instruktioner om migrering.See How-to guides > Migration for migration instructions.

Dessa funktioner utgör Azures tal tjänster.These features make up the Azure Speech Services. Använd länkarna i den här tabellen för att lära dig mer om vanliga användnings fall för varje funktion eller Sök i API-referensen.Use the links in this table to learn more about common use cases for each feature or browse the API reference.

TjänstenService FunktionFeature BeskrivningDescription SDKSDK RESTREST
Tal till textSpeech-to-Text Tal till textSpeech-to-text Tal till text skickar ljud strömmar till text i real tid som dina program, verktyg eller enheter kan använda eller Visa.Speech-to-text transcribes audio streams to text in real time that your applications, tools, or devices can consume or display. Använd tal-till-text med language Understanding (Luis) för att härleda användar avsikter från inställt tal och agera på röst kommandon.Use speech-to-text with Language Understanding (LUIS) to derive user intents from transcribed speech and act on voice commands. JaYes JaYes
Batch-avskriftBatch Transcription Med batch-avskrifter kan du använda asynkrona tal-till-text-avskrifter av stora data volymer.Batch transcription enables asynchronous speech-to-text transcription of large volumes of data. Det här är en REST-baserad tjänst som använder samma slut punkt som anpassning och modell hantering.This is a REST-based service, which uses same endpoint as customization and model management. NejNo JaYes
Konversations avskriftConversation Transcription Aktiverar tal igenkänning i real tid, högtalar-ID och diarization.Enables real-time speech recognition, speaker identification, and diarization. Det är perfekt för att skriva över person möten med möjlighet att skilja på högtalare.It's perfect for transcribing in-person meetings with the ability to distinguish speakers. JaYes NejNo
Skapa Custom Speech modellerCreate Custom Speech Models Om du använder tal-till-text för igenkänning och avskriftering i en unik miljö kan du skapa och träna anpassade ljud-, språk-och uttals modeller för att hantera omgivande brus eller branschspecifika vokabulär.If you are using speech-to-text for recognition and transcription in a unique environment, you can create and train custom acoustic, language, and pronunciation models to address ambient noise or industry-specific vocabulary. NejNo JaYes
Text till talText-to-Speech Text till talText-to-speech Text till tal konverterar inmatad text till mänskligt syntetiskt tal med SSML (Speech syntes Markup Language).Text-to-speech converts input text into human-like synthesized speech using Speech Synthesis Markup Language (SSML). Välj bland standard röster och neurala röster (se språk stöd).Choose from standard voices and neural voices (see Language support). JaYes JaYes
Skapa anpassade rösterCreate Custom Voices Skapa anpassade röst teckensnitt som är unika för ditt varumärke eller din produkt.Create custom voice fonts unique to your brand or product. NejNo JaYes
TalöversättningSpeech Translation TalöversättningSpeech translation Tal översättning möjliggör real tids översättning av tal till dina program, verktyg och enheter i real tid.Speech translation enables real-time, multi-language translation of speech to your applications, tools, and devices. Använd den här tjänsten för tal-till-tal-och tal-till-text-översättning.Use this service for speech-to-speech and speech-to-text translation. JaYes NejNo
Röst-första virtuella assistenterVoice-first Virtual Assistants Röst-första virtuella assistenterVoice-first virtual assistants Anpassade virtuella assistenter som använder Azure Speech Services ger utvecklare möjlighet att skapa naturliga, mänskliga konversations gränssnitt för sina program och upplevelser.Custom virtual assistants using Azure Speech Services empower developers to create natural, human-like conversational interfaces for their applications and experiences. Robot Framework: s direkta rad tal kanal förbättrar dessa funktioner genom att tillhandahålla en samordnad, dirigerad start punkt till en kompatibel robot som möjliggör röst i, röst ut-interaktion med låg latens och hög tillförlitlighet.The Bot Framework's Direct Line Speech channel enhances these capabilities by providing a coordinated, orchestrated entry point to a compatible bot that enables voice in, voice out interaction with low latency and high reliability. JaYes NejNo

Nyheter och uppdateringarNews and updates

Lär dig vad som är nytt med Azure Speech Services.Learn what's new with the Azure Speech Services.

Testa tal tjänsterTry Speech Services

Vi erbjuder snabb starter i de flesta populära programmeringsspråk, som var utformade för att du ska kunna köra kod på mindre än 10 minuter.We offer quickstarts in most popular programming languages, each designed to have you running code in less than 10 minutes. Den här tabellen innehåller de populäraste snabb starterna för varje funktion.This table contains the most popular quickstarts for each feature. Använd den vänstra navigeringen för att utforska fler språk och plattformar.Use the left-hand navigation to explore additional languages and platforms.

Tal till text (SDK)Speech-to-text (SDK) Text till tal (SDK)Text-to-Speech (SDK) Översättning (SDK)Translation (SDK)
C#, .NET Core (Windows)C#, .NET Core (Windows) C#, .NET Framework (Windows)C#, .NET Framework (Windows) Java (Windows, Linux)Java (Windows, Linux)
Java Script (webbläsare)JavaScript (Browser) C++ (Windows)C++ (Windows) C#, .NET Core (Windows)C#, .NET Core (Windows)
Python (Windows, Linux, macOS)Python (Windows, Linux, macOS) C++ (Linux)C++ (Linux) C#, .NET Framework (Windows)C#, .NET Framework (Windows)
Java (Windows, Linux)Java (Windows, Linux) C++ (Windows)C++ (Windows)

Anteckning

Tal till text och text till tal har också REST-slutpunkter och tillhör ande snabb starter.Speech-to-text and text-to-speech also have REST endpoints and associated quickstarts.

När du har haft möjlighet att använda tal tjänsterna kan du prova vår självstudie som lär dig hur du kan identifiera avsikter från tal med hjälp av talet SDK och LUIS.After you've had a chance to use the Speech Services, try our tutorial that teaches you how to recognize intents from speech using the Speech SDK and LUIS.

Hämta exempelkodGet sample code

Exempel kod finns på GitHub för var och en av Azure Speech Services.Sample code is available on GitHub for each of the Azure Speech Services. De här exemplen beskriver vanliga scenarier som att läsa ljud från en fil eller ström, kontinuerlig och enkel igenkänning och arbeta med anpassade modeller.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition, and working with custom models. Använd dessa länkar om du vill visa SDK: er och REST-exempel:Use these links to view SDK and REST samples:

Anpassa din tal upplevelseCustomize your speech experience

Azure Speech Services fungerar bra med inbyggda modeller, men du kanske vill anpassa och justera upplevelsen för din produkt eller miljö ytterligare.Azure Speech Services works well with built-in models, however, you may want to further customize and tune the experience for your product or environment. Anpassnings alternativ sträcker sig från akustisk modell justering till unika röst teckensnitt för ditt varumärke.Customization options range from acoustic model tuning to unique voice fonts for your brand. När du har skapat en anpassad modell kan du använda den med valfri Azure Speech Services.After you've built a custom model, you can use it with any of the Azure Speech Services.

Tjänst för taligenkänningSpeech Service PlattformPlatform BeskrivningDescription
Tal till textSpeech-to-Text Anpassat talCustom Speech Anpassa tal igenkännings modeller till dina behov och tillgängliga data.Customize speech recognition models to your needs and available data. Övervinn hinder för taligenkänning som samtalsstil, vokabulär och bakgrundsljud.Overcome speech recognition barriers such as speaking style, vocabulary and background noise.
Text till talText-to-Speech Anpassad röstCustom Voice Bygg en igenkännings Bart, en-av-en-röst för dina text till tal-appar med dina inläsnings data tillgängliga.Build a recognizable, one-of-a-kind voice for your Text-to-Speech apps with your speaking data available. Du kan finjustera röst utmatningarna ytterligare genom att justera en uppsättning röst parametrar.You can further fine-tune the voice outputs by adjusting a set of voice parameters.

ReferensdokumentReference docs

Nästa stegNext steps