Co je služba Speech?What is the Speech service?

Služba rozpoznávání řeči je sjednocení převodu řeči na text, převod textu na řeč a rozpoznávání řeči do jednoho předplatného Azure.The Speech service is the unification of speech-to-text, text-to-speech, and speech-translation into a single Azure subscription. Rozpoznávání řeči vám umožní používat aplikace, nástroje a zařízení pomocí rozpoznávání řeči, sady Speech SDK, Speech Devices SDK, Speech Studionebo REST API.It's easy to speech enable your applications, tools, and devices with the Speech CLI, Speech SDK, Speech Devices SDK, Speech Studio, or REST APIs.

Důležité

Služba rozpoznávání řeči nahradila rozhraní API pro zpracování řeči Bingu a Translator Speech.The Speech service has replaced Bing Speech API and Translator Speech. Pokyny k migraci najdete v části věnované migraci .See the Migration section for migration instructions.

Následující funkce jsou součástí služby Speech.The following features are part of the Speech service. Pomocí odkazů v této tabulce se dozvíte víc o běžných případech použití pro jednotlivé funkce nebo o Projděte si referenční informace k rozhraní API.Use the links in this table to learn more about common use-cases for each feature, or browse the API reference.

SlužbaService FunkceFeature PopisDescription Sada SDKSDK RESTREST
Převod řeči na textSpeech-to-Text Převod řeči na text v reálném časeReal-time Speech-to-text Převod řeči na text transcribes nebo přeloží zvukové streamy nebo místní soubory na text v reálném čase, který mohou aplikace, nástroje nebo zařízení spotřebovat nebo zobrazit.Speech-to-text transcribes or translates audio streams or local files to text in real time that your applications, tools, or devices can consume or display. Použití převodu řeči na text s Language Understanding (Luis) k odvození záměrů uživatele z přepisu řeči a fungování hlasových příkazů.Use speech-to-text with Language Understanding (LUIS) to derive user intents from transcribed speech and act on voice commands. AnoYes AnoYes
Dávkové zpracování řeči na textBatch Speech-to-Text Batch Speech-to-text umožňuje asynchronní převod řeči na text s velkými objemy zvukového zvuku, který je uložený v Azure Blob Storage.Batch Speech-to-text enables asynchronous speech-to-text transcription of large volumes of speech audio data stored in Azure Blob Storage. Kromě převodu zvukového zvuku na text, Batch Speech-to-text také umožňuje diarization a mínění-Analysis.In addition to converting speech audio to text, Batch Speech-to-text also allows for diarization and sentiment-analysis. NoNo AnoYes
Konverzace s více zařízenímiMulti-device Conversation Připojení více zařízení nebo klientů v rámci konverzace pro odesílání hlasových a textových zpráv s jednoduchou podporou pro přepis a překladyConnect multiple devices or clients in a conversation to send speech- or text-based messages, with easy support for transcription and translation YesYes NoNo
Přepis konverzaceConversation Transcription Umožňuje rozpoznávání řeči v reálném čase, identifikaci mluvčího a diarization.Enables real-time speech recognition, speaker identification, and diarization. Je ideální pro zdlouhavého přepisování schůzky na osobu s možností odlišit reproduktory.It's perfect for transcribing in-person meetings with the ability to distinguish speakers. YesYes NoNo
Vytváření modelů Custom SpeechCreate Custom Speech Models Pokud používáte převod řeči na text pro rozpoznávání a přepis v jedinečném prostředí, můžete vytvořit a vyškolit vlastní modely akustického, jazyka a výslovnosti pro řešení hluku nebo slovníku specifického pro konkrétní obor.If you are using speech-to-text for recognition and transcription in a unique environment, you can create and train custom acoustic, language, and pronunciation models to address ambient noise or industry-specific vocabulary. NoNo AnoYes
Převod textu na řečText-to-Speech Převod textu na řečText-to-speech Převod textu na řeč převede vstupní text na syntetizované rozpoznávání řeči pomocí jazyka SSML (Speech syntézy).Text-to-speech converts input text into human-like synthesized speech using Speech Synthesis Markup Language (SSML). Používejte hlasy neuronové, což jsou hlasy podobné člověku, které využívají rozsáhlé neuronové sítě.Use neural voices, which are human-like voices powered by deep neural networks. Viz Podpora jazyků.See Language support. AnoYes AnoYes
Vytváření vlastních hlasůCreate Custom Voices Vytvářejte vlastní hlasová písma, která jsou jedinečná pro vaši značku nebo produkt.Create custom voice fonts unique to your brand or product. NoNo AnoYes
Překlad řečiSpeech Translation Překlad řečiSpeech translation Překlad řeči umožňuje překlady řeči v reálném čase pro aplikace, nástroje a zařízení v reálném čase.Speech translation enables real-time, multi-language translation of speech to your applications, tools, and devices. Použijte tuto službu pro překlad řeči a převod řeči na text.Use this service for speech-to-speech and speech-to-text translation. AnoYes NoNo
Hlasoví asistentiVoice assistants Hlasoví asistentiVoice assistants Hlasové asistenti, kteří používají službu pro rozpoznávání řeči, umožňují vývojářům vytvářet pro své aplikace a prostředí přirozené rozhraní pro konverzaci podobné člověku.Voice assistants using the Speech service empower developers to create natural, human-like conversational interfaces for their applications and experiences. Služba hlasového asistenta poskytuje rychlou a spolehlivou interakci mezi zařízením a implementací pomocníka, která používá kanál s přímým přístupem na platformě bot nebo integrovanou službu Custom Commands pro dokončení úkolu.The voice assistant service provides fast, reliable interaction between a device and an assistant implementation that uses the Bot Framework's Direct Line Speech channel or the integrated Custom Commands service for task completion. AnoYes NoNo
Rozpoznávání mluvčíhoSpeaker Recognition Identifikace & ověření mluvčíhoSpeaker verification & identification Služba rozpoznávání mluvčího poskytuje algoritmy pro ověřování a identifikaci mluvčích podle jejich jedinečných vlastností hlasu.The Speaker Recognition service provides algorithms that verify and identify speakers by their unique voice characteristics. Rozpoznávání mluvčího slouží k zodpovězení otázky "kdo se mluví?".Speaker Recognition is used to answer the question “who is speaking?”. YesYes AnoYes

Důležité

Pro všechny požadavky HTTP na tuto službu se teď vynutilo TLS 1,2.TLS 1.2 is now enforced for all HTTP requests to this service. Další informace najdete v tématu zabezpečení Azure Cognitive Services.For more information, see Azure Cognitive Services security.

Vyzkoušejte si službu Speech zdarmaTry the Speech service for free

Pro následující kroky potřebujete účet Microsoft i účet Azure.For the following steps, you need both a Microsoft account and an Azure account. Pokud nemáte účet Microsoft, můžete si na portálu účet Microsoftzdarma zaregistrovat bezplatný poplatek.If you do not have a Microsoft account, you can sign up for one free of charge at the Microsoft account portal. Vyberte Přihlásit se účtem Microsoft a po zobrazení výzvy k přihlášení vyberte vytvořit účet Microsoft.Select Sign in with Microsoft and then, when asked to sign in, select Create a Microsoft account. Při vytváření a ověřování nových účet Microsoft postupujte podle pokynů.Follow the steps to create and verify your new Microsoft account.

Jakmile budete mít účet Microsoft, navštivte stránku registrace do Azure, vyberte začít zdarma a vytvořte nový účet Azure pomocí účet Microsoft.Once you have a Microsoft account, go to the Azure sign-up page, select Start free, and create a new Azure account using a Microsoft account. Tady je video o tom, jak se zaregistrovat k bezplatnému účtu Azure.Here is a video of how to sign up for Azure free account.

Poznámka

Když si zaregistruje bezplatný účet Azure, najdete ho v kreditu služby $200, který můžete použít k placenému předplatnému služby Speech, a to po dobu až 30 dnů.When you sign up for a free Azure account, it comes with $200 in service credit that you can apply toward a paid Speech service subscription, valid for up to 30 days. Vaše služby Azure jsou zakázané, když váš kredit skončí nebo končí na konci 30 dnů.Your Azure services are disabled when your credit runs out or expires at the end of the 30 days. Pokud chcete dál využívat služby Azure, musíte upgradovat svůj účet.To continue using Azure services, you must upgrade your account. Další informace najdete v tématu Postup upgradu bezplatného účtu Azure.For more information, see How to upgrade your Azure free account.

Služba Speech má dvě úrovně služeb: Free (F0) a předplatné (S0), které mají různá omezení a výhody.The Speech service has two service tiers: free(f0) and subscription(s0), which have different limitations and benefits. Pokud používáte bezplatnou úroveň služby řeči s nízkým objemem, můžete si toto bezplatné předplatné ponechat i po vypršení bezplatné zkušební verze nebo kreditu služby.If you use the free, low-volume Speech service tier you can keep this free subscription even after your free trial or service credit expires. Další informace najdete v tématu Cognitive Services Price-Speech Service.For more information, see Cognitive Services pricing - Speech service.

Vytvoření prostředku AzureCreate the Azure resource

Postup přidání prostředku služby řeči (bezplatná nebo placená úroveň) do účtu Azure:To add a Speech service resource (free or paid tier) to your Azure account:

  1. Přihlaste se na webu Azure Portal pomocí svého účtu Microsoft.Sign in to the Azure portal using your Microsoft account.

  2. V levém horním rohu portálu vyberte vytvořit prostředek .Select Create a resource at the top left of the portal. Pokud se vám nepovede vytvořit prostředek, můžete ho vždycky najít tak, že vyberete sbalenou nabídku v levém horním rohu obrazovky.If you do not see Create a resource, you can always find it by selecting the collapsed menu in the upper left corner of the screen.

  3. V novém okně zadejte do vyhledávacího pole text "Speech" a stiskněte klávesu ENTER.In the New window, type "speech" in the search box and press ENTER.

  4. Ve výsledcích hledání vyberte řeč.In the search results, select Speech.

    výsledky hledání řeči

  5. Vyberte vytvořit a potom:Select Create, then:

    • Zadejte jedinečný název nového prostředku.Give a unique name for your new resource. Název vám pomůže rozlišovat mezi několika předplatnými vázanými na stejnou službu.The name helps you distinguish among multiple subscriptions tied to the same service.
    • Vyberte předplatné Azure, ke kterému je přiřazen nový prostředek, abyste zjistili, jak se účtují poplatky.Choose the Azure subscription that the new resource is associated with to determine how the fees are billed. Tady je úvodní informace o tom, jak vytvořit předplatné Azure v Azure Portal.Here is the introduction for how to create an Azure subscription in the Azure portal.
    • Vyberte oblast , ve které se prostředek použije.Choose the region where the resource will be used. Azure je globální cloudová platforma, která je obecně dostupná v mnoha oblastech po celém světě.Azure is a global cloud platform that is generally available in many regions worldwide. Pokud chcete dosáhnout nejlepšího výkonu, vyberte oblast, která je pro vás nejblíže nebo kde se vaše aplikace spouští.To get the best performance, select a region that’s closest to you or where your application runs. Služba Speech Service pro nákup se liší od různých oblastí.The Speech service availabilities vary from different regions. Ujistěte se, že jste vytvořili prostředek v podporované oblasti.Make sure that you create your resource in a supported region. Podívejte se na podporu oblastí pro hlasové služby.See region support for Speech services.
    • Vyberte cenovou úroveň Free (F0) nebo Place (S0).Choose either a free (F0) or paid (S0) pricing tier. Pokud chcete získat kompletní informace o cenách a kvótách využití pro každou úroveň, vyberte Zobrazit úplné podrobnosti o cenách nebo si prohlédněte ceny služby Speech Services.For complete information about pricing and usage quotas for each tier, select View full pricing details or see speech services pricing. Omezení prostředků najdete v tématu omezení pro Azure Cognitive Services.For limits on resources, see Azure Cognitive Services Limits.
    • Vytvořte novou skupinu prostředků pro toto předplatné řeči nebo přiřaďte předplatné k existující skupině prostředků.Create a new resource group for this Speech subscription or assign the subscription to an existing resource group. Skupiny prostředků vám pomůžou udržovat vaše různá předplatná Azure uspořádaná.Resource groups help you keep your various Azure subscriptions organized.
    • Vyberte Vytvořit.Select Create. Tím přejdete na přehled nasazení a zobrazíte zprávy o průběhu nasazení.This will take you to the deployment overview and display deployment progress messages.

Nasazení nového prostředku řeči chvíli trvá.It takes a few moments to deploy your new Speech resource.

Hledání klíčů a oblastíFind keys and region

Pokud chcete najít klíče a oblast dokončeného nasazení, postupujte podle těchto kroků:To find the keys and region of a completed deployment, follow these steps:

  1. Přihlaste se na webu Azure Portal pomocí svého účtu Microsoft.Sign in to the Azure portal using your Microsoft account.

  2. Vyberte všechny prostředky a vyberte název prostředku Cognitive Services.Select All resources, and select the name of your Cognitive Services resource.

  3. V levém podokně v části Správa prostředků vyberte klíče a koncový bod.On the left pane, under RESOURCE MANAGEMENT, select Keys and Endpoint.

Každé předplatné má dva klíče; v aplikaci můžete použít libovolný klíč.Each subscription has two keys; you can use either key in your application. Chcete-li zkopírovat nebo vložit klíč do editoru kódu nebo jiné umístění, vyberte tlačítko Kopírovat vedle každého klíče, přepněte okna a vložte obsah schránky do požadovaného umístění.To copy/paste a key to your code editor or other location, select the copy button next to each key, switch windows to paste the clipboard contents to the desired location.

Dále zkopírujte LOCATION hodnotu, což je vaše ID vaší oblasti (např.Additionally, copy the LOCATION value, which is your region ID (ex. westus, westeurope ) pro volání sady SDK.westus, westeurope) for SDK calls.

Důležité

Tyto klíče předplatného se používají pro přístup ke službě rozpoznávání rozhraní API.These subscription keys are used to access your Cognitive Service API. Nesdílejte své klíče.Do not share your keys. Uložte je bezpečně – například pomocí Azure Key Vault.Store them securely– for example, using Azure Key Vault. Tyto klíče doporučujeme také pravidelně obnovovat.We also recommend regenerating these keys regularly. K volání rozhraní API je potřeba jenom jeden klíč.Only one key is necessary to make an API call. Při opětovném generování prvního klíče můžete použít druhý klíč pro pokračování přístupu ke službě.When regenerating the first key, you can use the second key for continued access to the service.

Dokončení rychlého startuComplete a quickstart

Nabízíme rychlé zprovoznění ve většině oblíbených programovacích jazyků, z nichž každá je navržena pro učení základních vzorů návrhu a spouštění kódu za méně než 10 minut.We offer quickstarts in most popular programming languages, each designed to teach you basic design patterns, and have you running code in less than 10 minutes. Seznam rychlých startů pro jednotlivé funkce najdete v následujícím seznamu.See the following list for the quickstart for each feature.

Až budete mít možnost začít pracovat se službou Speech, vyzkoušejte naše kurzy, které ukazují, jak řešit různé scénáře.After you've had a chance to get started with the Speech service, try our tutorials that show you how to solve various scenarios.

Získání vzorového kóduGet sample code

Vzorový kód je k dispozici na GitHubu pro službu rozpoznávání řeči.Sample code is available on GitHub for the Speech service. Tyto ukázky se týkají běžných scénářů, jako je čtení zvuku ze souboru nebo datového proudu, průběžné a jednorázové rozpoznávání a práce s vlastními modely.These samples cover common scenarios like reading audio from a file or stream, continuous and single-shot recognition, and working with custom models. Pomocí těchto odkazů můžete zobrazit ukázky sady SDK a REST:Use these links to view SDK and REST samples:

Přizpůsobení prostředí pro rozpoznávání řečiCustomize your speech experience

Služba Speech funguje dobře s integrovanými modely, ale možná budete chtít další přizpůsobení a vyladit prostředí pro svůj produkt nebo prostředí.The Speech service works well with built-in models, however, you may want to further customize and tune the experience for your product or environment. Možnosti přizpůsobení jsou v rozsahu od ladění akustického modelu až po jedinečná hlasová písma pro vaši značku.Customization options range from acoustic model tuning to unique voice fonts for your brand.

Další produkty nabízejí modely řeči optimalizované pro konkrétní účely, jako je zdravotní péče nebo pojištění, ale jsou k dispozici všem uživatelům současně.Other products offer speech models tuned for specific purposes like healthcare or insurance, but are available to everyone equally. Přizpůsobení ve službě Azure Speech se stávají součástí vaší jedinečné konkurenční výhody, která není k dispozici pro žádného jiného uživatele nebo zákazníka.Customization in Azure Speech becomes part of your unique competitive advantage that is unavailable to any other user or customer. Jinými slovy, vaše modely jsou soukromé a vlastní – vyladěny jenom pro váš případ použití.In other words, your models are private and custom-tuned for your use-case only.

Speech ServiceSpeech Service PlatformaPlatform DescriptionDescription
Převod řeči na textSpeech-to-Text Custom SpeechCustom Speech Modely rozpoznávání řeči můžete přizpůsobit vašim potřebám a dostupným datům.Customize speech recognition models to your needs and available data. Překonání překážek rozpoznávání řeči, například mluveného stylu, slovníku a hluku na pozadí.Overcome speech recognition barriers such as speaking style, vocabulary and background noise.
Převod textu na řečText-to-Speech Vlastní hlasCustom Voice Vytvořte si rozpoznatelný jedinečný hlas vašich aplikací pro převod textu na řeč pomocí vašich dostupných dat o hlasu.Build a recognizable, one-of-a-kind voice for your Text-to-Speech apps with your speaking data available. Hlasové výstupy můžete ještě více ladit úpravou sady hlasových parametrů.You can further fine-tune the voice outputs by adjusting a set of voice parameters.

Nasazení místně pomocí kontejnerů DockerDeploy on premises using Docker containers

Použijte kontejnery služby Speech k nasazení funkcí rozhraní API místně.Use Speech service containers to deploy API features on-premises. Tyto kontejnery Docker umožňují přiblížit službu k vašim datům pro účely dodržování předpisů, zabezpečení nebo jiných provozních důvodů.These Docker containers enable you to bring the service closer to your data for compliance, security or other operational reasons. Služba rozpoznávání řeči nabízí tyto kontejnery:The Speech service offers the following containers:

  • Standardní převod řeči na textStandard Speech-to-text
  • Custom Speech na textCustom Speech-to-text
  • Standardní převod textu na řečStandard Text-to-speech
  • Neuronové převodu textu na řečNeural Text-to-speech
  • Vlastní převod textu na řeč (Náhled)Custom Text-to-speech (preview)
  • Rozpoznávání jazyka řeči (Preview)Speech Language Detection (preview)

Referenční dokumentyReference docs

Další krokyNext steps