Wat is spraak-naar-tekst?
In dit overzicht krijgt u informatie over de voordelen en mogelijkheden van de service voor spraak-naar-tekst. Spraak-naar-tekst, ook wel spraakherkenning genoemd, maakt realtime transcriptie van audiostromen naar tekst mogelijk. Uw toepassingen, hulpprogramma's of apparaten kunnen deze tekst gebruiken, weergeven en er actie op ondernemen als opdrachtinvoer. Deze service is powered by dezelfde herkenningstechnologie die Microsoft gebruikt voor Cortana en Office producten. Het werkt naadloos met de vertaal- en tekst-naar-spraak-serviceaanbiedingen. Zie Ondersteunde talen voor een volledige lijst met beschikbare talen voor spraak-naar-tekst.
De spraak-naar-tekst-service gebruikt standaard het universele taalmodel. Dit model is getraind met behulp van gegevens die eigendom zijn van Microsoft en wordt geïmplementeerd in de cloud. Het is optimaal voor gespreks- en dicteerscenario's. Wanneer u spraak-naar-tekst gebruikt voor herkenning en transcriptie in een unieke omgeving, kunt u aangepaste akoestische, taal- en uitspraakmodellen maken en trainen. Aanpassing is handig voor het aanpakken van omgevingsruis of branchespecifieke woordenlijst.
Deze documentatie bevat de volgende artikeltypen:
- Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
- Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
- Concepten bieden uitgebreide uitleg over de servicefunctionaliteit en -functies.
- Zelfstudies zijn langere handleidingen die laten zien hoe u de service als onderdeel kunt gebruiken in bredere bedrijfsoplossingen.
Notitie
Bing Speech is op 15 oktober 2019 uit bedrijf genomen. Als uw toepassingen, hulpprogramma's of producten gebruikmaken van de Bing Speech-API's, hebben we handleidingen gemaakt om u te helpen migreren naar de Speech-service.
Aan de slag
Zie de quickstart om aan de slag te gaan met spraak-naar-tekst. De service is beschikbaar via de Speech SDK, de REST APIen de Speech CLI.
Voorbeeldcode
Voorbeeldcode voor de Speech SDK is beschikbaar op GitHub. Deze voorbeelden hebben betrekking op veelvoorkomende scenario's, zoals het lezen van audio uit een bestand of stream, continue en at-start herkenning en het werken met aangepaste modellen.
- Voorbeelden van spraak-naar-tekst (SDK)
- Voorbeelden van batchtranscriptie (REST)
- Voorbeelden van beoordeling van uitspraak (REST)
Aanpassing
Naast het standaard Speech Service-model kunt u aangepaste modellen maken. Aanpassing helpt bij het oplossen van belemmeringen voor spraakherkenning, zoals spreekstijl, woordenlijst en achtergrondruis. Zie Custom Speech. Aanpassingsopties variëren per taal/land/land. Zie Ondersteunde talen om de ondersteuning te controleren.
Batchtranscriptie
Batchtranscriptie is een reeks REST API waarmee u een grote hoeveelheid audio in de opslag kunt transcriberen. U kunt met een SAS-URI (Shared Access Signature) naar audiobestanden verwijzen en de transcriptieresultaten asynchroon ontvangen. Zie de -how-to voor meer informatie over het gebruik van de batchtranscriptie-API.
Naslagdocumentatie
De Speech-service biedt twee SDK's. De eerste SDK is de primaire Speech SDK en biedt de meeste functies die nodig zijn om te communiceren met de Speech-service. De tweede SDK is specifiek voor apparaten, die de juiste naam hebben voor de Speech Devices SDK. Beide SDK's zijn beschikbaar in veel talen.
Referentiemateriaal over speech-SDK
Gebruik de volgende lijst om de juiste referentiemateriaal voor de Speech SDK te vinden:
Tip
De Speech Service SDK wordt actief onderhouden en bijgewerkt. Als u wijzigingen, updates en functie-toevoegingen wilt bijhouden, raadpleegt u de opmerkingen bij de release van de Speech SDK.
Referentiemateriaal voor Speech Devices SDK
De Speech Devices SDK is een superset van de Speech SDK, met uitgebreide functionaliteit voor specifieke apparaten. Als u de Speech Devices SDK wilt downloaden, moet u eerst een development kit kiezen.
REST API s
Raadpleeg de onderstaande lijst voor verwijzingen naar verschillende REST API's van de Speech-service:
- REST API: Spraak-naar-tekst
- REST API: Beoordeling van uitspraak
- REST API: Tekst-naar-spraak
- REST API: Batchtranscriptie en -aanpassing