Wat is Speech Studio?

Artikel
01/22/2024

Speech Studio is een set hulpprogramma's op basis van de gebruikersinterface voor het bouwen en integreren van functies van de Azure AI Speech-service in uw toepassingen. U maakt projecten in Speech Studio met behulp van een no-code-benadering en verwijst vervolgens naar deze assets in uw toepassingen met behulp van de Speech SDK, de Speech CLI of de REST API's.

Tip

U kunt spraak naar tekst en tekst naar spraak proberen in Speech Studio zonder code te registreren of te schrijven.

Speech Studio-scenario's

Verken, probeer en bekijk voorbeeldcode voor enkele veelvoorkomende gebruiksvoorbeelden.

Bijschriften: kies een voorbeeldvideoclip om realtime of offline verwerkte resultaten te bekijken onderschrift. Meer informatie over het synchroniseren van onderschrift s met uw invoeraudio, het toepassen van scheldfilters, het verkrijgen van gedeeltelijke resultaten, het toepassen van aanpassingen en het identificeren van gesproken talen voor meertalige scenario's. Zie de quickstart voor onderschrift voor meer informatie.
Callcenter: Bekijk een demonstratie over het gebruik van de taal- en spraakservices om gesprekken in het gesprekscentrum te analyseren. U kunt aanroepen in realtime transcriberen of een batch aan aanroepen verwerken, persoonlijke identificatiegegevens redacteren en inzichten extraheren, zoals sentiment om u te helpen met de use-case van uw callcenter. Zie de quickstart voor het callcenter voor meer informatie.

Bekijk deze inleidende video voor een demonstratie van deze scenario's in Speech Studio.

Speech Studio-functies

In Speech Studio zijn de volgende functies van de Speech-service beschikbaar als projecttypen:

Realtime spraak naar tekst: Snel spraak naar tekst testen door audiobestanden hier te slepen zonder code te hoeven gebruiken. Speech Studio heeft een demoprogramma om te zien hoe spraak-naar-tekst werkt in uw audiovoorbeelden. Als u de volledige functionaliteit wilt verkennen, raadpleegt u Wat is spraak-naar-tekst.
Batch-spraak naar tekst: Test snel de mogelijkheden voor batchtranscriptie om een grote hoeveelheid audio in de opslag te transcriberen en asynchroon resultaten te ontvangen. Zie Het overzicht van Batch-spraak naar tekst voor meer informatie over Batch-spraak-naar-tekst.
Aangepaste spraak: Maak spraakherkenningsmodellen die zijn afgestemd op specifieke vocabulairesets en -stijlen voor spreken. In tegenstelling tot het basismodel voor spraakherkenning worden aangepaste spraakmodellen onderdeel van uw unieke concurrentievoordeel omdat ze niet openbaar toegankelijk zijn. Zie Trainings- en testgegevenssets uploaden om voorbeeldaudio te uploaden om een aangepast spraakmodel te maken.
Uitspraakbeoordeling: Evalueer de uitspraak van de spraak en geef sprekers feedback over de nauwkeurigheid en de vloeiendheid van gesproken audio. Speech Studio biedt een sandbox voor het snel testen van deze functie, zonder code. Als u de functie wilt gebruiken met de Speech SDK in uw toepassingen, raadpleegt u het artikel Uitspraakbeoordeling .
Spraakomzetting: test en vertaal spraak snel in andere talen van uw keuze met lage latentie. Als u de volledige functionaliteit wilt verkennen, raadpleegt u Wat is spraakomzetting.
Spraakgalerie: apps en services bouwen die op natuurlijke wijze spreken. Kies uit een breed portfolio met talen, stemmen en varianten. Breng uw scenario's tot leven met zeer expressieve en menselijke neurale stemmen.
Aangepaste stem: maak aangepaste, een-op-een-soort stemmen voor tekst naar spraak. U levert audiobestanden en maakt overeenkomende transcripties in Speech Studio en gebruikt vervolgens de aangepaste stemmen in uw toepassingen. Als u aangepaste stemmen wilt maken en gebruiken via eindpunten, raadpleegt u Uw spraakmodel maken en gebruiken.
Audio-inhoud maken: een aanpak zonder code voor tekst-naar-spraaksynthese. U kunt de uitvoeraudio als zodanig gebruiken of als uitgangspunt voor verdere aanpassing. U kunt zeer natuurlijke audio-inhoud bouwen voor verschillende scenario's, zoals audioboeken, nieuwsuitzendingen, video-gesproken tekst en chatbots. Zie de documentatie voor het maken van audio-inhoud voor meer informatie.
Aangepast trefwoord: een aangepast trefwoord is een woord of korte woordgroep die u kunt gebruiken om een product te activeren. U maakt een aangepast trefwoord in Speech Studio en genereert vervolgens een binair bestand voor gebruik met de Speech SDK in uw toepassingen.
Aangepaste opdrachten: bouw eenvoudig uitgebreide apps voor spraakopdrachten die zijn geoptimaliseerd voor spraak-first interactie-ervaringen. Aangepaste opdrachten bieden een ontwerpervaring zonder code in Speech Studio, een automatisch hostingmodel en relatief lagere complexiteit. Met deze functie kunt u zich richten op het bouwen van de beste oplossing voor uw spraakopdrachtscenario's. Zie de handleiding voor toepassingen voor aangepaste opdrachten ontwikkelen voor meer informatie. Zie Ook Integreren met een clienttoepassing met behulp van de Speech SDK.

Volgende stappen

Speech Studio verkennen

Wat is Speech Studio?

Speech Studio-scenario's

Speech Studio-functies

Volgende stappen

Aanvullende resources