Vad är Speech Studio?

Speech Studio är en uppsättning ui-baserade verktyg för att skapa och integrera funktioner från Azure Speech-tjänsten i dina program. Du skapar projekt i Speech Studio med en metod utan kod och refererar sedan till de tillgångar som du skapar i dina program med hjälp av Speech SDK, Speech CLIeller olika REST-API:er.

Konfigurera ditt Azure-konto

Du måste ha ett Azure-konto och lägga till en Speech Service-resurs innan du kan använda Speech Studio. Om du inte har ett konto och en resurs kan du prova Speech-tjänsten utan kostnad.

När du har skapat ett Azure-konto och en Speech Service-resurs:

  1. Logga in på Speech Studio ditt Azure-konto.
  2. Välj den Speech Service-resurs som du behöver för att komma igång. (Du kan ändra resurserna när som helst i "Inställningar" på den översta menyn.)

Speech Studio funktioner

Följande speech-tjänstfunktioner är tillgängliga som projekttyper i Speech Studio.

  • Tal till text i realtid: Testa snabbt tal till text genom att dra och släppa ljudfiler utan att använda någon kod. Det här är ett demoverktyg för att se hur tal till text fungerar i dina ljudexempel, men se översikten för tal till text för att utforska de fullständiga funktionerna som är tillgängliga.
  • Anpassat tal: Med anpassat tal kan du skapa taligenkänningsmodeller som är skräddarsydda för specifika ordförrådsuppsättningar och talstilar. Till skillnad från användningen av en modell för grundläggande taligenkänning blir Custom Speech-modeller en del av din unika konkurrensfördel eftersom de inte är offentligt tillgängliga. Se snabbstarten för att komma igång med att ladda upp exempelljud för att skapa en Custom Speech-modell.
  • Utvärdering av uttal: Utvärdering av uttal utvärderar taluttal och ger talarfeedback om noggrannheten och hur bra talat ljud är. Speech Studio tillhandahåller en sandbox-miljö för att snabbt testa den här funktionen utan kod, men läs mer i artikeln om hur du använder funktionen med Speech SDK i dina program.
  • Röstgalleri: Skapa appar och tjänster som talar naturligt. Välj bland fler än 170 röster på över 70 språk och varianter. Få liv i dina scenarier med mycket uttrycksfulla och mänskliga neurala röster.
  • Anpassad röst: Anpassad röst kan du skapa anpassade, en-av-en-kind-röster för text till tal. Du tillhandahåller ljudfiler och skapar matchande transkriptioner i Speech Studio och använder sedan de anpassade rösterna i dina program. Se artikeln om att skapa och använda anpassade röster via slutpunkter.
  • Skapa ljudinnehåll: Skapa ljudinnehåll är ett lättanvänd verktyg som gör att du kan skapa mycket naturligt ljudinnehåll för en mängd olika scenarier, till exempel ljudböcker, nyhetssändningar, videoläsningar och chattrobotar. Speech Studio kan du exportera dina skapade ljudfiler som ska användas i dina program.
  • Anpassat nyckelord: En Anpassat nyckelord är ett ord eller en kort fras som gör att produkten kan röstaktiveras. Du skapar en Anpassat nyckelord i Speech Studio och genererar sedan en binärfil som ska användas med Speech SDK i dina program.
  • Anpassade kommandon: Anpassade kommandon gör det enkelt att skapa omfattande röstkommandoappar som är optimerade för röstbaserade interaktionsupplevelser. Det ger en kodfri redigeringsupplevelse i Speech Studio, en automatisk värdmodell och relativt lägre komplexitet, vilket hjälper dig att fokusera på att skapa den bästa lösningen för dina röstkommandoscenarier. Se i guiden för att skapa Anpassade kommandon program och se även guiden för att integrera ditt Anpassade kommandon-program med Speech SDK.

Nästa steg

Utforska Speech Studio och skapa ett projekt.