Vad är Speech SDK?

Artikel
01/22/2024

Speech SDK (software development kit) exponerar många av funktionerna i Speech-tjänsten, så att du kan utveckla talaktiverade program. Speech SDK är tillgängligt på många programmeringsspråk och på flera plattformar. Speech SDK är perfekt för både realtids- och icke-realtidsscenarier med hjälp av lokala enheter, filer, Azure Blob Storage och indata- och utdataströmmar.

I vissa fall kan du inte eller bör inte använda Speech SDK. I sådana fall kan du använda REST-API:er för att komma åt Speech-tjänsten. Använd till exempel REST API för tal till text för batch-transkription och anpassat tal.

Språk som stöds

Speech SDK stöder följande språk och plattformar:

Programmeringsspråk	Referens	Plattformssupport
C#¹	.NET	Windows, Linux, macOS, Mono, Xamarin.iOS, Xamarin.Mac, Xamarin.Android, UWP, Unity
C++²	C++	Windows, Linux, macOS
Kör	Kör	Linux
Java	Java	Android, Windows, Linux, macOS
JavaScript	JavaScript	Webbläsare, Node.js
Objective-C	Objective-C	iOS, macOS
Python	Python	Windows, Linux, macOS
Swift	Objective-C³	iOS, macOS

^{1 C#-kodexempel finns i dokumentationen. Speech SDK för C# baseras på .NET Standard 2.0, så det stöder många plattformar och programmeringsspråk. Mer information finns i .NET-implementeringsstöd.}
^{2 C är inte ett programmeringsspråk som stöds för Speech SDK.}
^{3 Speech SDK för Swift delar klientbibliotek och referensdokumentation med Speech SDK för Objective-C.}

Viktigt!

Genom att ladda ned någon av Azure AI Speech SDK:er bekräftar du dess licens. Mer information finns i:

Speech SDK-demo

Följande video visar hur du installerar Speech SDK för C# och skriver ett .NET-konsolprogram för tal till text.

Kodexempel

Speech SDK-kodexempel finns i dokumentationen och GitHub.

Docs-exempel

Längst upp på dokumentationssidorna som innehåller exempel kan du välja bland annat C#, C++, Go, Java, JavaScript, Objective-C, Python eller Swift.

Screenshot showing how to select a programming language in the documentation.

Om ett exempel inte är tillgängligt i önskat programmeringsspråk kan du välja ett annat programmeringsspråk för att komma igång och lära dig mer om begreppen, eller se referensen och exemplen som är länkade från början av artikeln.

GitHub-exempel

Djupgående exempel finns på lagringsplatsen Azure-Samples/cognitive-services-speech-sdk på GitHub. Det finns exempel för C# (inklusive UWP, Unity och Xamarin), C++, Java, JavaScript (inklusive Webbläsare och Node.js), Objective-C, Python och Swift. Kodexempel för Go är tillgängliga på microsoft/cognitive-services-speech-sdk-go-lagringsplatsen på GitHub.

Hjälpalternativ

Microsoft Q&A- och Stack Overflow-forumen är tillgängliga för utvecklarcommunityn för att ställa och svara på frågor om Azure Cognitive Speech och andra tjänster. Microsoft övervakar forumen och svarar på frågor som communityn ännu inte har besvarat. Du ser din fråga genom att tagga den med "azure-speech".

Du kan föreslå en idé eller rapportera en bugg genom att skapa ett problem på GitHub:

Se även support och hjälpalternativ för Azure AI-tjänster för att få support, hålla dig uppdaterad, ge feedback och rapportera buggar för Azure AI-tjänster.