O que é o SDK de Fala?

Artigo
01/22/2024

O SDK (Software Development Kit) de Fala expõe muitas das funcionalidades do serviço de Fala, que você pode usar para desenvolver aplicativos habilitados para fala. O SDK de Fala está disponível em muitas linguagens de programação e plataformas. O SDK de Fala é ideal para cenários em tempo real ou não que usam dispositivos locais, arquivos, Armazenamento de Blobs do Azure e fluxos de entrada e saída.

Em alguns casos, não é possível ou aconselhável usar o SDK de Fala. Nesses cenários, use APIs REST para acessar o serviço de Fala. Por exemplo, use a API REST de Conversão de fala em texto para transcrição em lote e fala personalizada.

Idiomas com suporte

O SDK de Fala dá suporte aos seguintes idiomas e plataformas:

Linguagem de programação	Referência	Suporte a plataforma
C#¹	.NET	Windows, Linux, macOS, Mono, Xamarin.iOS, Xamarin.Mac, Xamarin.Android, UWP, Unity
C++²	C++	Windows, Linux, macOS
Go	Go	Linux
Java	Java	Android, Windows, Linux, macOS
JavaScript	JavaScript	Browser, Node.js
Objective-C	Objective-C	iOS, macOS
Python	Python	Windows, Linux, macOS
Swift	Objective-C³	iOS, macOS

^{1 Exemplos de código C# estão disponíveis na documentação. O SDK de Fala do .NET para C# baseia-se no .NET Standard 2.0, ou seja, ele dá suporte a várias plataformas e linguagens de programação. Para obter mais informações, confira Suporte à implementação do .NET.}
^{2 O C não é uma linguagem de programação compatível com o SDK de Fala.}
^{3 O SDK de Fala para Swift compartilha bibliotecas de clientes e documentação de referência com o SDK de Fala para Objective-C.}

Importante

Ao baixar qualquer um dos SDKs de Fala dos serviços de IA do Azure, você aceita a respectiva licença. Para obter mais informações, consulte:

Demonstração do SDK de Fala

O vídeo a seguir mostra como instalar o SDK de Fala para C# e gravar um aplicativo de console do .NET para conversão de fala em texto.

Exemplos de código

Os exemplos de código do SDK de Fala estão disponíveis na documentação e no GitHub.

Exemplos de documentos

Na parte superior das páginas de documentação que contêm exemplos, as opções a serem selecionadas incluem C#, C++, Go, Java, JavaScript, Objective-C, Python ou Swift.

Screenshot showing how to select a programming language in the documentation.

Se um exemplo não estiver disponível em sua linguagem de programação preferida, você poderá selecionar outra linguagem de programação para começar e aprender sobre os conceitos ou ver a referência e os exemplos vinculados desde o início do artigo.

Exemplos do GitHub

Exemplos detalhados estão disponíveis no repositório Azure-Samples/cognitive-services-speech-sdk no GitHub. Há exemplos de C# (incluindo UWP, Unity e Xamarin), C++, Java, JavaScript (incluindo Navegador e Node.js), Objective-C, Python e Swift. Exemplos detalhados estão disponíveis no repositório Microsoft/cognitive-services-speech-sdk-go no GitHub.

Opções de ajuda

Os fóruns Microsoft Q&A e Stack Overflow estão disponíveis para a comunidade de desenvolvedores fazer e responder perguntas sobre a Fala Cognitiva do Azure e outros serviços. A Microsoft monitora os fóruns e responde a perguntas que a comunidade ainda não respondeu. Para ter certeza de que veremos a sua pergunta, marque-a com "azure-speech".

Você pode sugerir uma ideia ou relatar um bug criando um registro de problema no GitHub:

Confira também as opções de suporte e ajuda dos serviços de IA do Azure para obter suporte, manter-se atualizado, fornecer comentários e notificar bugs dos serviços de IA do Azure.