Guia de início rápido: instalar o SDK de fala

Pacote de documentação | de referência (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para C#.

Os exemplos de código na documentação são escritos em C# 8 e executados no .NET standard 2.0.

Requisitos de plataforma

O SDK de Fala para C# é compatível com Windows, Linux e macOS.

Atenção

Este artigo faz referência ao CentOS, uma distribuição Linux que está se aproximando do status de Fim da Vida Útil (EOL). Por favor, considere o seu uso e planejamento de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C#

O SDK de Fala para C# está disponível como um pacote NuGet e implementa o .NET Standard 2.0. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de Fala para C# pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o SDK de Fala para um aplicativo de console do .NET Framework (Windows).

Este guia requer:

Criar um projeto do Visual Studio e instalar o SDK de fala

Você precisa instalar o pacote NuGet do SDK de fala para poder fazer referência a ele em seu código. Para fazer isso, você pode primeiro precisar criar um projeto helloworld . Se você já tiver um projeto com a carga de trabalho de desenvolvimento da área de trabalho .NET disponível, poderá usar esse projeto e pular para Usar o Gerenciador de Pacotes NuGet para instalar o SDK de Fala.

Criar um projeto helloworld

  1. Abra o Visual Studio.

  2. Em Introdução, selecione Criar um novo projeto.

  3. Em Criar um novo projeto, escolha Aplicativo de Console (.NET Framework) e selecione Avançar.

  4. Em Configurar seu novo projeto, para Nome do projeto , digite helloworld, escolha ou crie o caminho do diretório em Local e selecione Criar.

  5. Na barra de menus do Visual Studio, selecione Ferramentas>Obter Ferramentas e Recursos. Esta etapa abre o Visual Studio Installer e exibe a caixa de diálogo Modificando .

  6. Verifique se a carga de trabalho de desenvolvimento da área de trabalho .NET está disponível. Se a carga de trabalho não estiver instalada, selecione-a e, em seguida, selecione Modificar para iniciar a instalação. Pode levar alguns minutos para baixar e instalar.

    Se o desenvolvimento da área de trabalho .NET já estiver selecionado, selecione Fechar para fechar a caixa de diálogo.

    Captura de tela que mostra a habilitação do desenvolvimento da área de trabalho .NET.

  7. Feche o instalador do Visual Studio.

Usar o Gerenciador de Pacotes NuGet para instalar o SDK de Fala

  1. No Gerenciador de Soluções, clique com o botão direito do mouse no projeto helloworld e selecione Gerenciar Pacotes NuGet para mostrar o Gerenciador de Pacotes NuGet.

  2. No canto superior direito, localize a caixa suspensa Origem do pacote e verifique se nuget.org está selecionado.

    Captura de tela que mostra o Gerenciador de Pacotes NuGet.

  3. No canto superior esquerdo, selecione Procurar.

  4. Na caixa de pesquisa, digite Microsoft.CognitiveServices.Speech e selecione Enter.

  5. Nos resultados da pesquisa, selecione o pacote Microsoft.CognitiveServices.Speech e, em seguida, selecione Instalar para instalar a versão estável mais recente.

    Captura de tela que mostra a instalação do pacote NuGet Microsoft.CognitiveServices.Speech.

  6. Aceite todos os contratos e licenças para iniciar a instalação.

    Depois que o pacote for instalado, uma confirmação aparecerá na janela Console do Gerenciador de Pacotes.

Escolha a arquitetura de destino

Para criar e executar o aplicativo de console, crie uma configuração de plataforma que corresponda à arquitetura do seu computador.

  1. No menu, selecione Build>Configuration Manager. É apresentada a caixa de diálogo Configuration Manager.

  2. Na caixa suspensa Plataforma de solução ativa, selecione Novo. A caixa de diálogo Nova plataforma de solução é exibida.

    Captura de ecrã que mostra a caixa de diálogo Gestor de configuração.

  3. Na caixa suspensa Digite ou selecione a nova plataforma:

    • Se você estiver executando o Windows de 64 bits, selecione x64.
    • Se você estiver executando o Windows de 32 bits, selecione x86.
  4. Selecione OK e, em seguida, Fechar.

Pacote de documentação | de referência (NuGet) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para C++.

Requisitos de plataforma

O Speech SDK for C++ é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Instalar o SDK de Fala para C++

O SDK de Fala para C++ está disponível como um pacote NuGet. Para obter mais informações, consulte Microsoft.CognitiveServices.Speech.

O SDK de fala para C++ pode ser instalado a partir da CLI do .NET usando o seguinte dotnet add comando:

dotnet add package Microsoft.CognitiveServices.Speech

Pode seguir estes guias para obter mais opções.

Este guia mostra como instalar o Speech SDK para Linux.

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem baixar as bibliotecas necessárias e os arquivos de cabeçalho como um arquivo .tar .

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Description
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluem Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Pacote de documentação | de referência (Go) | Amostras adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Go.

Requisitos de plataforma

Atenção

Este artigo faz referência ao CentOS, uma distribuição Linux que está se aproximando do status de Fim da Vida Útil (EOL). Por favor, considere o seu uso e planejamento de acordo. Para obter mais informações, consulte as diretrizes de Fim da Vida Útil do CentOS.

O Speech SDK for Go suporta as seguintes distribuições na arquitetura x64:

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 7

Importante

Use a versão LTS mais recente da distribuição Linux. Por exemplo, se você estiver usando o Ubuntu 20.04 LTS, use a versão mais recente do Ubuntu 20.04.X.

O Speech SDK depende das seguintes bibliotecas do sistema Linux:

  • As bibliotecas compartilhadas da biblioteca GNU C, incluindo a biblioteca POSIX Threads Programming, libpthreads.
  • A biblioteca OpenSSL (libssl) versão 1.x e certificados (ca-certificates).
  • A biblioteca compartilhada para aplicativos ALSA (libasound).

Você também deve instalar ca-certificates para estabelecer um websocket seguro e evitar o WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED erro.

Importante

O Speech SDK ainda não suporta OpenSSL 3.0, que é o padrão no Ubuntu 22.04 e Debian 12.

Execute estes comandos:

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Instale a versão binária Go 1.13 ou posterior.

Instalar o SDK de Fala para Go

Use o procedimento a seguir para baixar e instalar o SDK. As etapas incluem baixar as bibliotecas necessárias e os arquivos de cabeçalho como um arquivo .tar .

  1. Escolha um diretório para os arquivos do SDK de fala. Defina a SPEECHSDK_ROOT variável de ambiente para apontar para esse diretório. Esta variável facilita a referência ao diretório em comandos futuros.

    Para usar o diretório speechsdk no diretório base, execute o seguinte comando:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. Crie o diretório se ele não existir:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Baixe e extraia o arquivo .tar.gz que contém os binários do Speech SDK:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. Valide os conteúdos do diretório de nível superior do pacote extraído:

    ls -l "$SPEECHSDK_ROOT"
    

    A listagem de diretórios deve conter os avisos de parceiros e arquivos de licença. A listagem também deve conter um diretório include que contém arquivos de cabeçalho (.h) e um diretório lib que contém bibliotecas para arm32, arm64, x64 e x86.

    Caminho Description
    license.md Licença
    ThirdPartyNotices.md Avisos de parceiros
    REDIST.txt Aviso de redistribuição
    incluem Arquivos de cabeçalho necessários para C++
    LIB/ARM32 Biblioteca nativa para ARM32 necessária para vincular seu aplicativo
    LIB/ARM64 Biblioteca nativa para ARM64 necessária para vincular seu aplicativo
    LIB/X64 Biblioteca nativa para x64 necessária para ligar a sua aplicação
    LIB/X86 Biblioteca nativa para x86 necessária para ligar a sua aplicação

Configurar o ambiente Go

As etapas a seguir permitem que seu ambiente Go encontre o SDK de fala.

  1. Como as associações dependem do cgo, você precisa definir as variáveis de ambiente para que Go possa encontrar o SDK.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x86, x64, arm32, ou arm64.

  2. Para executar aplicativos e o SDK, você precisa informar ao sistema operacional onde encontrar as bibliotecas.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Importante

    Substitua <architecture> pela arquitetura do processador da CPU: x86, x64, arm32, ou arm64.

Documentação | de referência Amostras adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Java.

Requisitos de plataforma

Escolha o seu ambiente de destino:

O Speech SDK for Java é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

O SDK de Fala para Java não suporta Windows no ARM64.

Instale um Java Development Kit como o Azul Zulu OpenJDK. O Microsoft Build do OpenJDK ou o seu JDK preferido também deve funcionar.

Instalar o SDK de fala para Java

Algumas das instruções usam uma versão específica do SDK, como 1.24.2. Para verificar a versão mais recente, pesquise nosso repositório GitHub.

Escolha o seu ambiente de destino:

Este guia mostra como instalar o Speech SDK for Java no Java Runtime.

Sistemas operativos suportados

O pacote Speech SDK for Java está disponível para estes sistemas operacionais:

  • Windows: apenas 64 bits.
  • Mac: macOS X versão 10.14 ou posterior.
  • Linux: Consulte as distribuições Linux suportadas e as arquiteturas de destino.

Siga estas etapas para instalar o SDK de fala para Java usando o Apache Maven:

  1. Instale o Apache Maven.

  2. Abra um prompt de comando onde você deseja o novo projeto e crie um novo arquivo pom.xml .

  3. Copie o seguinte conteúdo XML para pom.xml:

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.36.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. Execute o seguinte comando Maven para instalar o SDK de fala e dependências.

    mvn clean dependency:copy-dependencies
    

Pacote de documentação | de referência (npm) | Exemplos adicionais no código-fonte da Biblioteca GitHub |

Neste início rápido, você instala o SDK de fala para JavaScript.

O SDK de Fala para JavaScript está disponível como um pacote npm. Consulte microsoft-cognitiveservices-speech-sdk e seu repositório GitHub companheiro cognitive-services-speech-sdk-js.

Requisitos de plataforma

Compreenda as implicações arquitetônicas entre Node.js navegadores da Web e navegadores. Por exemplo, o modelo de objeto de documento (DOM) não está disponível para aplicativos do lado do servidor. O sistema de arquivos Node.js não está disponível para aplicativos do lado do cliente.

Instalar o SDK de Fala para JavaScript

Dependendo do ambiente de destino, use um dos seguintes guias:

Este guia mostra como instalar o SDK de fala para JavaScript para uso com o Node.js.

  1. Instalar o Node.js.

  2. Crie um novo diretório, execute npm inite percorra os prompts.

  3. Para instalar o SDK de Fala para JavaScript, execute o seguinte npm install comando:

    npm install microsoft-cognitiveservices-speech-sdk
    

Para obter mais informações, consulte as Node.js exemplos.

Usar o SDK de fala

  • Adicione a seguinte instrução import para usar o Speech SDK em seu projeto JavaScript:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

Para obter mais informações sobre importo , consulte Exportar e importar no site JavaScript.

Como alternativa, você pode usar uma instrução require:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

Pacote de documentação | de referência (Download) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Objective-C.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de Fala para Objective-C

O Speech SDK for Objective-C está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Um macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome do seu aplicativo. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.36.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Em alternativa, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Nota

Os desenvolvedores .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para obter mais informações, consulte Xamarin.Mac.

Pacote de documentação | de referência (Download) | Exemplos adicionais no GitHub

Neste início rápido, você instala o SDK de fala para Swift.

Gorjeta

Para obter mais informações sobre como usar o Speech SDK for Swift, consulte Importando Objective-C para o Swift.

Instalar o SDK de fala para Swift

O Speech SDK for Swift está disponível nativamente como um pacote CocoaPod para Mac x64 e sistemas baseados em ARM.

Requisitos do sistema para Mac:

  • Um macOS versão 10.14 ou posterior

O pacote macOS CocoaPod está disponível para download e uso com o Xcode 9.4.1 ou ambiente de desenvolvimento integrado (IDE) posterior.

  1. Vá para o diretório Xcode onde seu arquivo de projeto .xcodeproj está localizado.

  2. Execute pod init para criar um arquivo pod chamado Podfile.

  3. Substitua o conteúdo do Podfile pelo seguinte conteúdo. Atualize o target nome de AppName para o nome do seu aplicativo. Atualize a plataforma ou a versão do pod conforme necessário.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.36.0'
    end
    
  4. Execute pod install para instalar o SDK de fala.

Em alternativa, descarregue o binário CocoaPod e extraia o seu conteúdo. Em seu projeto Xcode, adicione uma referência à pasta extraída MicrosoftCognitiveServicesSpeech.xcframework e seu conteúdo.

Nota

Os desenvolvedores .NET podem criar aplicativos macOS nativos usando a estrutura de aplicativos Xamarin.Mac. Para obter mais informações, consulte Xamarin.Mac.

Pacote de documentação | de referência (PyPi) | Amostras adicionais no GitHub

Neste início rápido, você instala o Speech SDK for Python.

Requisitos de plataforma

O Speech SDK for Python é compatível com Windows, Linux e macOS.

No Windows, você deve usar a arquitetura de destino de 64 bits. É necessário o Windows 10 ou posterior.

Instale o Microsoft Visual C++ Redistributable para Visual Studio 2015, 2017, 2019 e 2022 para sua plataforma. A instalação deste pacote pela primeira vez pode exigir uma reinicialização.

Importante

Certifique-se de que os pacotes da mesma arquitetura de destino estão instalados. Por exemplo, se você instalar o pacote redistribuível x64, instale o pacote Python x64.

Instale uma versão do Python a partir da versão 3.7 ou posterior.

  • Para verificar a sua instalação, abra um terminal e execute o comando python --version. Se o Python foi instalado corretamente, você receberá uma resposta como Python 3.8.10.

  • Se você estiver usando macOS ou Linux, talvez seja necessário executar o comando python3 --version .

    Para habilitar o uso de em vez de pythonpython3, execute alias python='python3' para configurar um alias. Os exemplos de início rápido do SDK de fala especificam python o uso.

Instalar o SDK de Fala para Python

Antes de instalar o Speech SDK for Python, certifique-se de satisfazer os requisitos da plataforma.

Instalar a partir do PyPI

Para instalar o Speech SDK for Python, execute este comando em uma janela do console:

pip install azure-cognitiveservices-speech

Atualize para o SDK de fala mais recente

Para atualizar para o SDK de fala mais recente, execute este comando na janela do console:

pip install --upgrade azure-cognitiveservices-speech

Você pode verificar qual versão do Speech SDK for Python está instalada atualmente inspecionando a azure.cognitiveservices.speech.__version__ variável. Por exemplo, execute este comando em uma janela do console:

pip list

Usar o SDK de fala

Adicione a seguinte instrução import para usar o Speech SDK em seu projeto Python:

import azure.cognitiveservices.speech as speechsdk