Speech SDK についてAbout the Speech SDK

Speech ソフトウェア開発キット (SDK) は、音声認識対応のソフトウェア開発を支援します。アプリケーションから SDK を利用することで、Speech サービスの各種機能を利用することができます。The Speech Software Development Kit (SDK) gives your applications access to the functions of the Speech service, making it easier to develop speech-enabled software. 現在、これらの SDK は音声テキスト変換テキスト音声変換音声翻訳意図認識、および Bot Framework の Direct Line Speech チャネルへのアクセスを提供しています。Currently, the SDKs provide access to speech-to-text, text-to-speech, speech translation, intent recognition, and Bot Framework’s Direct Line Speech channel.

Speech SDK を使用することにより、マイクからの音声のキャプチャや、ストリームからの読み取り、ストレージからの音声ファイルへのアクセスを簡単に行うことができます。You can easily capture audio from a microphone, read from a stream, or access audio files from storage with the Speech SDK. Speech SDK では、音声認識用として、WAV/PCM 16 ビット、16 kHz/8 kHz、単一チャネル オーディオがサポートされています。The Speech SDK supports WAV/PCM 16-bit, 16 kHz/8 kHz, single-channel audio for speech recognition. 音声変換 REST エンドポイントバッチ文字起こしサービスを使用したオーディオ形式もサポートされています。Additional audio formats are supported using the speech-to-text REST endpoint or the batch transcription service.

機能やサポートされているプラットフォームについての概要は、エントリ ページ ドキュメントで確認できます。A general overview about the capabilities and supported platforms can be found on the documentation entry page.

プログラミング言語Programming language プラットフォームPlatform API リファレンスAPI reference
C/C++C/C++ Windows、Linux、macOSWindows, Linux, macOS BrowseBrowse
C#C# Windows、UWP、.NET Framework (Windows)、.NET Core、UnityWindows, UWP, .NET Framework (Windows), .NET Core, Unity BrowseBrowse
JavaJava Android、Windows、Linux、macOSAndroid, Windows, Linux, macOS BrowseBrowse
Java*Java* Speech Devices SDKSpeech Devices SDK BrowseBrowse
JavaScript/Node.jsJavaScript/Node.js Browser、Windows、Linux、macOSBrowser, Windows, Linux, macOS BrowseBrowse
Objective-CObjective-C iOS、macOSiOS, macOS BrowseBrowse
PythonPython Windows、Linux、macOSWindows, Linux, macOS BrowseBrowse

*Java SDK は Speech Devices SDK の一部としても入手できます。* The Java SDK is also available as part of the Speech Devices SDK.

重要

このページにある Azure Cognitive Services 用 Speech SDK コンポーネントのいずれかをダウンロードした時点で、そのライセンス条件に同意したものと見なされます。By downloading any of the Speech SDK for Azure Cognitive Services components on this page, you acknowledge its license. Microsoft Software License Terms for the Speech SDK (Speech SDK の Microsoft ソフトウェア ライセンス条項)」をご覧ください。See the Microsoft Software License Terms for the Speech SDK.

SDK の取得Get the SDK

WindowsWindows

Windows の場合、次の言語がサポートされています。For Windows, we support the following languages:

  • C# (UWP と .NET)、C++: Speech SDK NuGet パッケージの最新バージョンを参照および使用することができます。C# (UWP and .NET), C++: You can reference and use the latest version of our Speech SDK NuGet package. パッケージには、32 ビットおよび 64 ビットのクライアント ライブラリとマネージ (.NET) ライブラリが含まれています。The package includes 32-bit and 64-bit client libraries and managed (.NET) libraries. SDK は、NuGet の Microsoft.CognitiveServices.Speech を使用して Visual Studio にインストールできます。The SDK can be installed in Visual Studio by using NuGet, Microsoft.CognitiveServices.Speech.

  • Java:Speech SDK Maven パッケージの最新バージョンを参照および使用することができます。これは Windows x64 のみをサポートします。Java: You can reference and use the latest version of our Speech SDK Maven package, which supports only Windows x64. Maven プロジェクトでは、追加のリポジトリとして https://csspeechstorage.blob.core.windows.net/maven/ を追加し、依存関係として com.microsoft.cognitiveservices.speech:client-sdk:1.8.0 を参照します。In your Maven project, add https://csspeechstorage.blob.core.windows.net/maven/ as an additional repository and reference com.microsoft.cognitiveservices.speech:client-sdk:1.8.0 as a dependency.

LinuxLinux

注意

現在、次のターゲット アーキテクチャでは Ubuntu 16.04、Ubuntu 18.04、Debian 9 のみがサポートされています。Currently, we only support Ubuntu 16.04, Ubuntu 18.04, and Debian 9 on the following target architectures:

  • C++ 開発用の x86、x64、ARM64x86, x64, and ARM64 for C++ development
  • Java 用の x64、ARM64x64 and ARM64 for Java
  • .NET Core および Python 用の x64x64 for .NET Core and Python

次のシェル コマンドを実行して、必須のライブラリがインストールされていることを確認します。Make sure you have the required libraries installed by running the following shell commands:

Ubuntu の場合:On Ubuntu:

sudo apt-get update
sudo apt-get install libssl1.0.0 libasound2

Debian 9 の場合:On Debian 9:

sudo apt-get update
sudo apt-get install libssl1.0.2 libasound2
  • C#:Speech SDK NuGet パッケージの最新バージョンを参照および使用することができます。C#: You can reference and use the latest version of our Speech SDK NuGet package. SDK を参照するには、プロジェクトに次のパッケージ参照を追加します。To reference the SDK, add the following package reference to your project:

    <PackageReference Include="Microsoft.CognitiveServices.Speech" Version="1.8.0" />
    
  • Java:Speech SDK Maven パッケージの最新バージョンを参照および使用することができます。Java: You can reference and use the latest version of our Speech SDK Maven package. Maven プロジェクトでは、追加のリポジトリとして https://csspeechstorage.blob.core.windows.net/maven/ を追加し、依存関係として com.microsoft.cognitiveservices.speech:client-sdk:1.7.0 を参照します。In your Maven project, add https://csspeechstorage.blob.core.windows.net/maven/ as an additional repository and reference com.microsoft.cognitiveservices.speech:client-sdk:1.7.0 as a dependency.

  • C++: .tar パッケージとして SDK をダウンロードし、ファイルを任意のディレクトリにアンパックします。C++: Download the SDK as a .tar package and unpack the files in a directory of your choice. SDK のフォルダー構造を次の表に示します。The following table shows the SDK folder structure:

    PathPath [説明]Description
    license.md ライセンスLicense
    ThirdPartyNotices.md サード パーティに関する通知Third-party notices
    include C および C++ 用のヘッダー ファイルHeader files for C and C++
    lib/x64 アプリケーションとのリンクのためのネイティブ x64 ライブラリNative x64 library for linking with your application
    lib/x86 アプリケーションとのリンクのためのネイティブ x86 ライブラリNative x86 library for linking with your application

    アプリケーションを作成するには、必須のバイナリ (およびライブラリ) を開発環境にコピーまたは移動し、To create an application, copy or move the required binaries (and libraries) into your development environment. 必要に応じてそれらをビルド プロセスに含めます。Include them as required in your build process.

AndroidAndroid

Android 用 Java SDK は、必要なライブラリと必要な Android アクセス許可を含む AAR (Android ライブラリ) としてパッケージ化されます。The Java SDK for Android is packaged as an AAR (Android Library), which includes the necessary libraries and required Android permissions. これは、https://csspeechstorage.blob.core.windows.net/maven/ にある Maven リポジトリでパッケージ com.microsoft.cognitiveservices.speech:client-sdk:1.7.0 としてホストされます。It's hosted in a Maven repository at https://csspeechstorage.blob.core.windows.net/maven/ as package com.microsoft.cognitiveservices.speech:client-sdk:1.7.0.

このパッケージを Android Studio プロジェクトから使用するには、次の変更を行います。To consume the package from your Android Studio project, make the following changes:

  • プロジェクト レベルの build.gradle ファイルで、repository セクションに次を追加します。In the project-level build.gradle file, add the following to the repository section:

    maven { url 'https://csspeechstorage.blob.core.windows.net/maven/' }
    
  • モジュール レベルの build.gradle ファイルで、dependencies セクションに次を追加します。In the module-level build.gradle file, add the following to the dependencies section:

    implementation 'com.microsoft.cognitiveservices.speech:client-sdk:1.7.0'
    

Java SDK は Speech Devices SDK の一部でもあります。The Java SDK is also part of the Speech Devices SDK.

サンプルの入手Get the samples

最新のサンプルについては、GitHub の Cognitive Services の Speech SDK のサンプル コード リポジトリを参照してください。For the latest samples, see the Cognitive Services Speech SDK sample code repository on GitHub.

次のステップNext steps