빠른 시작: Speech SDK 설치

참조 설명서 | 패키지(NuGet) | GitHub의 추가 샘플

이 빠른 시작에서는 C#용 Speech SDK를 설치합니다.

설명서의 코드 샘플은 C# 8로 작성되었으며 .NET 표준 2.0에서 실행됩니다.

플랫폼 요구 사항

C#용 Speech SDK는 Windows, Linux 및 macOS와 호환됩니다.

주의

이 문서에서는 EOL(수명 종료) 상태에 가까워진 Linux 배포판인 CentOS를 참조하세요. 이에 따라 사용 및 계획을 고려하세요. 자세한 내용은 CentOS 수명 종료 지침을 참조하세요.

Windows에서는 64비트 대상 아키텍처를 사용해야 합니다. Windows 10 이상이 필요합니다.

플랫폼에 적합한 Visual Studio 2015, 2017, 2019, 2022용 Microsoft Visual C++ 재배포 가능 패키지를 설치합니다. 이 패키지를 처음 설치하려면 다시 시작해야 할 수 있습니다.

C#용 Speech SDK 설치

C#용 Speech SDK는 NuGet 패키지로 제공되며 .NET Standard 2.0을 구현합니다. 자세한 내용은 Microsoft.CognitiveServices.Speech를 참조하세요.

C#용 Speech SDK는 다음 dotnet add 명령을 사용하여 .NET CLI에서 설치할 수 있습니다.

dotnet add package Microsoft.CognitiveServices.Speech

이 가이드에 따라 추가 옵션을 확인할 수 있습니다.

이 가이드에서는 .NET Framework(Windows) 콘솔 앱용 Speech SDK를 설치하는 방법을 보여 줍니다.

이 가이드에는 다음이 필요합니다.

Visual Studio 프로젝트를 만들고 Speech SDK를 설치합니다.

코드에서 참조할 수 있도록 Speech SDK NuGet 패키지를 설치해야 합니다. 이렇게 하려면 먼저 helloworld 프로젝트를 만들어야 할 수 있습니다. .NET 데스크톱 개발 워크로드를 사용할 수 있는 프로젝트가 이미 있는 경우 해당 프로젝트를 사용하고 NuGet 패키지 관리자를 사용하여 Speech SDK 설치로 건너뛸 수 있습니다.

helloworld 프로젝트 만들기

  1. Visual Studio를 엽니다.

  2. 시작에서 새 프로젝트 만들기를 선택합니다.

  3. 새 프로젝트 만들기에서 콘솔 앱(.NET Framework)을 선택한 후 다음을 선택합니다.

  4. 새 프로젝트 구성에서 프로젝트 이름helloworld를 입력하고 위치에서 디렉터리 경로를 선택하거나 만든 다음 만들기를 선택합니다.

  5. Visual Studio 메뉴 모음에서 도구>도구 및 기능 가져오기를 선택합니다. 이 단계에서는 Visual Studio 설치 관리자가 열리고 수정 대화 상자가 표시됩니다.

  6. .NET 데스크톱 개발 워크로드를 사용할 수 있는지 확인합니다. 워크로드가 설치되어 있지 않으면 이를 선택한 다음 수정을 선택하여 설치를 시작합니다. 다운로드 및 설치하는 데 몇 분 정도 걸릴 수 있습니다.

    이미 .NET 데스크톱 개발이 선택되어 있는 경우 닫기를 선택하여 대화 상자를 닫습니다.

    .NET 데스크톱 개발 사용하도록 설정을 보여 주는 스크린샷

  7. Visual Studio 설치 관리자를 닫습니다.

NuGet 패키지 관리자를 사용하여 Speech SDK 설치

  1. 솔루션 탐색기에서 helloworld 프로젝트를 마우스 오른쪽 단추로 클릭한 다음, NuGet 패키지 관리를 선택하여 NuGet 패키지 관리자를 표시합니다.

  2. 오른쪽 위 모서리에서 패키지 원본 드롭다운 상자를 찾아서 nuget.org를 선택합니다.

    NuGet 패키지 관리자를 보여 주는 스크린샷

  3. 왼쪽 위 모서리에서 찾아보기를 선택합니다.

  4. 검색 상자에 Microsoft.CognitiveServices.Speech를 입력하고 Enter 키를 선택합니다.

  5. 검색 결과에서 Microsoft.CognitiveServices.Speech 패키지를 선택한 다음, 설치를 선택하여 안정적인 최신 버전을 설치합니다.

    Microsoft.CognitiveServices.Speech NuGet 패키지 설치를 보여 주는 스크린샷

  6. 설치를 시작하려면 모든 계약 및 라이선스를 수락합니다.

    패키지를 설치하면 패키지 관리자 콘솔 창에 확인 메시지가 나타납니다.

대상 아키텍처 선택

콘솔 애플리케이션을 빌드하여 실행하려면 컴퓨터의 아키텍처와 일치하는 플랫폼 구성을 만듭니다.

  1. 메뉴 모음에서 빌드>Configuration Manager를 선택합니다. 구성 관리자 대화 상자가 나타납니다.

  2. 활성 솔루션 플랫폼 드롭다운 상자에서 새로 만들기를 선택합니다. 새 솔루션 플랫폼 대화 상자가 나타납니다.

    Configuration Manager 대화 상자를 보여 주는 스크린샷

  3. 새 플랫폼 입력 또는 선택 드롭다운 상자에서 다음을 수행합니다.

    • 64비트 Windows를 실행하는 경우 x64를 선택합니다.
    • 32비트 Windows를 실행하는 경우 x86을 선택합니다.
  4. 확인, 닫기를 차례로 선택합니다.

참조 설명서 | 패키지(NuGet) | GitHub의 추가 샘플

이 빠른 시작에서는 C++용 Speech SDK를 설치합니다.

플랫폼 요구 사항

C++용 Speech SDK는 Windows, Linux 및 macOS와 호환됩니다.

Windows에서는 64비트 대상 아키텍처를 사용해야 합니다. Windows 10 이상이 필요합니다.

플랫폼에 적합한 Visual Studio 2015, 2017, 2019, 2022용 Microsoft Visual C++ 재배포 가능 패키지를 설치합니다. 이 패키지를 처음 설치하려면 다시 시작해야 할 수 있습니다.

C++용 Speech SDK 설치

C++용 Speech SDK는 NuGet 패키지로 사용할 수 있습니다. 자세한 내용은 Microsoft.CognitiveServices.Speech를 참조하세요.

C++용 Speech SDK는 다음 dotnet add 명령을 사용하여 .NET CLI에서 설치할 수 있습니다.

dotnet add package Microsoft.CognitiveServices.Speech

이 가이드에 따라 추가 옵션을 확인할 수 있습니다.

이 가이드에서는 Linux용 음성 SDK를 설치하는 방법을 보여줍니다.

SDK를 다운로드하고 설치하려면 다음 절차를 따르세요. 이 단계에는 필요한 라이브러리 및 헤더 파일을 .tar 파일로 다운로드하는 과정이 포함됩니다.

  1. Speech SDK 파일의 디렉터리를 선택합니다. 해당 디렉터리를 가리키도록 SPEECHSDK_ROOT 환경 변수를 설정합니다. 이 변수는 이후 명령에서 디렉터리를 쉽게 참조할 수 있게 해줍니다.

    홈 디렉터리의 speechsdk 디렉터리를 사용하려면 다음 명령을 실행합니다.

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 디렉터리가 없을 경우 새로 만듭니다.

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 음성 SDK 이진 파일이 들어 있는 .tar.gz 아카이브를 다운로드하여 추출합니다.

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 추출된 패키지의 최상위 디렉터리의 내용을 확인합니다.

    ls -l "$SPEECHSDK_ROOT"
    

    디렉터리 목록에는 파트너 공지 및 라이선스 파일이 포함되어야 합니다. 목록에는 헤더(.h) 파일이 있는 include 디렉터리와 arm32, arm64, x64 및 x86용 라이브러리가 있는 lib 디렉터리도 포함되어야 합니다.

    Path 설명
    license.md 라이선스
    ThirdPartyNotices.md 파트너 공지
    REDIST.txt 재배포 고지 사항
    include C++에 필요한 헤더 파일
    lib/arm32 애플리케이션을 연결하는 데 필요한 ARM32용 네이티브 라이브러리
    lib/arm64 애플리케이션을 연결하는 데 필요한 ARM64용 네이티브 라이브러리
    lib/x64 애플리케이션을 연결하는 데 필요한 x64용 네이티브 라이브러리
    lib/x86 애플리케이션을 연결하는 데 필요한 x86용 네이티브 라이브러리

참조 설명서 | 패키지(Go) | GitHub의 추가 샘플

이 빠른 시작에서는 Go용 Speech SDK를 설치합니다.

플랫폼 요구 사항

주의

이 문서에서는 EOL(수명 종료) 상태에 가까워진 Linux 배포판인 CentOS를 참조하세요. 이에 따라 사용 및 계획을 고려하세요. 자세한 내용은 CentOS 수명 종료 지침을 참조하세요.

Go용 Speech SDK는 x64 아키텍처에서 다음 배포를 지원합니다.

  • Ubuntu 18.04/20.04
  • Debian 9/10/11
  • RHEL(Red Hat Enterprise Linux) 8
  • CentOS 7

Important

Linux 배포판의 최신 LTS 릴리스를 사용합니다. 예를 들어 Ubuntu 20.04 LTS를 사용하는 경우 최신 릴리스의 Ubuntu 20.04.X를 사용합니다.

Speech SDK는 다음 Linux 시스템 라이브러리에 따라 달라집니다.

  • GNU C 라이브러리의 공유 라이브러리(POSIX Threads Programming 라이브러리, libpthreads 포함).
  • OpenSSL 라이브러리(libssl) 버전 1.x 및 인증서(ca-certificates).
  • ALSA 애플리케이션의 공유 라이브러리(libasound).

보안 웹소켓을 설정하고 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED 오류를 방지하려면 ca-certificates도 설치해야 합니다.

Important

음성 SDK는 Ubuntu 22.04 및 Debian 12의 기본값인 OpenSSL 3.0을 아직 지원하지 않습니다.

다음 명령을 실행하세요.

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

Go 이진 파일 버전 1.13 이상을 설치합니다.

Go용 Speech SDK 설치

SDK를 다운로드하고 설치하려면 다음 절차를 따르세요. 이 단계에는 필요한 라이브러리 및 헤더 파일을 .tar 파일로 다운로드하는 과정이 포함됩니다.

  1. Speech SDK 파일의 디렉터리를 선택합니다. 해당 디렉터리를 가리키도록 SPEECHSDK_ROOT 환경 변수를 설정합니다. 이 변수는 이후 명령에서 디렉터리를 쉽게 참조할 수 있게 해줍니다.

    홈 디렉터리의 speechsdk 디렉터리를 사용하려면 다음 명령을 실행합니다.

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 디렉터리가 없을 경우 새로 만듭니다.

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 음성 SDK 이진 파일이 들어 있는 .tar.gz 아카이브를 다운로드하여 추출합니다.

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 추출된 패키지의 최상위 디렉터리의 내용을 확인합니다.

    ls -l "$SPEECHSDK_ROOT"
    

    디렉터리 목록에는 파트너 공지 및 라이선스 파일이 포함되어야 합니다. 목록에는 헤더(.h) 파일이 있는 include 디렉터리와 arm32, arm64, x64 및 x86용 라이브러리가 있는 lib 디렉터리도 포함되어야 합니다.

    Path 설명
    license.md 라이선스
    ThirdPartyNotices.md 파트너 공지
    REDIST.txt 재배포 고지 사항
    include C++에 필요한 헤더 파일
    lib/arm32 애플리케이션을 연결하는 데 필요한 ARM32용 네이티브 라이브러리
    lib/arm64 애플리케이션을 연결하는 데 필요한 ARM64용 네이티브 라이브러리
    lib/x64 애플리케이션을 연결하는 데 필요한 x64용 네이티브 라이브러리
    lib/x86 애플리케이션을 연결하는 데 필요한 x86용 네이티브 라이브러리

Go 환경 구성

다음 단계에서는 음성 SDK를 찾기 위해 Go 환경을 사용하도록 설정합니다.

  1. 바인딩은 cgo에 의존하므로 Go가 SDK를 찾을 수 있도록 환경 변수를 설정해야 합니다.

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Important

    <architecture>를 CPU의 프로세서 아키텍처인 x86, x64, arm32 또는 arm64로 바꿉니다.

  2. 애플리케이션 및 SDK를 실행하려면 운영 체제에 라이브러리를 찾을 위치를 알려야 합니다.

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Important

    <architecture>를 CPU의 프로세서 아키텍처인 x86, x64, arm32 또는 arm64로 바꿉니다.

참조 설명서 | GitHub의 추가 샘플

이 빠른 시작에서는 Java용 Speech SDK를 설치합니다.

플랫폼 요구 사항

대상 환경 선택:

Java용 Speech SDK는 Windows, Linux 및 macOS와 호환됩니다.

Windows에서는 64비트 대상 아키텍처를 사용해야 합니다. Windows 10 이상이 필요합니다.

플랫폼에 적합한 Visual Studio 2015, 2017, 2019, 2022용 Microsoft Visual C++ 재배포 가능 패키지를 설치합니다. 이 패키지를 처음 설치하려면 다시 시작해야 할 수 있습니다.

Java용 Speech SDK는 ARM64의 Windows를 지원하지 않습니다.

Azul Zulu OpenJDK와 같은 Java 개발 키트를 설치해야 합니다. OpenJDK의 Microsoft 빌드 또는 선호하는 JDK도 작동해야 합니다.

Java용 Speech SDK 설치

일부 지침은 1.24.2과 같은 특정 SDK 버전을 사용합니다. 최신 버전을 확인하려면 GitHub 리포지토리를 검색합니다.

대상 환경 선택:

이 가이드는 Java 런타임에서 Java용 Speech SDK를 설치하는 방법을 보여 줍니다.

지원되는 운영 체제

Java용 Speech SDK 패키지는 다음 운영 체제에서 사용할 수 있습니다.

Apache Maven을 사용하여 Java용 Speech SDK를 설치하려면 다음 단계를 따릅니다.

  1. Apache Maven을 설치합니다.

  2. 새 프로젝트를 원하는 명령 프롬프트를 열고 새 pom.xml 파일을 만듭니다.

  3. 다음 XML 콘텐츠를 pom.xml에 복사합니다.

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.37.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 다음 Maven 명령을 실행하여 Speech SDK 및 종속성을 설치합니다.

    mvn clean dependency:copy-dependencies
    

참조 설명서 | 패키지(npm) | GitHub의 추가 샘플 | 라이브러리 소스 코드

이 빠른 시작에서는 JavaScript용 Speech SDK를 설치합니다.

JavaScript용 음성 SDK는 npm 패키지로 제공됩니다. microsoft-cognitiveservices-speech-sdk 및 해당 도우미 GitHub 리포지토리 cognitive-services-speech-sdk-js를 참조하세요.

플랫폼 요구 사항

Node.js와 클라이언트 웹 브라우저 간의 아키텍처 의미를 이해합니다. 예를 들어, DOM(문서 개체 모델)은 서버 쪽 애플리케이션에서 사용할 수 없습니다. Node.js 파일 시스템은 클라이언트 쪽 애플리케이션에서 사용할 수 없습니다.

JavaScript용 Speech SDK 설치

대상 환경에 따라 다음 가이드 중 하나를 사용합니다.

이 가이드에서는 Node.js와 함께 사용할 JavaScript용 Speech SDK를 설치하는 방법을 보여줍니다.

  1. Node.js를 설치합니다.

  2. 새 디렉터리를 만들고, npm init를 실행하고, 프롬프트를 진행합니다.

  3. JavaScript용 음성 SDK를 설치하려면 npm install 명령을 실행합니다.

    npm install microsoft-cognitiveservices-speech-sdk
    

자세한 내용은 Node.js 샘플을 참조하세요.

Speech SDK 사용

  • JavaScript 프로젝트에서 Speech SDK를 사용하려면 다음 import 문을 추가합니다.

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

import에 대한 자세한 내용은 JavaScript 웹 사이트에서 내보내기 및 가져오기를 참조하세요.

또는 require 문을 사용할 수 있습니다.

const sdk = require("microsoft-cognitiveservices-speech-sdk");

참조 설명서 | 패키지(다운로드) | GitHub의 추가 샘플

이 빠른 시작에서는 Objective-C용 Speech SDK를 설치합니다.

Swift용 Speech SDK 사용에 대한 자세한 내용은 Swift로 Objective-C 가져오기를 참조하세요.

Objective-C용 Speech SDK 설치

Objective-C용 Speech SDK는 기본적으로 Mac x64용 CocoaPod 패키지 및 ARM 기반 시스템으로 제공됩니다.

Mac용 시스템 요구 사항:

  • macOS 버전 10.14 이상

macOS CocoaPod 패키지는 Xcode 9.4.1 이상 IDE(통합 개발 환경)에서 다운로드하여 사용할 수 있습니다.

  1. .xcodeproj 프로젝트 파일이 있는 Xcode 디렉터리로 이동합니다.

  2. pod init를 실행하여 Podfile이라는 Pod 파일을 만듭니다.

  3. Podfile의 내용을 다음 내용으로 바꿉니다. target 이름을 AppName에서 앱 이름으로 업데이트합니다. 필요에 따라 플랫폼 또는 Pod 버전을 업데이트합니다.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. pod install을 실행하여 Speech SDK를 설치합니다.

또는 이진 파일 CocoaPod를 다운로드하고 콘텐츠를 추출합니다. Xcode 프로젝트에서 추출된 MicrosoftCognitiveServicesSpeech.xcframework 폴더와 그 내용에 대한 참조를 추가합니다.

참고 항목

.NET 개발자는 Xamarin.Mac 애플리케이션 프레임워크를 사용하여 네이티브 macOS 애플리케이션을 빌드할 수 있습니다. 자세한 내용은 Xamarin.Mac을 참조하세요.

참조 설명서 | 패키지(다운로드) | GitHub의 추가 샘플

이 빠른 시작에서는 Swift용 Speech SDK를 설치합니다.

Swift용 Speech SDK 사용에 대한 자세한 내용은 Swift로 Objective-C 가져오기를 참조하세요.

Swift용 Speech SDK 설치

Swift용 Speech SDK는 기본적으로 Mac x64용 CocoaPod 패키지 및 ARM 기반 시스템으로 제공됩니다.

Mac용 시스템 요구 사항:

  • macOS 버전 10.14 이상

macOS CocoaPod 패키지는 Xcode 9.4.1 이상 IDE(통합 개발 환경)에서 다운로드하여 사용할 수 있습니다.

  1. .xcodeproj 프로젝트 파일이 있는 Xcode 디렉터리로 이동합니다.

  2. pod init를 실행하여 Podfile이라는 Pod 파일을 만듭니다.

  3. Podfile의 내용을 다음 내용으로 바꿉니다. target 이름을 AppName에서 앱 이름으로 업데이트합니다. 필요에 따라 플랫폼 또는 Pod 버전을 업데이트합니다.

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
    end
    
  4. pod install을 실행하여 Speech SDK를 설치합니다.

또는 이진 파일 CocoaPod를 다운로드하고 콘텐츠를 추출합니다. Xcode 프로젝트에서 추출된 MicrosoftCognitiveServicesSpeech.xcframework 폴더와 그 내용에 대한 참조를 추가합니다.

참고 항목

.NET 개발자는 Xamarin.Mac 애플리케이션 프레임워크를 사용하여 네이티브 macOS 애플리케이션을 빌드할 수 있습니다. 자세한 내용은 Xamarin.Mac을 참조하세요.

참조 설명서 | 패키지(PyPi) | GitHub의 추가 샘플

이 빠른 시작에서는 Python용 Speech SDK를 설치합니다.

플랫폼 요구 사항

Python용 Speech SDK는 Windows, Linux 및 macOS와 호환됩니다.

Windows에서는 64비트 대상 아키텍처를 사용해야 합니다. Windows 10 이상이 필요합니다.

플랫폼에 적합한 Visual Studio 2015, 2017, 2019, 2022용 Microsoft Visual C++ 재배포 가능 패키지를 설치합니다. 이 패키지를 처음 설치하려면 다시 시작해야 할 수 있습니다.

Important

동일한 대상 아키텍처의 패키지가 설치되어 있는지 확인합니다. 예를 들어 x64 재배포 가능 패키지를 설치하는 경우 x64 Python 패키지를 설치합니다.

Python 3.7 이상 버전을 설치합니다.

  • 설치를 확인하려면 터미널을 열고 python --version 명령을 실행합니다. Python이 제대로 설치되면 Python 3.8.10과 은 응답이 표시됩니다.

  • macOS 또는 Linux를 사용하는 경우 대신 python3 --version 명령을 실행해야 할 수 있습니다.

    python3 대신 python을 사용하도록 설정하려면 alias python='python3'을 실행하여 별칭을 설정합니다. Speech SDK 빠른 시작 샘플은 python 사용을 지정합니다.

Python용 Speech SDK 설치

Python용 Speech SDK를 설치하기 전에 플랫폼 요구 사항을 충족해야 합니다.

PyPi에서 설치

Python용 Speech SDK를 설치하려면 콘솔 창에서 이 명령을 실행합니다.

pip install azure-cognitiveservices-speech

최신 Speech SDK로 업그레이드

최신 Speech SDK로 업그레이드하려면 콘솔 창에서 이 명령을 실행합니다.

pip install --upgrade azure-cognitiveservices-speech

azure.cognitiveservices.speech.__version__ 변수를 검사하여 현재 설치된 Python용 Speech SDK 버전을 확인할 수 있습니다. 예를 들어 콘솔 창에서 이 명령을 실행합니다.

pip list

Speech SDK 사용

Python 프로젝트에서 Speech SDK를 사용하려면 다음 import 문을 추가합니다.

import azure.cognitiveservices.speech as speechsdk