JavaScript에서 Speech Recognition API 시작Get started with the Speech Recognition API in JavaScript

Speech Recognition API를 사용하여 음성 오디오를 텍스트로 변환하는 응용 프로그램을 개발할 수 있습니다.You can develop applications that convert spoken audio to text by using the Speech Recognition API. JavaScript 클라이언트 라이브러리는 Speech Service WebSocket 프로토콜을 사용하여 전사된 텍스트를 동시에 말하고 받을 수 있습니다.The JavaScript client library uses the Speech Service WebSocket protocol, which allows you to talk and receive transcribed text simultaneously. 이 문서는 JavaScript에서 Speech Recognition API를 시작하는 데 도움이 됩니다.This article helps you to get started with the Speech Recognition API in JavaScript.

필수 조건Prerequisites

Speech Recognition API 구독 및 평가판 구독 키 가져오기Subscribe to the Speech Recognition API, and get a free trial subscription key

Speech API는 Cognitive Services의 일부입니다.The Speech API is part of Cognitive Services. Cognitive Services 구독 페이지에서 평가판 구독 키를 가져올 수 있습니다.You can get free trial subscription keys from the Cognitive Services subscription page. Speech API를 선택한 후에 API 키 가져오기를 선택하여 키를 가져옵니다.After you select the Speech API, select Get API Key to get the key. 기본 및 보조 키를 반환합니다.It returns a primary and secondary key. 두 키는 모두 동일한 할당량에 연결되므로 두 키 중 하나를 사용할 수 있습니다.Both keys are tied to the same quota, so you can use either key.

중요

구독 키를 가져오세요.Get a subscription key. Speech 클라이언트 라이브러리를 사용하려면 먼저 구독 키가 있어야 합니다.Before you can use Speech client libraries, you must have a subscription key.

시작하기Get started

이 섹션에서는 샘플 HTML 페이지를 로드하는 데 필요한 단계를 안내합니다.In this section we will walk you through the necessary steps to load a sample HTML page. 샘플은 github 리포지토리에 있습니다.The sample is located in our github repository. 리포지토리에서 직접 샘플을 열거나 리포지토리의 로컬 복사본에서 샘플을 열 수 있습니다.You can open the sample directly from the repository, or open the sample from a local copy of the repository.

참고

일부 브라우저는 보안되지 않은 원본에서 마이크를 액세스하지 못하도록 차단합니다.Some browsers block microphone access on un-secure origin. 따라서 https에서 '샘플'/'앱'을 호스팅하여 지원되는 모든 브라우저에서 작동하도록 하는 것이 좋습니다.So, it is recommended to host the 'sample'/'your app' on https to get it working on all supported browsers.

샘플 직접 열기Open the sample directly

위에서 설명한 대로 구독 키를 얻습니다.Acquire a subscription key as described above. 그런 다음, 샘플에 대한 링크를 엽니다.Then open the link to the sample. 그러면 기본 브라우저에 페이지가 로드됩니다(htmlPreview를 사용하여 렌더링됨).This will load the page into your default browser (Rendered using htmlPreview).

로컬 복사본에서 샘플 열기Open the sample from a local copy

샘플을 로컬에서 사용하려면 이 리포지토리를 복제합니다.To try the sample locally, clone this repository:

git clone https://github.com/Azure-Samples/SpeechToText-WebSockets-Javascript

TypeScript 소스를 컴파일하고, 단일 JavaScript 파일에 번들로 포함시킵니다(npm이 컴퓨터에 설치되어 있어야 함).compile the TypeScript sources and bundle them into a single JavaScript file (npm needs to be installed on your machine). 복제된 리포지토리의 루트로 변경하고, 다음 명령을 실행합니다.Change into the root of the cloned repository and run the commands:

cd SpeechToText-WebSockets-Javascript && npm run bundle

즐겨찾는 브라우저에서 samples\browser\Sample.html을 엽니다.Open samples\browser\Sample.html in your favorite browser.

다음 단계Next steps

사용자 고유의 웹 페이지에 SDK를 포함하는 방법에 대한 자세한 내용은 여기서 사용할 수 있습니다.More information on how to include the SDK into your own webpage is available here.

설명Remarks

  • Speech Recognition API는 세 가지 인식 모드를 지원합니다.The Speech Recognition API supports three recognition modes. Sample.html 파일에 있는 Setup() 함수를 업데이트하여 모드를 전환할 수 있습니다.You can switch the mode by updating the Setup() function found in the Sample.html file. 이 샘플에서는 기본적으로 모드를 Interactive로 설정합니다.The sample sets the mode to Interactive by default. 모드를 변경하려면 SR.RecognitionMode.Interactive 매개 변수를 다른 모드로 업데이트합니다.To change the mode, update the parameter SR.RecognitionMode.Interactive to another mode. 예를 들어 매개 변수를 SR.RecognitionMode.Conversation으로 변경합니다.For example, change the parameter to SR.RecognitionMode.Conversation.
  • 지원되는 언어에 대한 전체 목록은 지원되는 언어를 참조하세요.For a complete list of supported languages, see Supported languages.