Speech 디바이스란?

Speech Service는 다양한 디바이스 및 오디오 원본에서 작동합니다. 디바이스에서 제공하는 기본 오디오 처리를 사용할 수 있습니다. 그렇지 않은 경우 Speech SDK에는 Speech Service에서 잘 작동하도록 설계된 고급 오디오 처리 알고리즘을 사용할 수 있는 옵션이 있습니다. 잡음 제거, 반향 제거, 빔 형성 및 탈반향을 통해 정확한 원거리 음성 인식을 제공합니다.

오디오 처리

오디오 처리는 오디오 품질을 개선하기 위해 오디오 스트림에 적용되는 고급 기능입니다. 일반적인 고급 기능으로는 AGC(자동 게인 컨트롤), 잡음 제거 및 AEC(음향 반향 제거)가 있습니다. Speech SDK는 MAS(Microsoft Audio Stack)를 통합하여 모든 애플리케이션 또는 제품이 입력 오디오에서 오디오 처리 기능을 사용할 수 있도록 합니다.

마이크 배열 권장 사항

Speech SDK는 권장 지침에 따라 설계된 마이크 배열에서 가장 잘 작동합니다. 자세한 내용은 마이크 배열 권장 사항을 참조하세요.

디바이스 개발 키트

Speech SDK는 목적에 맞게 제작된 개발 키트와 다양한 마이크 배열 구성에서 작동하도록 설계되었습니다. 예를 들어 다음 Azure 개발 키트 중 하나를 사용할 수 있습니다.

  • Azure Percept DK는 미리 구성된 오디오 프로세서와 4 마이크 선형 배열을 포함합니다. Azure AI 서비스를 통해 음성 명령, 키워드 발견 및 원거리장 음성을 사용할 수 있습니다.
  • Azure Kinect DK는 정교한 Azure AI 비전과 음성 모델을 제공하는 고급 AI 센서가 포함된 개발자 키트입니다. 여러 모드가 있는 일체형 소형 디바이스로서 깊이 센서, 비디오 카메라가 장착된 공간 마이크 배열, 방향 센서가 포함되어 있습니다.

다음 단계