음성 인식 및 기록된 고객 통화를 분석하면 비즈니스에 현재 추세, 제품 단점 및 성공에 대한 중요한 정보를 제공할 수 있습니다.
이 문서에 설명된 예제 솔루션에서는 대화 데이터를 기록하고 분석하기 위한 반복 가능한 파이프라인을 간략하게 설명합니다.
아키텍처
이 아키텍처는 오디오를 텍스트로 변환하는 대화 내용 기록 파이프라인과 보강 및 시각화 파이프라인이라는 두 파이프라인으로 구성됩니다.
대화 내용 기록 파이프라인
이 아키텍처의 Visio 파일을 다운로드합니다.
데이터 흐름
- 오디오 파일은 지원되는 방법을 통해 Azure Storage 계정에 업로드됩니다. Azure Storage Explorer 같은 UI 기반 도구를 사용하거나 스토리지 SDK 또는 API를 사용할 수 있습니다.
- Azure Storage에 업로드하면 Azure 논리 앱이 트리거됩니다. 논리 앱은 Azure Key Vault에서 필요한 자격 증명에 액세스하고 Speech Service의 일괄 처리 기록 API를 요청합니다.
- 논리 앱은 Speech Service에 화자 분리에 대한 선택적 설정을 포함하는 오디오 파일 호출을 제출합니다.
- Speech Service는 일괄 처리 기록을 완료하고 기록 결과를 Storage 계정에 로드합니다.
보강 및 시각화 파이프라인
이 아키텍처의 Visio 파일을 다운로드합니다.
데이터 흐름
- Azure Synapse Analytics 파이프라인이 실행되어 기록된 오디오 텍스트를 검색하고 처리합니다.
- 파이프라인이 API 호출을 통해 처리된 텍스트를 언어 서비스로 보냅니다. 이 서비스는 감정 및 오피니언 마이닝, 요약, 사용자 지정 및 미리 빌드된 명명된 엔터티 인식과 같은 다양한 NLP(자연어 처리) 보강을 수행합니다.
- 처리된 데이터는 Azure Synapse Analytics SQL 풀에 저장되고, Power BI와 같은 시각화 도구에 제공될 수 있습니다.
구성 요소
- Azure Blob Storage. 클라우드 네이티브 워크로드, 보관, 데이터 레이크, 고성능 컴퓨팅 및 기계 학습을 위한 대규모 확장성 및 보안 개체 스토리지입니다. 이 솔루션에서는 오디오 파일 및 대화 내용 기록 결과를 저장하고 다운스트림 분석을 위한 데이터 레이크 역할을 합니다.
- Azure Logic Apps. 컨테이너화된 런타임을 기반으로 하는 iPaaS(integration Platform as a Service)입니다. 이 솔루션에서는 스토리지 및 음성 AI 서비스를 통합합니다.
- AI Speech Service. 음성 텍스트 변환, 텍스트 음성 변환, 음성 번역 및 화자 인식과 같은 음성 기능을 제공하는 AI 기반 API입니다. 이 솔루션에서는 일괄 기록 기능이 사용됩니다.
- AI 언어. 감정 분석, 엔터티 추출 및 자동화된 질문 답변과 같은 자연어 기능을 제공하는 AI 기반 관리형 서비스입니다.
- Azure Synapse Analytics. 데이터 통합, 엔터프라이즈 데이터 웨어하우징 및 빅 데이터 분석을 제공하는 서비스 제품군입니다. 이 솔루션에서는 대화 내용 기록 데이터를 변환하고 보강하며 다운스트림 시각화 도구에 데이터를 제공합니다.
- Power BI. 데이터 모델링 및 시각적 분석 도구입니다. 이 솔루션에서는 사용자 및 의사 결정권자에게 기록된 오디오 인사이트를 제공합니다.
대안
이 솔루션 아키텍처를 대체하는 몇 가지 방법은 다음과 같습니다.
- 계층 구조 네임스페이스를 사용하도록 Blob Storage 계정을 구성하는 것이 좋습니다. 이 구성은 ACL(액세스 제어 목록) 기반 보안 제어를 제공하며 일부 빅 데이터 워크로드의 성능을 향상시킬 수 있습니다.
- 워크로드의 크기와 규모에 따라 Logic Apps 또는 Azure Synapse 파이프라인 대신 Azure Functions를 코드 우선 통합 도구로 사용할 수 있습니다.
시나리오 정보
고객 관리 센터는 다양한 산업에 종사하는 많은 기업의 성공에 필수적인 부분입니다. 이 솔루션은 기록된 고객 호출의 오디오 전사 및 일지에 Azure AI 서비스의 Speech API를 사용합니다. Azure Synapse Analytics는 AI Language에 대한 API 호출을 통해 감정 분석 및 사용자 지정 명명된 엔터티 인식과 같은 NLP 작업을 처리하고 수행하는 데 사용됩니다.
여기에 설명된 서비스 및 파이프라인을 통해 기록된 텍스트를 처리하여 중요한 정보를 인식 및 제거하고 감정 분석 등을 수행할 수 있습니다. 기록된 데이터의 양에 맞게 서비스 및 파이프라인의 크기를 조정할 수 있습니다.
잠재적인 사용 사례
이 솔루션은 통신, 금융 서비스 및 정부를 비롯한 많은 산업의 조직에 가치를 제공할 수 있습니다. 이는 대화를 기록하는 모든 조직에 적용됩니다. 특히 고객 대면 또는 내부 콜 센터 또는 지원 데스크는 이 솔루션에서 파생된 인사이트를 활용할 수 있습니다.
고려 사항
이러한 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 일련의 기본 원칙인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Microsoft Azure Well-Architected Framework를 참조하세요.
보안
우수한 보안은 중요한 데이터 및 시스템에 대한 고의적인 공격과 악용을 방어합니다. 자세한 내용은 보안 요소의 개요를 참조하세요.
- Speech API에 대한 요청에는 Azure Storage의 대상 컨테이너에 대한 SAS(공유 액세스 서명) URI가 포함될 수 있습니다. SAS URI를 사용하면 Speech Service가 대화 내용 기록 파일을 컨테이너 위치에 직접 출력할 수 있습니다. 조직에서 스토리지에 SAS URI 사용을 허용하지 않는 경우 완료된 자산에 대해 음성 API를 주기적으로 폴링하는 함수를 구현해야 합니다.
- 계정 또는 API 키와 같은 자격 증명은 Azure Key Vault에 비밀로 저장해야 합니다. 애플리케이션 설정 또는 코드에 비밀을 저장하지 않도록 관리 ID를 사용하여 키 자격 증명 모음에 액세스하도록 논리 앱 및 Azure Synapse 파이프라인을 구성합니다.
- Blob에 저장된 오디오 파일에는 중요한 고객 데이터가 포함될 수 있습니다. 여러 클라이언트가 이 솔루션을 사용하는 경우 이러한 파일에 대한 액세스를 제한해야 합니다. 스토리지 계정에서 계층 구조 네임스페이스를 사용하고 폴더 및 파일 수준 권한을 적용하여 필요한 Microsoft Entra 인스턴스로만 액세스를 제한합니다.
비용 최적화
비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 방법을 찾는 것입니다. 자세한 내용은 비용 최적화 핵심 요소 개요를 참조하세요.
이 아키텍처에 설명된 모든 Azure 서비스는 종량제 청구 옵션을 제공하므로 솔루션 비용은 선형으로 확장됩니다.
Azure Synapse는 서버리스 SQL 풀에 대한 옵션을 제공하므로 요청 시 데이터 웨어하우징 워크로드에 대한 컴퓨팅을 실행할 수 있습니다. Azure Synapse를 사용하여 다른 다운스트림 사용 사례를 처리하지 않는 경우 서버리스를 사용하여 비용을 절감하는 것이 좋습니다.
더 많은 비용 최적화 전략은 비용 최적화 핵심 요소 개요를 참조하세요.
여기에 제안된 서비스의 가격 책정은 Azure 가격 책정 계산기의 이 추정치를 참조하세요.
성능 효율성
성능 효율성은 사용자가 배치된 요구 사항을 효율적인 방식으로 충족하기 위해 워크로드의 크기를 조정할 수 있는 기능입니다. 자세한 내용은 성능 효율성 핵심 요소 개요를 참조하세요.
일괄 처리 음성 API는 대용량용으로 설계되었지만 다른 Azure AI 서비스 API에는 각 구독 계층에 대한 요청 제한이 있을 수 있습니다. 대용량 처리를 제한하지 않도록 이러한 API를 컨테이너화하는 것이 좋습니다. 컨테이너는 클라우드 또는 온-프레미스에서 배포의 유연성을 제공합니다. 컨테이너를 사용하여 새 버전 롤아웃의 부작용을 완화할 수도 있습니다. 자세한 내용은 Azure AI 서비스의 컨테이너 지원을 참조 하세요.
참가자
Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.
주요 작성자:
- Dhanashri Kshirsagar | 선임 콘텐츠 프로그램 관리자
- Brady Leavitt | Dir 전문가 GBB
- Kirpa Singh | 선임 소프트웨어 엔지니어
- Christina Skarpathiotaki | 클라우드 솔루션 설계자
다른 기여자:
- Mick Alberts | 테크니컬 라이터
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인하세요.
다음 단계
- 빠른 시작: 음성을 인식하고 텍스트로 변환
- 빠른 시작: 다중 테넌트 Azure Logic Apps 및 Azure Portal을 사용하여 통합 워크플로 만들기
- 빠른 시작: Language Studio 시작하기
- Azure Synapse Analytics의 Azure AI 서비스
- Speech Service란?
- Azure Logic Apps란?
- AI 언어란?
- Azure Synapse Analytics란?
- Language 서비스를 통해 텍스트에서 인사이트 추출
- Azure Synapse에서의 데이터 모델링, 쿼리 및 탐색