Что такое голосовой помощник?

Статья
01/22/2024

Используя голосовых помощников со службой "Речь", разработчики могут создать естественные и привычные для человека разговорные функции для своих приложений и возможностей. Служба голосовой помощник обеспечивает быстрое, надежное взаимодействие между устройством и реализацией помощник.

Выбор решения помощника

Первым этапом создания голосового помощника является принятие решения о том, что вы от него хотите. Служба "Речь" предоставляет несколько дополнительных решений для создания взаимодействий с помощником. Возможно, вы хотите, чтобы ваше приложение поддерживало открытый разговор с фразами, такими как "Мне нужно пойти в Сиэтл" или "Какой вид пиццы можно заказать?" Для гибкости и гибкости вы можете добавлять голосовые и голосовые возможности бота с помощью Azure AI Служба Bot с каналом "Речь Direct Line".

Если вы еще не уверены, что вы хотите сделать при помощи помощника, мы рекомендуем использовать Direct Line Speech как оптимальный вариант. Оно обеспечивает интеграцию с широким набором инструментов и средств разработки, таких как Виртуальный помощник, шаблон Enterprise и служба QnA Maker, для создания общих шаблонов и использования существующих источников знаний.

Эталонная архитектура для создания голосового помощника с помощью пакета SDK службы "Речь"

Conceptual diagram of the voice assistant orchestration service flow.

Основные возможности

Независимо от того, выбираете ли вы прямое распознавание речи или другое решение для создания взаимодействия помощник, вы можете использовать широкий набор функций настройки для настройки помощник вашей торговой марки, продукта и личности.

Категория	Функции
Пользовательские ключевые слова	Пользователи могут начать диалог с помощниками с помощью пользовательского ключевого слова, например "Эй Contoso". Приложение делает это с помощью настраиваемого механизма ключевых слов в пакете SDK службы "Речь", который можно настроить, перейдя в Начало работы с пользовательскими ключевыми словами. Голосовые помощники могут использовать проверку ключевых слов на стороне службы для повышения точности активации ключевых слов (в отличие от использования только устройства).
Речь к тексту	Голосовые помощник преобразуют звук в распознанный текст в распознанный текст с помощью речи в текст из службы "Речь". Этот текст расшифровывается как для реализованного решения помощника, так и для клиентского приложения.
Текст в речь	Текстовые ответы от помощник синтезируются с помощью текста в речь из службы "Речь". Затем этот синтез становится доступным для клиентского приложения в виде аудиопотока. Корпорация Майкрософт предлагает возможность создавать собственный собственный, высококачественный нейронный текст для речи (Нейронный TTS), который дает голос вашему бренду.

Начало работы с голосовыми помощниками

Мы предлагаем следующую краткое руководство, предназначенную для запуска кода менее чем за 10 минут: краткое руководство. Создание пользовательской голосовой помощник с помощью direct Line Speech

Пример кода и учебники

Пример кода для создания голосового помощника доступен на сайте GitHub. Примеры охватывают клиентское приложение для подключения к помощнику на нескольких популярных языках программирования.

Пользовательская настройка

Речевые помощники, созданные с помощью речевой службы, могут использовать полный спектр вариантов настройки.

Примечание.

Параметры настройки зависят от языка или языкового стандарта. Дополнительные сведения см. в разделе Поддерживаемые языки.