Краткое руководство по созданию пользовательского ключевого слова — служба "Речь" - Azure AI services

Справочная документация | Пакет (NuGet) | Дополнительные примеры в GitHub

В этом кратком руководстве вы ознакомитесь с основными сведениями о работе с пользовательскими ключевыми словами. Ключевое слово — это слово или короткая фраза, которая позволяет активировать ваш продукт с помощью голоса. Сначала необходимо создать модели ключевых слов в Speech Studio. Затем необходимо экспортировать файл модели, который будет использоваться пакетом SDK службы "Речь" в ваших приложениях.

Необходимые компоненты

Подписка Azure — создайте бесплатную учетную запись.
Создайте ресурс службы "Речь" в портал Azure.
Ключ ресурса службы "Речь" и регион. После развертывания ресурса службы "Речь" выберите Перейти к ресурсу для просмотра ключей и управления ими. Дополнительные сведения о ресурсах служб ИИ Azure см. в разделе "Получение ключей" для ресурса.

Создайте ключевое слово в Speech Studio

Прежде чем вы сможете использовать собственное ключевое слово, вам необходимо создать такое ключевое слово на странице Пользовательское ключевое слово в Speech Studio. После ввода ключевого слова создается файл .table, который можно использовать с пакетом SDK для распознавания речи.

Важно!

Пользовательские модели ключевых слов и итоговые файлы .table можно создавать только в Speech Studio. Нельзя создавать пользовательские ключевые слова из пакета SDK или с помощью вызовов REST.

Перейдите в Speech Studio и войдите в систему. Если у вас нет подписки на службу "Речь", перейдите к разделу Создание службы "Речь".
На странице Пользовательское ключевое слово выберите Создать проект.
Введите Имя, Описание и Язык для проекта пользовательского ключевого слова. Для каждого проекта можно выбрать только один язык. Сейчас поддерживаются следующие языки: английский (США) и китайский (мандаринский диалект, упрощенное письмо).
Выберите имя проекта из списка.
Чтобы создать пользовательское ключевое слово для виртуального помощника, выберите Создать модель.
Введите Имя модели, Описание и Ключевое слово по вашему выбору, а затем нажмите кнопку Далее. Ознакомьтесь с рекомендациями по выбору эффективного ключевого слова.
Портал создает варианты произношения для вашего ключевого слова. Прослушайте все варианты с помощью кнопки воспроизведения и снимите флажки для неправильных вариантов произношения. Выберите все варианты, которые соответствуют произношению ключевого слова пользователями, а затем нажмите кнопку Далее, чтобы начать создание модели ключевого слова.
Выберите тип модели, а затем нажмите Создать. Список регионов, поддерживающих Расширенный тип модели, можно просмотреть в документации по поддержке регионов для распознавания ключевых слов.
Для создания модели может потребоваться до 30 минут. Список ключевое слово изменяется с обработки на "Успешно", когда модель завершена.
В свертываемом меню слева выберите Настроить, чтобы настроить и скачать модель. Скачанный файл является архивом .zip. Извлеките архив, и вы увидите файл с расширением .table. Вы будете использовать файл .table с пакетом SDK, поэтому обязательно запишите путь к этому файлу.

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Сначала загрузите файл модели ключевых слов с помощью статической функции FromFile(), которая возвращает KeywordRecognitionModel. Используйте путь к файлу .table, скачанному из Speech Studio. Кроме того, вы создаете AudioConfig с помощью микрофона по умолчанию, затем создаете новый экземпляр KeywordRecognizer с помощью конфигурации звука.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

Важно!

Если вы предпочитаете тестировать модель ключевое слово непосредственно с помощью звуковых примеров с помощью AudioConfig.fromStreamInput() метода, убедитесь, что вы используете примеры, имеющие по крайней мере 1,5 секунд молчания до первого ключевое слово. Это позволяет механизму распознавания ключевых слов инициализировать и получить состояние прослушивания перед обнаружением первого ключевое слово.

Затем выполняется распознавание ключевых слов с использованием одного вызова RecognizeOnceAsync() путем передачи объекта модели. Этот метод запускает сеанс распознавания ключевое слово, который длится до тех пор, пока ключевое слово не распознается. Таким образом, обычно этот шаблон конструктора используется в многопоточных приложениях или в случаях использования, когда вы можете ожидать пробуждения на неопределенный срок.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Примечание.

В этом примере используется распознавание ключевого слова local, так как для контекста проверки подлинности не требуется объект SpeechConfig и не выполняется обращение к серверной части. Однако можно выполнить как распознавание ключевых слов, так и проверку, используя прямое подключение к серверной части.

Непрерывное распознавание

Другие классы в пакете SDK для службы "Речь" поддерживают непрерывное распознавание (для распознавания речи и намерений) и распознавание ключевых слов. Пакет SDK позволяет использовать тот же код, который обычно используется для непрерывного распознавания, с возможностью ссылаться на .table файл для модели ключевое слово.

Для преобразования речи в текст выполните тот же шаблон конструктора, который показан в руководстве по распознаванию речи, чтобы настроить непрерывное распознавание. Затем замените вызов recognizer.StartContinuousRecognitionAsync() на recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel) и передайте объект KeywordRecognitionModel. Чтобы отключить постоянное распознавание с помощью распознавания ключевых слов, используйте recognizer.StopKeywordRecognitionAsync() вместо recognizer.StopContinuousRecognitionAsync().

При распознавании намерения используется идентичный шаблон с функциями StartKeywordRecognitionAsync и StopKeywordRecognitionAsync.

Справочная документация | Пакет (NuGet) | Дополнительные примеры в GitHub

Пакет SDK службы "Речь" для C++ поддерживает распознавание ключевых слов, но мы еще не включили в эту статью руководство по использованию этого пакета SDK. Выберите другой язык программирования, чтобы приступить к работе и ознакомиться с основными понятиями, или обратитесь к справочнику и примерам для языка C++, ссылки на которые приведены в начале этой статьи.

автор: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 1/18/2024 ms.author: eur

Подписка Azure — создайте бесплатную учетную запись.
Создайте ресурс службы "Речь" в портал Azure.
Ключ ресурса службы "Речь" и регион. После развертывания ресурса службы "Речь" выберите Перейти к ресурсу для просмотра ключей и управления ими. Дополнительные сведения о ресурсах служб ИИ Azure см. в разделе "Получение ключей" для ресурса.

Создайте ключевое слово в Speech Studio

Прежде чем вы сможете использовать собственное ключевое слово, вам необходимо создать такое ключевое слово на странице Пользовательское ключевое слово в Speech Studio. После ввода ключевого слова создается файл .table, который можно использовать с пакетом SDK для распознавания речи.

Важно!

Пользовательские модели ключевых слов и итоговые файлы .table можно создавать только в Speech Studio. Нельзя создавать пользовательские ключевые слова из пакета SDK или с помощью вызовов REST.

Перейдите в Speech Studio и войдите в систему. Если у вас нет подписки на службу "Речь", перейдите к разделу Создание службы "Речь".
На странице Пользовательское ключевое слово выберите Создать проект.
Введите Имя, Описание и Язык для проекта пользовательского ключевого слова. Для каждого проекта можно выбрать только один язык. Сейчас поддерживаются следующие языки: английский (США) и китайский (мандаринский диалект, упрощенное письмо).
Выберите имя проекта из списка.
Чтобы создать пользовательское ключевое слово для виртуального помощника, выберите Создать модель.
Введите Имя модели, Описание и Ключевое слово по вашему выбору, а затем нажмите кнопку Далее. Ознакомьтесь с рекомендациями по выбору эффективного ключевого слова.
Портал создает варианты произношения для вашего ключевого слова. Прослушайте все варианты с помощью кнопки воспроизведения и снимите флажки для неправильных вариантов произношения. Выберите все варианты, которые соответствуют произношению ключевого слова пользователями, а затем нажмите кнопку Далее, чтобы начать создание модели ключевого слова.
Выберите тип модели, а затем нажмите Создать. Список регионов, поддерживающих Расширенный тип модели, можно просмотреть в документации по поддержке регионов для распознавания ключевых слов.
Для создания модели может потребоваться до 30 минут. Список ключевое слово изменяется с обработки на "Успешно", когда модель завершена.
В свертываемом меню слева выберите Настроить, чтобы настроить и скачать модель. Скачанный файл является архивом .zip. Извлеките архив, и вы увидите файл с расширением .table. Вы будете использовать файл .table с пакетом SDK, поэтому обязательно запишите путь к этому файлу.

Используйте модель ключевых слов с пакетом SDK для распознавания речи

См. справочную документацию по использованию пользовательской модели ключевых слов с пакетом SDK Go.

Справочная документация | Дополнительные примеры в GitHub

Пакет SDK службы "Речь" для Java поддерживает распознавание ключевых слов, но мы еще не включили в эту статью руководство по использованию этого пакета SDK. Выберите другой язык программирования, чтобы приступить к работе и ознакомиться с основными понятиями, или обратитесь к справочнику и примерам для языка Java, ссылки на которые приведены в начале этой статьи.

Справочная документация | Пакет (npm) | Дополнительные примеры в GitHub | Исходный код библиотеки

Пакет SDK службы "Речь" для JavaScript не поддерживает распознавание ключевое слово. Выберите другой язык программирования или обратитесь к справочнику и примерам для языка JavaScript, ссылки на которые приведены в начале этой статьи.

Справочная документация | Пакет (скачивание) | Дополнительные примеры в GitHub

В этом кратком руководстве вы ознакомитесь с основными сведениями о работе с пользовательскими ключевыми словами. Ключевое слово — это слово или короткая фраза, которая позволяет активировать ваш продукт с помощью голоса. Сначала необходимо создать модели ключевых слов в Speech Studio. Затем необходимо экспортировать файл модели, который будет использоваться пакетом SDK службы "Речь" в ваших приложениях.

Необходимые компоненты

Подписка Azure — создайте бесплатную учетную запись.
Создайте ресурс службы "Речь" в портал Azure.
Ключ ресурса службы "Речь" и регион. После развертывания ресурса службы "Речь" выберите Перейти к ресурсу для просмотра ключей и управления ими. Дополнительные сведения о ресурсах служб ИИ Azure см. в разделе "Получение ключей" для ресурса.

Создайте ключевое слово в Speech Studio

Прежде чем вы сможете использовать собственное ключевое слово, вам необходимо создать такое ключевое слово на странице Пользовательское ключевое слово в Speech Studio. После ввода ключевого слова создается файл .table, который можно использовать с пакетом SDK для распознавания речи.

Важно!

Пользовательские модели ключевых слов и итоговые файлы .table можно создавать только в Speech Studio. Нельзя создавать пользовательские ключевые слова из пакета SDK или с помощью вызовов REST.

Перейдите в Speech Studio и войдите в систему. Если у вас нет подписки на службу "Речь", перейдите к разделу Создание службы "Речь".
На странице Пользовательское ключевое слово выберите Создать проект.
Введите Имя, Описание и Язык для проекта пользовательского ключевого слова. Для каждого проекта можно выбрать только один язык. Сейчас поддерживаются следующие языки: английский (США) и китайский (мандаринский диалект, упрощенное письмо).
Выберите имя проекта из списка.
Чтобы создать пользовательское ключевое слово для виртуального помощника, выберите Создать модель.
Введите Имя модели, Описание и Ключевое слово по вашему выбору, а затем нажмите кнопку Далее. Ознакомьтесь с рекомендациями по выбору эффективного ключевого слова.
Портал создает варианты произношения для вашего ключевого слова. Прослушайте все варианты с помощью кнопки воспроизведения и снимите флажки для неправильных вариантов произношения. Выберите все варианты, которые соответствуют произношению ключевого слова пользователями, а затем нажмите кнопку Далее, чтобы начать создание модели ключевого слова.
Выберите тип модели, а затем нажмите Создать. Список регионов, поддерживающих Расширенный тип модели, можно просмотреть в документации по поддержке регионов для распознавания ключевых слов.
Для создания модели может потребоваться до 30 минут. Список ключевое слово изменяется с обработки на "Успешно", когда модель завершена.
В свертываемом меню слева выберите Настроить, чтобы настроить и скачать модель. Скачанный файл является архивом .zip. Извлеките архив, и вы увидите файл с расширением .table. Вы будете использовать файл .table с пакетом SDK, поэтому обязательно запишите путь к этому файлу.

Используйте модель ключевых слов с пакетом SDK для распознавания речи

См. пример на сайте GitHub для использования пользовательской модели ключевых слов с пакетом SDK для Objective C.

Справочная документация | Пакет (скачивание) | Дополнительные примеры в GitHub

В этом кратком руководстве вы ознакомитесь с основными сведениями о работе с пользовательскими ключевыми словами. Ключевое слово — это слово или короткая фраза, которая позволяет активировать ваш продукт с помощью голоса. Сначала необходимо создать модели ключевых слов в Speech Studio. Затем необходимо экспортировать файл модели, который будет использоваться пакетом SDK службы "Речь" в ваших приложениях.

Необходимые компоненты

Подписка Azure — создайте бесплатную учетную запись.
Создайте ресурс службы "Речь" в портал Azure.
Ключ ресурса службы "Речь" и регион. После развертывания ресурса службы "Речь" выберите Перейти к ресурсу для просмотра ключей и управления ими. Дополнительные сведения о ресурсах служб ИИ Azure см. в разделе "Получение ключей" для ресурса.

Создайте ключевое слово в Speech Studio

Прежде чем вы сможете использовать собственное ключевое слово, вам необходимо создать такое ключевое слово на странице Пользовательское ключевое слово в Speech Studio. После ввода ключевого слова создается файл .table, который можно использовать с пакетом SDK для распознавания речи.

Важно!

Пользовательские модели ключевых слов и итоговые файлы .table можно создавать только в Speech Studio. Нельзя создавать пользовательские ключевые слова из пакета SDK или с помощью вызовов REST.

Перейдите в Speech Studio и войдите в систему. Если у вас нет подписки на службу "Речь", перейдите к разделу Создание службы "Речь".
На странице Пользовательское ключевое слово выберите Создать проект.
Введите Имя, Описание и Язык для проекта пользовательского ключевого слова. Для каждого проекта можно выбрать только один язык. Сейчас поддерживаются следующие языки: английский (США) и китайский (мандаринский диалект, упрощенное письмо).
Выберите имя проекта из списка.
Чтобы создать пользовательское ключевое слово для виртуального помощника, выберите Создать модель.
Введите Имя модели, Описание и Ключевое слово по вашему выбору, а затем нажмите кнопку Далее. Ознакомьтесь с рекомендациями по выбору эффективного ключевого слова.
Портал создает варианты произношения для вашего ключевого слова. Прослушайте все варианты с помощью кнопки воспроизведения и снимите флажки для неправильных вариантов произношения. Выберите все варианты, которые соответствуют произношению ключевого слова пользователями, а затем нажмите кнопку Далее, чтобы начать создание модели ключевого слова.
Выберите тип модели, а затем нажмите Создать. Список регионов, поддерживающих Расширенный тип модели, можно просмотреть в документации по поддержке регионов для распознавания ключевых слов.
Для создания модели может потребоваться до 30 минут. Список ключевое слово изменяется с обработки на "Успешно", когда модель завершена.
В свертываемом меню слева выберите Настроить, чтобы настроить и скачать модель. Скачанный файл является архивом .zip. Извлеките архив, и вы увидите файл с расширением .table. Вы будете использовать файл .table с пакетом SDK, поэтому обязательно запишите путь к этому файлу.

Используйте модель ключевых слов с пакетом SDK для распознавания речи

См. пример на сайте GitHub для использования пользовательской модели ключевых слов с пакетом SDK для Objective C. Хотя в настоящее время у нас нет примера Swift для четности, концепции аналогичны.

Справочная документация | Пакет (PyPi) | Дополнительные примеры в GitHub

В этом кратком руководстве вы ознакомитесь с основными сведениями о работе с пользовательскими ключевыми словами. Ключевое слово — это слово или короткая фраза, которая позволяет активировать ваш продукт с помощью голоса. Сначала необходимо создать модели ключевых слов в Speech Studio. Затем необходимо экспортировать файл модели, который будет использоваться пакетом SDK службы "Речь" в ваших приложениях.

Необходимые компоненты

Подписка Azure — создайте бесплатную учетную запись.
Создайте ресурс службы "Речь" в портал Azure.
Ключ ресурса службы "Речь" и регион. После развертывания ресурса службы "Речь" выберите Перейти к ресурсу для просмотра ключей и управления ими. Дополнительные сведения о ресурсах служб ИИ Azure см. в разделе "Получение ключей" для ресурса.

Создайте ключевое слово в Speech Studio

Прежде чем вы сможете использовать собственное ключевое слово, вам необходимо создать такое ключевое слово на странице Пользовательское ключевое слово в Speech Studio. После ввода ключевого слова создается файл .table, который можно использовать с пакетом SDK для распознавания речи.

Важно!

Пользовательские модели ключевых слов и итоговые файлы .table можно создавать только в Speech Studio. Нельзя создавать пользовательские ключевые слова из пакета SDK или с помощью вызовов REST.

Перейдите в Speech Studio и войдите в систему. Если у вас нет подписки на службу "Речь", перейдите к разделу Создание службы "Речь".
На странице Пользовательское ключевое слово выберите Создать проект.
Введите Имя, Описание и Язык для проекта пользовательского ключевого слова. Для каждого проекта можно выбрать только один язык. Сейчас поддерживаются следующие языки: английский (США) и китайский (мандаринский диалект, упрощенное письмо).
Выберите имя проекта из списка.
Чтобы создать пользовательское ключевое слово для виртуального помощника, выберите Создать модель.
Введите Имя модели, Описание и Ключевое слово по вашему выбору, а затем нажмите кнопку Далее. Ознакомьтесь с рекомендациями по выбору эффективного ключевого слова.
Портал создает варианты произношения для вашего ключевого слова. Прослушайте все варианты с помощью кнопки воспроизведения и снимите флажки для неправильных вариантов произношения. Выберите все варианты, которые соответствуют произношению ключевого слова пользователями, а затем нажмите кнопку Далее, чтобы начать создание модели ключевого слова.
Выберите тип модели, а затем нажмите Создать. Список регионов, поддерживающих Расширенный тип модели, можно просмотреть в документации по поддержке регионов для распознавания ключевых слов.
Для создания модели может потребоваться до 30 минут. Список ключевое слово изменяется с обработки на "Успешно", когда модель завершена.
В свертываемом меню слева выберите Настроить, чтобы настроить и скачать модель. Скачанный файл является архивом .zip. Извлеките архив, и вы увидите файл с расширением .table. Вы будете использовать файл .table с пакетом SDK, поэтому обязательно запишите путь к этому файлу.

Используйте модель ключевых слов с пакетом SDK для распознавания речи

См. пример на сайте GitHub для использования пользовательской модели ключевых слов с пакетом SDK для Python.

Преобразование речи в текстовый REST API ссылки на | речь на текстовый REST API для краткой ссылки на звуковые ссылки | на Дополнительные примеры на GitHub

REST API преобразования речи в текст не поддерживает распознавание ключевое слово. Выберите другой язык программирования или обратитесь к справочнику и примерам, ссылки на которые приведены в начале этой статьи.

CLI службы "Речь" поддерживает распознавание ключевых слов, но мы еще не включили в эту статью руководство по использованию CLI. Выберите другой язык программирования, чтобы приступить к работе и ознакомиться с основными понятиями.

Краткое руководство. Создание пользовательского ключевого слова

Необходимые компоненты

Создайте ключевое слово в Speech Studio

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Непрерывное распознавание

автор: eric-urban ms.service: azure-ai-speech ms.topic: include ms.date: 1/18/2024 ms.author: eur

Создайте ключевое слово в Speech Studio

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Необходимые компоненты

Создайте ключевое слово в Speech Studio

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Необходимые компоненты

Создайте ключевое слово в Speech Studio

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Необходимые компоненты

Создайте ключевое слово в Speech Studio

Используйте модель ключевых слов с пакетом SDK для распознавания речи

Следующие шаги

Дополнительные ресурсы