Что такое сводка документов и бесед?

Статья
12/19/2023

Внимание

Наш предварительный просмотр региона, Швеция Central, демонстрирует наши последние и постоянно развивающиеся методы тонкой настройки LLM на основе моделей GPT. Вы можете попробовать их с языковым ресурсом в Центральном регионе Швеции.

Сводка по беседам доступна только с помощью:

REST API
Python
C#

Сводка — это одна из функций, предлагаемых языком ИИ Azure, коллекцией алгоритмов машинного обучения и искусственного интеллекта в облаке для разработки интеллектуальных приложений, включающих письменный язык. Используйте эту статью для получения дополнительных сведений о данной функции и ее использовании в приложениях.

Хотя службы помечены как сводка документов и бесед, сводка документов принимает только блоки обычного текста, а сводка бесед принимает различные артефакты речи, чтобы узнать больше. Если вы хотите обработать беседу, но заботиться только о тексте, можно использовать сводку документов для этого сценария.

Формирование сводных данных по документу
Формирование сводных данных по беседе

Эта документация включает статьи следующих типов:

Краткие руководства — инструкции по началу работы и отправке запросов в службу.
Руководства — содержат инструкции для более специфического или специализированного использования службы.

Сводка документов использует методы обработки естественного языка для создания сводки для документов. Существует три поддерживаемых подхода API к автоматической суммации: извлечение, абстрактное и ориентированное на запросы.

Извлечение сводных сводных данных извлекает предложения, которые вместе представляют наиболее важные или релевантные сведения в исходном содержимом. Абстрактная сводка создает сводку с краткими, последовательными предложениями или словами, которые не извлекаются из исходного документа. Эти функции предназначены для сокращения содержимого, которое можно считать слишком длинным для чтения.

Поддержка собственных документов

Собственный документ ссылается на формат файла, используемый для создания исходного документа, например Microsoft Word (docx) или переносимого файла документа (pdf). Поддержка собственных документов устраняет необходимость предварительной обработки текста перед использованием возможностей ресурсов языка искусственного интеллекта Azure. В настоящее время поддержка собственных документов доступна для возможностей АбстрактнойSummarization и ExtractiveSummarization.

В настоящее время сводка документов поддерживает следующие собственные форматы документов:

Тип файла	Расширение файла	Описание
Текст	`.txt`	Неформатированный текстовый документ.
Adobe PDF	`.pdf`	Переносимый документ с форматированным документом.
Microsoft Word	`.docx`	Файл документа Microsoft Word.

Дополнительные сведения см. в разделе"Использование собственных документов для обработки языка"

Ключевые функции

Существуют аспекты суммирования документов, которые предоставляет этот API:

Извлечение сводных данных: создает сводку, извлекая в документе ключевые предложения.
- Несколько извлеченных предложений: эти предложения коллективно передают основную идею документа. Они исходные предложения, извлеченные из содержимого входного документа.
- Рейтинг ранжирования: Рейтинг ранжирования указывает, насколько релевантно предложение для основной темы документа. Функция формирования сводных данных по документу ранжирует извлеченные предложения, и вы можете настроить порядок возвращаемых результатов: в порядке появления в документе или в соответствии с рейтингом.
- Несколько возвращаемых предложений: определите максимальное количество возвращаемых предложений. Например, если вы запрашиваете три предложения сводных сводных суммарных сводных данных, возвращает три наиболее оцененных предложения.
- Сведения о положении в тексте: Начальное расположение и длина извлеченных предложений.
Абстрактная сводка: создает сводку, которая не использует те же слова, что и в документе, но фиксирует основную идею.
- Сводные тексты: абстрактная сводка возвращает сводку для каждого контекстного входного диапазона в документе. Длинный документ можно сегментировать, чтобы можно было вернуть несколько групп сводных текстов с помощью контекстного диапазона входных данных.
- Контекстный входной диапазон: диапазон входных данных в входном документе, который использовался для создания сводного текста.
Сводка, ориентированная на запрос: создает сводку на основе запроса

В качестве примера рассмотрим следующий абзац текста:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию. Как главный технический директор служб ИИ Azure, я работал с командой удивительных ученых и инженеров, чтобы превратить этот поиск в реальность. Я использую в работе уникальный подход, основанный на рассмотрении взаимосвязей между тремя аспектами когнитивной деятельности человека: одноязычный текст (X), звуковые или визуальные сигналы (Y) и многоязычное восприятие (Z). На пересечении всех трех, есть магия - то, что мы называем XYZ-code, как показано на рис. 1- совместное представление для создания более мощных ИИ, которые могут говорить, слышать, видеть и понимать людей лучше. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. Наша цель состоит в том, чтобы предварительно обученные модели могли совместно изучать представления для поддержки широкого спектра нижестоящих задач ИИ, как сегодня это делают люди. За последние пять лет мы достигаем человеческой производительности на тестах в распознавании речи беседы, машинном переводе, ответе на разговорные вопросы, распознавании машинного чтения и подпись изображения. Достижения по этим пяти направлениям дали нам твердую уверенность в возможности реализации более амбициозных задач, которые помогли бы нам совершить настоящий прорыв в области ИИ за счет мультисенсорного многоязычного обучения, которое по своей сути ближе к тому, как учатся и воспринимают информацию люди. Я полагаю, что этот совместный код XYZ может стать фундаментом для такого рывка при наличии соответствующих внешних источников знаний в нижестоящих задачах ИИ".

Запрос API сводных данных документа обрабатывается при получении запроса путем создания задания для серверной части API. Если задание выполнено успешно, возвращается результат API. Выходные данные доступны для получения в течение 24 часов. По прошествии этого времени выходные данные очищаются. Благодаря поддержке многоязычных и эмодзи ответ может содержать смещения текста. Дополнительные сведения см. в статье об обработке смещения.

Если мы используем приведенный выше пример, API может вернуть следующие сводные предложения:

Извлечение сводных данных:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию".
"Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки".
"Цель состоит в том, чтобы иметь предварительно обученные модели, которые могут совместно изучать представления для поддержки широкого спектра подчиненных задач ИИ, много в том, как люди делают сегодня".

Абстрактная сводка:

"Корпорация Майкрософт принимает более целостный, ориентированный на человека подход к обучению и пониманию. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. За последние пять лет мы достигли человеческой производительности на тестах в распознавании речи беседы".

Внимание

Сводка бесед доступна только на английском языке.

Эта документация включает статьи следующих типов:

Краткие руководства — инструкции по началу работы и отправке запросов в службу.
Руководства — содержат инструкции для более специфического или специализированного использования службы.

Ключевые функции

Сводка бесед поддерживает следующие функции:

Сводка вопросов и решений: конкретная функция центра обработки вызовов, которая содержит сводку проблем и решений в беседах между агентами обслуживания клиентов и клиентами.
Сводка заголовка главы: сегментирует беседу в главы на основе тем, рассмотренных в беседе, и предоставляет предлагаемые заголовки глав входной беседы.
Краткое описание. Сводка беседы в кратком абзаце.
Сводка по повествованию: создает заметки о звонках, заметках о собраниях или сводках чата для входной беседы.
Дальнейшие задачи: содержит список дальнейших задач, описанных в беседе ввода.

Использование суммирования проблем и разрешения

Если существуют аспекты проблемы и решения, такие как:
- причина для обращения в чат или звонка (проблема);
- метод устранения этой проблемы.
Если нужна только сводка по смежной информации о проблемах и решениях.
Если в беседе есть два участника и вам нужны сводные данные о том, что они оба говорили.

Для примера давайте рассмотрим следующий пример беседы:

Агент: "Привет, вы беседуете с Рене. Как я могу помочь вам?

Клиент: "Привет, я пытался настроить wi-fi подключение для Smart Brew 300 эспрессо-машины, но это не работало".

Агент: "Мне жаль, что вы услышите это. Давайте посмотрим, что мы можем сделать для устранения этой проблемы. Можете ли вы нажать кнопку подключения к Wi-Fi, удерживайте в течение 3 секунд, а затем сообщите мне, если свет питания медленно мигает?

Клиент: "Да, я нажал кнопку подключения Wi-Fi, и теперь индикатор питания медленно мигает."

Агент: "Отлично, спасибо! Теперь проверьте приложение Contoso Coffee. Есть ли там предложение подключиться к кофеварке?"

Клиент: "Нет. Там ничего не изменилось".

Агент: "Я вижу. Спасибо. Давайте попробуем, если сброс фабрики может решить эту проблему. Можете ли вы нажать и удерживать центральную кнопку в течение 5 секунд, чтобы начать сброс фабрики".

Клиент: "Я пытался сбросить завод и следовать приведенным выше шагам снова, но он все еще не работал".

Агент: "Я очень жаль услышать это. Позвольте мне узнать, есть ли еще один способ устранить проблему. Пожалуйста, удерживайте на минуту".

Функция суммирования бесед упростит текст следующим образом:

Пример сводки	Формат	Аспект беседы
Клиент хочет использовать Wi-Fi-подключение на устройстве Smart Brew 300. Но не получилось.	Одно или два предложения	проблема
Проверил, мигает ли индикатор питания. Проверил приложение Contoso Coffee. Не было запроса. Попытался выполнить сброс до заводских настроек.	Одно или несколько предложений, созданных из нескольких строк расшифровки.	разрешение

Начало работы с формированием сводных данных

Чтобы использовать сводку, вы отправляете для анализа и обрабатываете выходные данные API в приложении. Анализ выполняется как есть, без добавления настройки модели, используемой для данных. Существует два способа использования функции формирования сводных данных:

Формирование сводных данных по документу
Формирование сводных данных по беседе

Вариант разработки	Description
Студия службы "Язык"	Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.
REST API или клиентская библиотека (пакет SDK для Azure)	Интеграция сводки документов в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Вариант разработки

Description

Студия службы "Язык"

Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.

REST API или клиентская библиотека (пакет SDK для Azure)

Интеграция сводки документов в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Вариант разработки	Description	Ссылки.
REST API	Интеграция сводных данных о беседе в приложения с помощью REST API.	Краткое руководство: применение функции формирования сводных данных по беседе

Настраиваемая сводка позволяет пользователям создавать пользовательские модели искусственного интеллекта для суммирования неструктурированного текста, например контрактов или романов. Создавая проект пользовательской суммирования, разработчики могут итеративно пометить данные, обучить, оценить и повысить производительность модели, прежде чем сделать его доступным для использования. Качество данных с метками значительно влияет на производительность модели. Чтобы упростить создание и настройку модели, служба предлагает настраиваемый веб-портал, доступ к которому можно получить с помощью Language Studio. Вы можете легко приступить к работе со службой, выполнив действия, описанные в этом кратком руководстве.

Требования к входным данным и ограничения службы

Формирование сводных данных по документу
Формирование сводных данных по беседе

Сводка принимает текст для анализа. Дополнительные сведения см . в руководстве по ограничениям данных и служб.
Сводка работает с различными письменными языками. Дополнительные сведения см. в разделе Поддержка языков.

Справочная документация и примеры кода

При использовании сводки документов в приложениях см. следующую справочную документацию и примеры для языка искусственного интеллекта Azure:

Вариант разработки и язык	Справочная документация	Примеры
C#	Документация по C#	Примеры C#
Java	Документация по Java	Примеры для Java
JavaScript	Документация по работе с JavaScript.	Примеры JavaScript
Python	Документация по Python.	Примеры для Python

Ответственное применение ИИ

Система ИИ включает не только технологию, но и людей, которые используют ее, людей, пострадавших от нее, и среды развертывания. Ознакомьтесь с примечанием о прозрачности для формирования сводных данных, чтобы больше узнать об ответственном использовании и развертывании решений искусственного интеллекта в своих системах. Дополнительные сведения см. в следующих статьях:

Что такое сводка документов и бесед?

Поддержка собственных документов

Ключевые функции

Начало работы с формированием сводных данных

Требования к входным данным и ограничения службы

Справочная документация и примеры кода

Ответственное применение ИИ

Дополнительные ресурсы