Что такое сводка документов и бесед?

Внимание

Наш предварительный просмотр региона, Швеция Central, демонстрирует наши последние и постоянно развивающиеся методы тонкой настройки LLM на основе моделей GPT. Вы можете попробовать их с языковым ресурсом в Центральном регионе Швеции.

Сводка по беседам доступна только с помощью:

  • REST API
  • Python
  • C#

Сводка — это одна из функций, предлагаемых языком ИИ Azure, коллекцией алгоритмов машинного обучения и искусственного интеллекта в облаке для разработки интеллектуальных приложений, включающих письменный язык. Используйте эту статью для получения дополнительных сведений о данной функции и ее использовании в приложениях.

Хотя службы помечены как сводка документов и бесед, сводка документов принимает только блоки обычного текста, а сводка бесед принимает различные артефакты речи, чтобы узнать больше. Если вы хотите обработать беседу, но заботиться только о тексте, можно использовать сводку документов для этого сценария.

Эта документация включает статьи следующих типов:

  • Краткие руководства — инструкции по началу работы и отправке запросов в службу.
  • Руководства — содержат инструкции для более специфического или специализированного использования службы.

Сводка документов использует методы обработки естественного языка для создания сводки для документов. Существует три поддерживаемых подхода API к автоматической суммации: извлечение, абстрактное и ориентированное на запросы.

Извлечение сводных сводных данных извлекает предложения, которые вместе представляют наиболее важные или релевантные сведения в исходном содержимом. Абстрактная сводка создает сводку с краткими, последовательными предложениями или словами, которые не извлекаются из исходного документа. Эти функции предназначены для сокращения содержимого, которое можно считать слишком длинным для чтения.

Поддержка собственных документов

Собственный документ ссылается на формат файла, используемый для создания исходного документа, например Microsoft Word (docx) или переносимого файла документа (pdf). Поддержка собственных документов устраняет необходимость предварительной обработки текста перед использованием возможностей ресурсов языка искусственного интеллекта Azure. В настоящее время поддержка собственных документов доступна для возможностей АбстрактнойSummarization и ExtractiveSummarization.

В настоящее время сводка документов поддерживает следующие собственные форматы документов:

Тип файла Расширение файла Описание
Текст .txt Неформатированный текстовый документ.
Adobe PDF .pdf Переносимый документ с форматированным документом.
Microsoft Word .docx Файл документа Microsoft Word.

Дополнительные сведения см. в разделе"Использование собственных документов для обработки языка"

Ключевые функции

Существуют аспекты суммирования документов, которые предоставляет этот API:

  • Извлечение сводных данных: создает сводку, извлекая в документе ключевые предложения.

    • Несколько извлеченных предложений: эти предложения коллективно передают основную идею документа. Они исходные предложения, извлеченные из содержимого входного документа.
    • Рейтинг ранжирования: Рейтинг ранжирования указывает, насколько релевантно предложение для основной темы документа. Функция формирования сводных данных по документу ранжирует извлеченные предложения, и вы можете настроить порядок возвращаемых результатов: в порядке появления в документе или в соответствии с рейтингом.
    • Несколько возвращаемых предложений: определите максимальное количество возвращаемых предложений. Например, если вы запрашиваете три предложения сводных сводных суммарных сводных данных, возвращает три наиболее оцененных предложения.
    • Сведения о положении в тексте: Начальное расположение и длина извлеченных предложений.
  • Абстрактная сводка: создает сводку, которая не использует те же слова, что и в документе, но фиксирует основную идею.

    • Сводные тексты: абстрактная сводка возвращает сводку для каждого контекстного входного диапазона в документе. Длинный документ можно сегментировать, чтобы можно было вернуть несколько групп сводных текстов с помощью контекстного диапазона входных данных.
    • Контекстный входной диапазон: диапазон входных данных в входном документе, который использовался для создания сводного текста.
  • Сводка, ориентированная на запрос: создает сводку на основе запроса

В качестве примера рассмотрим следующий абзац текста:

"В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию. Как главный технический директор служб ИИ Azure, я работал с командой удивительных ученых и инженеров, чтобы превратить этот поиск в реальность. Я использую в работе уникальный подход, основанный на рассмотрении взаимосвязей между тремя аспектами когнитивной деятельности человека: одноязычный текст (X), звуковые или визуальные сигналы (Y) и многоязычное восприятие (Z). На пересечении всех трех, есть магия - то, что мы называем XYZ-code, как показано на рис. 1- совместное представление для создания более мощных ИИ, которые могут говорить, слышать, видеть и понимать людей лучше. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. Наша цель состоит в том, чтобы предварительно обученные модели могли совместно изучать представления для поддержки широкого спектра нижестоящих задач ИИ, как сегодня это делают люди. За последние пять лет мы достигаем человеческой производительности на тестах в распознавании речи беседы, машинном переводе, ответе на разговорные вопросы, распознавании машинного чтения и подпись изображения. Достижения по этим пяти направлениям дали нам твердую уверенность в возможности реализации более амбициозных задач, которые помогли бы нам совершить настоящий прорыв в области ИИ за счет мультисенсорного многоязычного обучения, которое по своей сути ближе к тому, как учатся и воспринимают информацию люди. Я полагаю, что этот совместный код XYZ может стать фундаментом для такого рывка при наличии соответствующих внешних источников знаний в нижестоящих задачах ИИ".

Запрос API сводных данных документа обрабатывается при получении запроса путем создания задания для серверной части API. Если задание выполнено успешно, возвращается результат API. Выходные данные доступны для получения в течение 24 часов. По прошествии этого времени выходные данные очищаются. Благодаря поддержке многоязычных и эмодзи ответ может содержать смещения текста. Дополнительные сведения см. в статье об обработке смещения.

Если мы используем приведенный выше пример, API может вернуть следующие сводные предложения:

Извлечение сводных данных:

  • "В Корпорации Майкрософт мы работаем над продвижением искусственного интеллекта за рамки существующих методов, принимая более целостный, ориентированный на человека подход к обучению и пониманию".
  • "Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки".
  • "Цель состоит в том, чтобы иметь предварительно обученные модели, которые могут совместно изучать представления для поддержки широкого спектра подчиненных задач ИИ, много в том, как люди делают сегодня".

Абстрактная сводка:

  • "Корпорация Майкрософт принимает более целостный, ориентированный на человека подход к обучению и пониманию. Мы считаем, что XYZ-code позволяет нам реализовать наше долгосрочное видение: перекрестное обучение, охватывающие модальности и языки. За последние пять лет мы достигли человеческой производительности на тестах в распознавании речи беседы".

Начало работы с формированием сводных данных

Чтобы использовать сводку, вы отправляете для анализа и обрабатываете выходные данные API в приложении. Анализ выполняется как есть, без добавления настройки модели, используемой для данных. Существует два способа использования функции формирования сводных данных:

Вариант разработки Description
Студия службы "Язык" Language Studio — это веб-платформа, которая позволяет попробовать связывание сущностей с текстовыми примерами без учетной записи Azure и собственных данных при регистрации. Дополнительные сведения см. в кратком руководстве по веб-сайту Или языковой студии Language Studio.
REST API или клиентская библиотека (пакет SDK для Azure) Интеграция сводки документов в приложения с помощью REST API или клиентской библиотеки, доступной на различных языках. Дополнительные сведения см. в кратком руководстве по сводных данных.

Требования к входным данным и ограничения службы

Справочная документация и примеры кода

При использовании сводки документов в приложениях см. следующую справочную документацию и примеры для языка искусственного интеллекта Azure:

Вариант разработки и язык Справочная документация Примеры
C# Документация по C# Примеры C#
Java Документация по Java Примеры для Java
JavaScript Документация по работе с JavaScript. Примеры JavaScript
Python Документация по Python. Примеры для Python

Ответственное применение ИИ

Система ИИ включает не только технологию, но и людей, которые используют ее, людей, пострадавших от нее, и среды развертывания. Ознакомьтесь с примечанием о прозрачности для формирования сводных данных, чтобы больше узнать об ответственном использовании и развертывании решений искусственного интеллекта в своих системах. Дополнительные сведения см. в следующих статьях: