Что такое язык ИИ Azure?

Примечание

По состоянию на июль 2023 г. службы ИИ Azure охватывают все службы, которые ранее назывались Cognitive Services и Azure Applied AI Services. Цены не изменяются. Имена Cognitive Services и Прикладной ИИ Azure по-прежнему используются в API выставления счетов, анализа затрат, прейскурантах и ценах Azure. В программных интерфейсах приложений (API) или пакетах SDK нет критических изменений.

Язык ИИ Azure — это облачная служба, которая предоставляет функции обработки естественного языка (NLP) для понимания и анализа текста. Используйте эту службу для создания интеллектуальных приложений, использующих Language Studio на основе веб-интерфейса, REST API и клиентские библиотеки.

Доступные функции

Эта языковая служба объединяет следующие ранее доступные службы ИИ Azure: Анализ текста, QnA Maker и LUIS. Если вам нужно выполнить миграцию из этих служб, см. раздел о миграции ниже.

Языковая служба также предоставляет несколько новых функций, которые могут быть:

  • Предварительно настроено, что означает, что модели ИИ, используемые функцией, не настраиваются. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.
  • Настраиваемыми — вы обучаете модель ИИ, используя наши средства для точной подгонки данных.

Совет

Не знаете, какую функцию использовать? Сведения о выборе см. в статье Какая функция языковой службы следует использовать?

Language Studio позволяет использовать описанные ниже функции службы без написания кода.

Распознавание именованных сущностей (NER)

Снимок экрана: пример распознавания именованных сущностей.

Распознавание именованных сущностей — это предварительно настроенная функция, которая классифицирует сущности (слова или фразы) в неструктурированном тексте по нескольким предопределенным группам категорий. Например: люди, события, места, даты и другое.

Обнаружение персональных данных (PII) и сведений о состоянии здоровья (PHI)

Снимок экрана: обнаружение персональных данных.

Обнаружение личных сведений — это предварительно настроенная функция, которая идентифицирует, классифицирует и отредактирует конфиденциальную информацию как в неструктурированных текстовых документах, так и в расшифровках бесед. Например: номера телефонов, адреса электронной почты, удостоверения личности и другое.

Определение языка

Снимок экрана: пример распознавания языка.

Распознавание языка — это предварительно настроенная функция, которая может определять язык, на который написан документ, и возвращать код языка для широкого спектра языков, вариантов, диалектов и некоторых региональных или культурных языков.

Анализ тональности и интеллектуальный анализ мнений

Снимок экрана: пример анализа тональности.

Анализ тональности и интеллектуальный анализ мнений — это предварительно настроенные функции, которые помогают узнать, что люди думают о вашей торговой марке или теме, используя интеллектуальный анализ текста, чтобы получить подсказки о положительных или отрицательных тональности, и связать их с конкретными аспектами текста.

Сводка

Снимок экрана: пример формирования сводных данных.

Формирование сводных данных — это предварительно настроенная функция, которая использует сводные данные по извлечению текста для создания сводки документов и транскрибирования бесед. Она извлекает предложения, в сочетании содержащие наиболее важную или релевантную информацию из исходного содержимого.

Извлечение ключевой фразы

Снимок экрана: пример извлечения ключевых фраз.

Извлечение ключевых фраз — это предварительно настроенная функция, которая оценивает и возвращает main концепции в неструктурированном тексте и возвращает их в виде списка.

Связывание сущностей

Снимок экрана: пример связывания сущностей.

Связывание сущностей — это предварительно настроенная функция, которая определяет идентификацию сущностей (слов или фраз), найденных в неструктурированном тексте, и возвращает ссылки на Википедию.

Анализ текста для сферы здравоохранения

Снимок экрана: пример анализа медицинских текстов.

Анализ текста для здравоохранения — это предварительно настроенная функция, которая извлекает и помечает соответствующую медицинскую информацию из неструктурированных текстов, таких как заметки врача, выписки, клинические документы и электронные медицинские записи.

Пользовательская классификация текстов

Снимок экрана: пример пользовательской классификации текстов.

Настраиваемая классификация текста позволяет создавать пользовательские модели ИИ для классификации неструктурированных текстовых документов в определяемые вами пользовательские классы.

Пользовательское распознавание именованных сущностей (пользовательское NER)

Снимок экрана: пример пользовательского NER.

Custom NER позволяет создавать пользовательские модели ИИ для извлечения пользовательских категорий сущностей (меток для слов или фраз) с помощью предоставленного неструктурированного текста.

Распознавание разговорной речи

Снимок экрана: пример распознавания устной речи.

Распознавание устной речи (CLU) позволяет пользователям создавать настраиваемые модели распознавания естественного языка для прогнозирования общего намерения входящего речевого фрагмента и извлечения из него важных сведений.

Рабочий процесс оркестрации

Снимок экрана: пример рабочего процесса оркестрации.

Рабочий процесс оркестрации — это пользовательская функция, которая позволяет подключать распознавание устной речи (CLU), ответы на вопросы и приложения LUIS.

Ответы на вопросы

Снимок экрана: пример ответов на вопросы.

Ответы на вопросы — это пользовательская функция, которая находит наиболее подходящий ответ на входные данные от пользователей. Функция часто используется для создания клиентских приложений для общения, таких как приложения социальных сетей, чат-боты и классические приложения с поддержкой речи.

Настраиваемая аналитика текста для работоспособности

Снимок экрана: пример пользовательской аналитики текста для работоспособности.

Пользовательский анализ текста для здравоохранения — это настраиваемая функция, которая извлекает сущности, относящиеся к сфере здравоохранения, из неструктурированного текста с помощью создаваемой модели.

Какую языковую службу следует использовать?

Этот раздел поможет вам решить, какую функцию языковой службы следует использовать для приложения:

Выбор действия Формат документа Лучшее решение Можно ли настроить это решение?*
Обнаруживайте и (или) редактировать конфиденциальную информацию, такую как PII и PHI. Неструктурированный текст,
транскрибированные беседы
Обнаружение PII
Извлечение категорий сведений без создания пользовательской модели. Неструктурированный текст Предварительно настроенная функция NER
Извлечение категорий информации с помощью модели, относяшейся к вашим данным. Неструктурированный текст Пользовательское Распознавание именованных сущностей
Извлечение main тем и важных фраз. Неструктурированный текст Пример. Как извлечь ключевые фразы с помощью Анализа текста
Определите тональность и мнения, выраженные в тексте. Неструктурированный текст Анализ тональности и интеллектуальный анализ мнений
Суммирование длинных фрагментов текста или бесед. Неструктурированный текст,
транскрибированные беседы.
Сводка
Неоднозначные сущности и получение ссылок на Википедию. Неструктурированный текст Связывание сущностей
Классифицируйте документы по одной или нескольким категориям. Неструктурированный текст Пользовательская классификация текстов
Извлечение медицинской информации из клинических или медицинских документов без создания модели. Неструктурированный текст Анализ текста для сферы здравоохранения
Извлечение медицинской информации из клинических или медицинских документов с помощью модели, обученной на основе ваших данных. Неструктурированный текст Настраиваемая аналитика текста для работоспособности
Создайте приложение для общения, которое реагирует на входные данные пользователя. Неструктурированные входные данные пользователя Ответы на вопросы
Определение языка, на который был написан текст. Неструктурированный текст Пример. Как определить язык с помощью Анализа текста
Прогнозирование намерения входных данных пользователем и извлечение информации из них. Неструктурированные входные данные пользователя Распознавание разговорной речи
Подключение приложений из распознавания устной речи, LUIS и ответов на вопросы. Неструктурированные входные данные пользователя Рабочий процесс оркестрации

* Если функция настраивается, вы можете обучить модель ИИ с помощью наших инструментов в соответствии с вашими данными. В противном случае функция предварительно настроена, то есть модели ИИ, которые она использует, нельзя изменить. Вы просто отправляете свои данные и используете выходные данные компонента в своих приложениях.

Миграция из служб "Анализ текста", QnA Maker или "Распознавание речи" (LUIS)

Язык ИИ Azure объединяет три отдельные языковые службы в службах ИИ Azure: Анализ текста, QnA Maker и Распознавание речи (LUIS). Если вы использовали эти три службы, вы можете легко перейти на новый язык ИИ Azure. Инструкции см. в статье Переход на язык ИИ Azure.

Руководства

После того как вы начнете использовать языковую службу, просмотрите наше руководство с описанием разных сценариев.

Дополнительные примеры кода

Дополнительные примеры кода можно найти на GitHub для следующих языков:

Развертывание в локальной среде с помощью контейнеров Docker

Для развертывания функций API в локальной среде используйте контейнеры языковой службы. Эти контейнеры Docker позволяют разместить службу ближе к данным для обеспечения безопасности, соответствия требованиям и других эксплуатационных преимуществ. Для языковой службы предлагаются следующие контейнеры:

Ответственный подход к использованию ИИ

Система ИИ — это не только технология, но и ее пользователи, люди, на которых она повлияет, а также среда, в которой она будет развернута. Ознакомьтесь с приведенными ниже статьями, чтобы узнать больше об ответственном использовании и развертывании искусственного интеллекта в своих системах.