Share via


O que é resumo?

Importante

Nossa região de versão prévia, a Suécia Central, demonstra nossas técnicas de ajuste fino de LLM mais recentes e em constante evolução baseadas em modelos GPT. Você está convidado a experimentá-los com um recurso de idiomas na região da Suécia Central.

O resumo da conversa só está disponível usando:

  • API REST
  • Python
  • C#

A sumarização é um dos recursos oferecidos pela Linguagem de IA do Azure, uma coleção de aprendizado de máquina e algoritmos de IA na nuvem para o desenvolvimento de aplicativos inteligentes que envolvem linguagem escrita. Use este artigo para saber mais sobre esse recurso e como usá-lo nos seus aplicativos.

Embora os serviços sejam rotulados como resumo de documentos e de conversas, o resumo de texto só aceita blocos de texto simples, e o resumo de conversas aceita vários artefatos de fala para que o modelo aprenda mais. Se você quiser processar uma conversa, mas se preocupar apenas com o texto, poderá usar o resumo de texto para esse cenário.

Esta documentação contém os seguintes tipos de artigos:

  • Os guias de início rápido são instruções de introdução que orientam sobre como fazer solicitações ao serviço.
  • Os guias de instruções contêm instruções de uso do serviço de maneiras mais específicas ou personalizadas.

O resumo de texto usa técnicas de processamento de linguagem natural para gerar um resumo dos documentos. Há duas abordagens de API que dão suporte para a compactação automática: extrativa e abstrata.

A sumarização extrativa extrai frases que representam coletivamente as informações mais importantes ou relevantes do conteúdo original. A sumarização abstrata gera um resumo com frases ou palavras concisas e coerentes que não são frases extraídas literalmente do documento original. Esses recursos foram projetados para reduzir o conteúdo que possa ser considerado muito longo para ser lido.

Principais recursos do resumo de texto

Há dois aspectos do resumo de texto que esta API fornece:

  • Sumarização extrativa: produz um resumo extraindo frases salientes do documento.

    • Várias frases extraídas: essas frases transmitem em conjunto a ideia principal do documento. São frases originais extraídas do conteúdo do documento de entrada.
    • Pontuação de classificação: a pontuação de classificação indica o quanto uma frase é relevante para o tópico principal de um documento. O resumo de texto classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com a classificação delas.
    • Várias frases retornadas: determina o número máximo de frases a serem retornadas. Por exemplo, se você solicitar um resumo de três frases, a sumarização extrativa retornará as três frases com maior pontuação.
    • Informações posicionais: a posição inicial e o comprimento das frases extraídas.
  • Resumo abstrato: gera um resumo que não usa as mesmas palavras do documento, mas captura a ideia principal.

    • Textos resumidos: a sumarização abstrativa retorna um resumo para cada intervalo de entrada contextual do documento. Um documento longo pode ser segmentado para que vários grupos de textos resumidos possam ser retornados com seu intervalo de entrada contextual.
    • Intervalo de entrada contextual: o intervalo dentro do documento de entrada que foi usado para gerar o texto de resumo.

Por exemplo, considere o seguinte parágrafo de texto:

"Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão. Como Diretor de Tecnologia dos Serviços de IA do Azure, tenho trabalhado para transformar essa busca em realidade com uma equipe de cientistas e engenheiros incríveis. Na minha função, eu adoto uma perspectiva exclusiva para visualizar a relação entre três atributos de cognição humana: texto (X), sinais sensoriais auditivos ou visuais (Y) e multilínge (Z). Na interseção de todos os três, há mágica, o que chamamos de código XYZ, conforme ilustrado na Figura 1, uma representação conjunta para criar uma IA mais poderosa que possa falar, ouvir, ver e entender melhor os seres humanos. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação em reconhecimento de fala em conversação, tradução automática, resposta às perguntas em conversação, compreensão de leitura por computador e legendas de imagens. Esses cinco avanços nos forneceram fortes sinais em direção à nossa aspiração mais ambiciosa de produzir um salto nas funcionalidades de IA, alcançando um aprendizado multissensorial e multilíngue mais próximo de como os humanos aprendem e entendem. Acredito que o código XYZ conjunto é um componente fundamental dessa aspitação, se fundamentado com fontes de conhecimento externas nas tarefas de IA downstream."

A solicitação de API do resumo de texto é processada após o recebimento da solicitação criando um trabalho para o back-end da API. Se o trabalho tiver sido bem-sucedido, a saída da API é retornada. A saída está disponível para recuperação por 24 horas. Após esse período, a saída será limpa. Devido ao suporte multilíngue e a emojis, a resposta pode conter deslocamentos de texto. Para obter mais informações, confira como processar deslocamentos.

Se usarmos o exemplo anterior, a API poderá retornar estas frases resumidas:

Sumarização extrativa:

  • "Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão."
  • "Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes."
  • "A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje."

Sumarização abstrativa:

  • "A Microsoft está adotando uma abordagem mais holística e centrada no aprendizado e na compreensão das pessoas. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação no reconhecimento de fala em conversação."

Um documento nativo se refere ao formato de arquivo usado para criar o documento original, como Microsoft Word (docx) ou um formato portátil de documento (pdf). O suporte nativo a documentos elimina a necessidade de pré-processamento de texto antes de usar as funcionalidades do recurso de Linguagem de IA do Azure. Atualmente, o suporte a documentos nativos está disponível para as funcionalidades AbstractiveSummarization e ExtractiveSummarization.

Atualmente, o Resumo de Texto dá suporte aos seguintes formatos de documento nativo:

Tipo de arquivo Extensão de arquivo Descrição
Texto .txt Um documento de texto não formatado.
Adobe PDF .pdf Um documento formatado em formato portátil de documento.
Microsoft Word .docx Um arquivo de documento do Microsoft Word.

Para obter mais informações, confiraUsar documentos nativos para processamento de idiomas

Principais recursos do resumo de conversa

A sumarização de conversas dá suporte aos seguintes recursos:

  • Sumarização de problemas/resoluções: um recurso específico de Call Center que fornece um resumo de problemas e resoluções em conversas entre agentes de atendimento ao cliente e seus clientes.
  • Resumo do título do capítulo: segmenta uma conversa em capítulos com base nos tópicos discutidos na conversa e fornece títulos de capítulo sugeridos da conversa de entrada.
  • Recapitular: resume uma conversa em um breve parágrafo.
  • Sumarização de narrativas: gera notas de chamada detalhadas, notas de reunião ou resumos de chat de conversas de entrada.
  • Tarefas de acompanhamento: fornece uma lista de tarefas de acompanhamento discutidas na conversa de entrada.

Quando usar a sumarização de problemas e resoluções

  • Quando existem aspectos de um "problema" e de uma "resolução", tais como:
    • O motivo de um chat/chamada de serviço (o problema).
    • Essa resolução para o problema.
  • Você só deseja um resumo que se concentre em informações relacionadas sobre problemas e resoluções.
  • Quando há dois participantes na conversa e você quer resumir o que cada um disse.

Por exemplo, considere a seguinte conversa:

Agente: "Olá, você está conversando com Rene. Como posso ajudar você?"

Cliente: "Olá, tentei configurar uma conexão Wi-Fi para a máquina de café expresso Smart Brew 300, mas não funcionou."

Agente: "Lamentamos ouvir isso. Vamos ver o que é possível fazer para corrigir esse problema. Você poderia pressionar o botão de conexão da wi-fi, mantê-lo pressionado por 3 segundos e depois me informar se a luz de energia está piscando lentamente?"

Cliente: "Sim, eu pressionei o botão de conexão wi-fi e agora a luz de energia está piscando lentamente."

Agente: "Ótimo. Obrigado! Agora, verifique seu aplicativo Contoso Coffee. Ele solicita que você se conecte ao computador?"

Cliente: "Não. Nada aconteceu."

Agente: "Eu vejo. Obrigado. Vamos tentar se uma redefinição de fábrica pode resolver o problema. É possível pressionar e manter pressionado o botão central por 5 segundos para iniciar a restauração de fábrica."

Cliente: "tentei a redefinição de fábrica e executei novamente as etapas acima, mas ainda não funcionou."

Agente: "Lamentamos muito ouvir isso. Deixe-me ver se há outra maneira de corrigir o problema. Aguarde um minuto."

O recurso de sumarização de conversas simplificaria o texto da seguinte forma:

Resumo do exemplo Formatar Aspecto da conversa
O cliente deseja usar a conexão wi-fi em seu Smart Brew 300. Mas isso não funcionou. Uma ou duas frases problema
Verifiquei se a luz de energia está piscando lentamente. Verifiquei o aplicativo de café Contoso. Não tinha nenhuma solicitação. Tentei fazer uma redefinição de fábrica. Uma ou mais frases, geradas a partir de várias linhas da transcrição. resolução

Introdução ao resumo

Para usar a compactação, envie para análise e trate a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem nenhuma personalização adicionada para o modelo usado nos seus dados. Há duas maneiras de usar o resumo:

Opção de desenvolvimento Descrição
Language Studio O Language Studio é uma plataforma baseada na Web que permite que você experimente a vinculação de entidade com exemplos de texto sem uma conta do Azure, e seus próprios dados quando você se inscreve. Para obter mais informações, confira o site do Language Studio ou o início rápido do Language Studio.
API REST ou biblioteca de clientes (SDK do Azure) Integre o resumo de texto nos seus aplicativos usando a API REST ou a biblioteca de clientes disponível em vários idiomas. Para obter mais informações, consulte o início rápido da sumarização.

Requisitos de entrada e limites de serviço

Documentação de referência e exemplos de código

Ao usar o resumo de texto nos seus aplicativos, consulte a seguinte documentação de referência e exemplos da Linguagem de IA do Azure:

Opção/idioma de desenvolvimento Documentação de referência Exemplos
C# Documentação do C# Exemplos do C#
Java Documentação do Java Exemplos do Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação do Python Exemplos em Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a utilizam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para resumo para saber mais sobre o uso e a implantação de IA responsável em seus sistemas. Para obter mais informações, consulte os seguintes artigos: