Descrição geral do processamento de documentos não estruturados no Microsoft Syntex

Nota

Até junho de 2024, pode experimentar o processamento de documentos não estruturados e outros serviços Syntex selecionados sem custos se tiver a faturação pay as you go configurada. Para obter informações e limitações, consulte Experimentar Microsoft Syntex e explorar os respetivos serviços.

Utilize o modelo de processamento de documentos não estruturado (método de ensino) para classificar automaticamente ficheiros e extrair informações. Funciona melhor para documentos não estruturados, como cartas ou contratos.

Nota

A Microsoft respeita a privacidade e a propriedade dos dados que utiliza para preparar e processar modelos no Syntex. Nenhum dos dados da sua organização é utilizado ou transferido pela Microsoft para preparar modelos de IA, modelos de linguagem grande ou outros modelos. Os seus dados permanecem em segurança no inquilino da sua organização. Para obter mais informações, consulte Proteção de dados e privacidade da Microsoft.

Introdução aos modelos não estruturados

O modelo de processamento de documentos não estruturado (anteriormente conhecido como modelo de compreensão de documentos) utiliza inteligência artificial (IA) para processar documentos. Estes documentos têm de ter texto que possa ser identificado com base em expressões ou padrões. O texto identificado designa o tipo de ficheiro que é (a classificação) e o que pretende extrair (os respetivos extratores).

Nota

Para obter mais informações sobre como utilizar o Syntex e exemplos de cenários, veja Introdução à adoção de Microsoft Syntex e Cenários e casos de utilização para Microsoft Syntex.

Os modelos de processamento de documentos não estruturados são criados e geridos num tipo de site do SharePoint denominado centro de conteúdos. Quando aplicado a uma biblioteca de documentos do SharePoint, o modelo é associado a um tipo de conteúdo tem colunas para armazenar as informações que estão a ser extraídas. O tipo de conteúdo que criar é armazenado na galeria de tipos de conteúdo do SharePoint. Também pode optar por utilizar tipos de conteúdo existentes para utilizar o respetivo esquema.

Nota

Os tipos de conteúdo só de leitura ou selados não podem ser atualizados, pelo que não podem ser utilizados num modelo.

Adicione classificadores e extratores aos modelos de processamento de documentos não estruturados para realizar as seguintes ações:

  • Os classificadores são utilizados para identificar e classificar documentos que são carregados para a biblioteca de documentos. Por exemplo, um classificador pode ser "preparado" para identificar todos os documentos de renovação do contrato que são carregados para a biblioteca. O tipo de conteúdo de renovação do contrato é definido por si quando cria o classificador.

  • Os extratores extraem informações destes documentos. Por exemplo, para cada documento de renovação de contrato identificado na sua biblioteca de documentos, serão apresentadas colunas que mostram a Data de Início do Serviço e o Cliente para cada documento.

Pode utilizar ficheiros de exemplo para preparar e testar os classificadores e extratores no seu modelo. Os ficheiros de exemplo fornecem ao modelo exemplos do que procurar ao tentar identificar e extrair dados de ficheiros. Por exemplo, prepararia os classificadores e extratores de renovação do contrato com exemplos de documentos de renovação de contratos com os quais a sua empresa trabalha. Também pode utilizar ficheiros de exemplo para testar a eficácia do modelo.

Depois de publicar o modelo, utilize o centro de conteúdos para o aplicar a qualquer biblioteca de documentos do SharePoint à qual tenha acesso.

Requisitos e limitações

Para obter informações sobre os requisitos a considerar ao escolher este modelo, veja Requisitos e limitações para modelos no Microsoft Syntex.