Visão geral do processamento de documentos não estruturados no Microsoft Syntex

Observação

Até junho de 2024, você pode experimentar o processamento de documentos não estruturados e outros serviços Syntex selecionados sem nenhum custo se você tiver a cobrança paga conforme o uso configurada. Para obter informações e limitações, consulte Experimentar Microsoft Syntex e explorar seus serviços.

Use o modelo de processamento de documentos não estruturado (método de ensino) para classificar automaticamente os arquivos e extrair informações. Funciona melhor para documentos não estruturados, como cartas ou contratos.

Observação

A Microsoft respeita a privacidade e a propriedade dos dados que você usa para treinar e processar modelos no Syntex. Nenhum dos dados da sua organização é usado ou transferido pela Microsoft para treinar modelos de IA, modelos de linguagem grande ou qualquer outro modelo. Seus dados permanecem seguros no locatário da sua organização. Para obter mais informações, consulte Proteção de dados e privacidade da Microsoft.

Introdução a modelos não estruturados

O modelo de processamento de documentos não estruturado (anteriormente conhecido como modelo de compreensão de documentos) usa a IA (inteligência artificial) para processar documentos. Esses documentos devem ter texto que pode ser identificado com base em frases ou padrões. O texto identificado designa o tipo de arquivo (sua classificação) e o que você deseja extrair (suas extrações).

Observação

Para obter mais informações sobre como usar o Syntex e exemplos de cenário, consulte Introdução à adoção de Microsoft Syntex e cenários e casos de uso para Microsoft Syntex.

Modelos de processamento de documentos não estruturados são criados e gerenciados em um tipo de site do SharePoint chamado centro de conteúdo. Quando aplicada a uma biblioteca de documentos do SharePoint, o modelo é associado a um tipo de conteúdo que possui colunas para armazenar as informações que estão sendo extraídas. O tipo de conteúdo que você cria é armazenado na galeria de tipos de conteúdo do SharePoint. Você também pode optar por usar os tipos de conteúdo existentes para usar o esquema.

Observação

Tipos de conteúdo somente leitura ou selados não podem ser atualizados, portanto, não podem ser usados em um modelo.

Adicione classificadores e extratores aos modelos de processamento de documentos não estruturados para fazer as seguintes ações:

  • Os classificadores são usados para identificar e classificar os documentos que são carregados na biblioteca de documentos. Por exemplo, um classificador pode ser "treinado" para identificar toda a renovação de documentos que são carregados na biblioteca. O tipo de conteúdo de renovação de contrato é definido por você quando você cria seu classificador.

  • Os extratores recebem informações desses documentos. Por exemplo, para cada documento de renovação de contrato identificado na biblioteca de documentos, serão exibidas colunas que mostram a Data de Início do Serviço e o Cliente para cada documento.

Você pode usar os arquivos de exemplo para treinar e testar seus separadores e extrações em seu modelo. Os arquivos de exemplo fornecem exemplos ao seu modelo sobre o que procurar ao tentar identificar e extrair dados de arquivos. Por exemplo, você treina os classificadores e os extratores da renovação de contrato com exemplos de documentos de renovação de contrato que a sua empresa usa. Você também pode usar arquivos de exemplo para testar a eficácia do seu modelo.

Depois de publicar seu modelo, use o centro de conteúdo para aplicá-lo a qualquer biblioteca de documentos do SharePoint à qual você tenha acesso.

Requisitos e limitações

Para obter informações sobre os requisitos a serem consideradas ao escolher esse modelo, consulte Requisitos e limitações para modelos em Microsoft Syntex.