Saiba mais sobre o reconhecimento óptico de caracteres no Microsoft Purview

A verificação de OCR (reconhecimento óptico de caracteres) permite que o Microsoft Purview examine o conteúdo em imagens para obter informações confidenciais. Um recurso opcional, a verificação de OCR é habilitada pela primeira vez no nível do locatário. Depois de habilitado, selecione os locais em que deseja verificar imagens. A verificação de imagens está disponível para dispositivos Exchange, SharePoint, OneDrive, Teams e Windows. Depois que as configurações do OCR são configuradas, suas políticas existentes para prevenção contra perda de dados (DLP), gerenciamento de registros e gerenciamento de risco interno (IRM) são aplicadas a imagens e conteúdo baseado em texto. Por exemplo, diga que você configurou o conteúdo da condição DLP que contém informações confidenciais e incluiu um classificador de dados, como o tipo de informações confidenciais "Cartão de Crédito" (SIT). Nesse caso, o Microsoft Purview verifica números de cartão de crédito em texto e imagens em todos os locais escolhidos.

Fluxo de trabalho em um relance

Fase Requisitos
Fase 1: Criar assinatura do Azure, se necessário Se sua organização ainda não tiver uma assinatura paga como você do Azure para seu locatário, seu administrador global precisará começar criando uma conta do Azure.
Fase 2: Configure a cobrança paga conforme o uso para habilitar o OCR. O administrador global ou do SharePoint deve seguir as instruções em Configurar Microsoft Syntex cobrança no Azure para adicionar uma assinatura para OCR.
Fase 3: Configurar configurações de verificação de OCR O administrador de conformidade da sua organização configura as configurações do OCR para seu locatário.

Fase 1: Pré-requisitos

Para usar a verificação de OCR, o administrador global da sua organização precisa verificar se uma assinatura paga conforme o uso do Azure está em vigor. Caso contrário, eles precisam configurar isso, seguindo as instruções em Criar suas assinaturas iniciais do Azure

Fase 2: Configurar cobrança

Quando você habilita o OCR, todos os tipos de informações confidenciais e classificadores treináveis podem detectar caracteres que estão em imagens.

Como é um recurso opcional, o administrador global deve configurar a cobrança paga conforme o uso para habilitar o OCR. Consulte as instruções em Configurar Microsoft Syntex cobrança no Azure para adicionar uma assinatura para OCR.

Observação

Depois que as informações de cobrança forem inseridas no Microsoft Syntex, seu administrador de conformidade poderá configurar o OCR no Microsoft Purview, sem nenhum requisito adicional de instalação ou licenciamento.

Você pode encontrar informações de preços OCR pagas conforme o uso na página Configurar Microsoft Syntex cobrança no Azure.

Encargos

A cobrança por usar o OCR é de US$ 1,00 para cada 1.000 itens verificados. Cada imagem digitalizada conta como uma transação. Isso significa que imagens autônomas (JPEG, JPG, PNG, BMP ou TIFF) contam cada uma como uma única transação. Isso também significa que cada página em um arquivo PDF é cobrada separadamente. Por exemplo, se houver 10 páginas em um arquivo PDF, uma verificação OCR do arquivo PDF conta como 10 verificações separadas.

Observação

Para reduzir os custos do OCR, os encargos para a verificação de cada imagem exclusiva são incorridos apenas uma vez.

Pequenas imagens, como logotipos e assinaturas enviadas por email via Microsoft Exchange, são digitalizadas e cobradas apenas uma vez por imagem exclusiva em todos os usuários do locatário. Para todas as instâncias subsequentes, os resultados da verificação anterior serão reutilizados.

Além disso, cada imagem digitalizada pode ser usada em várias políticas em prevenção de perda de dados, gerenciamento de risco interno, rotulagem automática e gerenciamento de registros sem cobrança adicional.

Importante

Para obter informações sobre os requisitos da Adobe para usar recursos de DLP (Prevenção Contra Perda de Dados do Microsoft Purview) com arquivos PDF, consulte este artigo da Adobe: Proteção de Informações do Microsoft Purview Suporte no Acrobat.

Para exibir sua fatura, siga as instruções descritas em Monitorar seu Microsoft Syntex uso pago conforme o uso.

Estimar sua conta

Quando você começar a usar o OCR pela primeira vez, limite o uso para apenas algumas pessoas e cargas de trabalho aplicáveis. Depois de um curto período, você pode exibir sua fatura no Azure e ver as estatísticas de uso & encargos para cada dia. A partir daí, você pode extrapolar os custos para o conjunto completo de usuários. Além disso, você pode usar a marca "carga de trabalho" no gerenciamento de custos do Azure para ver a divisão do uso por carga de trabalho.

Fase 3: configurar as configurações do OCR

  1. No portal de conformidade do Microsoft Purview, vá para Configurações.
  2. Selecione OCR (reconhecimento óptico de caracteres) para inserir suas configurações de OCR.
  3. Selecione os locais em que você deseja verificar imagens.
  4. Selecione os grupos de distribuição que você deseja incluir ou excluído das verificações de OCR.
  5. Escolher Concluído

Locais e soluções com suporte estão listados na tabela abaixo.

Permissões

A conta que você usa para criar e implantar políticas deve ser membro de um desses grupos de funções

  • Administrador de conformidade
  • Administrador de dados de conformidade
  • Administrador global
  • Proteção de Informações
  • Administrador de Proteção de Informações

Observação

Locais e soluções com suporte

Local Soluções com suporte
Exchange Prevenção contra perda de dados

Proteção de informações: políticas de rotulagem automática

Gerenciamento de registros: aplicar automaticamente políticas de rótulo de retenção1
Sites do SharePoint Prevenção contra perda de dados

Gerenciamento de riscointerno 2

Gerenciamento de registros: aplicar automaticamente políticas de rótulo de retenção1
Contas OneDrive Prevenção contra perda de dados

Gerenciamento de registros: aplicar automaticamente políticas de rótulo de retenção1
Bater papo e canal de mensagens do Teams Prevenção contra perda de dados

Gerenciamento de riscointerno 2
Dispositivos Prevenção contra perda de dados

Gerenciamento de riscointerno 2

1 Dá suporte a palavras-chave e tipos de informações confidenciais.
2 Considera tipos de informações confidenciais e classificadores treináveis presentes em imagens para pontuação de risco.


Quais tipos de arquivo têm suporte?

Essa funcionalidade dá suporte à verificação de imagens nos seguintes tipos de arquivo, com os requisitos observados:

Tipos de arquivo compatíveis Requisitos de imagem
JPEG, JPG, PNG, BMP, TIFF e PDF (somente imagem) Tamanhos de arquivo: Os arquivos de imagem não devem ter mais de 20 MB para Exchange e Teams. Para pontos de extremidade do SharePoint, OneDrive e Windows, o tamanho máximo do arquivo de imagem é de 50 MB.

Resolução de imagem: A resolução de imagem deve ter pelo menos 50 x 50 pixels e não maior que 16.000 x 16.000 px.

Importante

  • Somente as imagens carregadas após a habilitação do OCR são digitalizadas.
  • Tanto o email de entrada (email de usuários fora da organização) quanto o email de saída (email enviado de usuários dentro da organização) estão sujeitos à verificação de OCR. Para restringir somente as verificações de OCR a emails de saída, altere as configurações do OCR do escopo padrão de Todos os grupos de distribuição para os grupos de distribuição específicos e especifique os grupos de distribuição internos que você deseja que o OCR examine. Para obter informações sobre como alterar essa configuração, consulte Fase 3: Configurar as configurações do OCR.
  • Não há suporte para dicas de política de prevenção contra perda de dados para imagens no Exchange.
  • Se você excluir um caminho nas configurações de prevenção contra perda de dados do ponto de extremidade, o OCR não examinará imagens nessas pastas.
  • Quando o OCR é ativado para dispositivos Windows, os dispositivos começam a enviar mensagens para a nuvem para verificação. O limite padrão de largura de banda é de 1024 MB de dados por dispositivo por dia. O OCR interrompe a verificação de imagens depois que esse limite diário é atingido. Se você quiser continuar verificando imagens, poderá aumentar o limite de largura de banda.

Quais idiomas têm suporte?

A verificação de OCR dá suporte a mais de 150 idiomas.

Resumo

Confira também