Share via


Teste um tipo de informação confidencial de correspondência de dados exata

Dica

Se você não for um cliente E5, use a avaliação de soluções do Microsoft Purview de 90 dias para explorar como recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações portal de conformidade do Microsoft Purview. Saiba mais sobre os termos de inscrição e avaliação.

Aplicável a

Depois que o SIT (tipo de informação confidencial) de correspondência de dados exato (EDM) tiver sido criado e uma hora depois de verificar se sua tabela de informações confidenciais terminou de carregar e indexar, você pode testar se ela detecta ou não as informações que deseja proteger usando a função Teste na seção Tipos de informações confidenciais no Portal de Conformidade do Microsoft Purview.

Observação

As alterações em um SIT EDM existente podem levar algum tempo para se propagar em todo o sistema. Se você estiver fazendo alterações em um SIT do EDM para solucionar problemas de detecção, aguarde pelo menos uma hora depois de fazer essas alterações antes de usar a função Teste para validar seu impacto.

Independentemente do método usado para teste, os resultados do teste incluirão correspondências tanto para o EDM SIT específico quanto para os elementos primários configurados para esse SIT EDM.

Métodos para testar seu EDM SIT

Há dois métodos que você pode usar para testar seu EDM SIT.

Método Disponível na nova experiência do EDM Disponível na experiência EDM nova e clássica
Método SIT (tipo de informação confidencial) Sim Sim
Método de classificadores EDM Sim Não

Observação

Se você estiver usando a experiência clássica do EDM, deverá usar o método SIT.

Testar um SIT EDM com o método Tipos de Informações Confidenciais

Para testar um SIT EDM com o método Tipos de Informações Confidenciais , siga as etapas a seguir.

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o portal de conformidade, consulte portal de conformidade do Microsoft Purview.

  1. Entre no portal > do Microsoft PurviewProteção de Informações>Classifiers>Tipos de informações confidenciais.

  2. Selecione seu EDM SIT na lista e selecione o ícone Testar .

  3. No painel de sobrevoo, carregue um arquivo que contém dados que você deseja detectar. Por exemplo, crie um arquivo que contenha um subconjunto das linhas na tabela de informações confidenciais. Se você usou o recurso de correspondência configurável em seu esquema para definir delimitadores ignorados, verifique se o arquivo de exemplo inclui exemplos com e sem esses delimitadores.

  4. Escolha Testar.

  5. Depois que o arquivo tiver sido carregado e verificado, marcar para correspondências com seu EDM SIT.

  6. Se a função Teste no SIT detectar uma correspondência, verifique se o SIT não está cortando ou extraindo o item correspondente incorretamente. Problemas comuns incluem SITs que:

    • Extrair apenas uma substring da cadeia de caracteres completa que deve ser detectada
    • Pegar apenas a primeira palavra em uma cadeia de caracteres de várias palavras
    • Incluir símbolos ou caracteres extras na extração

Para obter detalhes sobre como usar expressões regulares, consulte a Linguagem de Expressão Regular – Referência Rápida.

Testar seu EDM SIT com o método classificador EDM

Selecione a guia apropriada para o portal que você está usando. Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o portal de conformidade, consulte portal de conformidade do Microsoft Purview.

  1. Entre no portal > do Microsoft PurviewProteção de Informações>Classificadores classificadores>EDM.

  2. Verifique se a alternância da nova experiência EDM está definida como Ativada.

  3. Selecione seu EDM SIT na lista e selecione o ícone Testar .

  4. Carregue um arquivo que contém dados que você deseja detectar. Por exemplo, crie um arquivo que contenha um subconjunto das linhas na tabela de informações confidenciais. Se você usou o recurso de correspondência configurável em seu esquema para definir delimitadores ignorados, verifique se o arquivo de exemplo inclui exemplos com e sem esses delimitadores.

  5. Depois que o arquivo tiver sido carregado e verificado, marcar para correspondências com seu EDM SIT.

  6. Se a função Teste no SIT detectar uma correspondência, verifique se o SIT não está cortando ou extraindo o item correspondente incorretamente. Problemas comuns incluem SITs que:

    • Extrair apenas uma substring da cadeia de caracteres completa que deve ser detectada
    • Pegar apenas a primeira palavra em uma cadeia de caracteres de várias palavras
    • Incluir símbolos ou caracteres extras na extração

Testar seu EDM SIT usando o PowerShell

Para testar usando o PowerShell, use o seguinte cmdlet do PowerShell:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

Independentemente do método usado para teste, os resultados do teste incluirão correspondências tanto para o EDM SIT específico quanto para os elementos primários configurados para esse SIT EDM.

Observação

Quando você cria um ou edita um tipo de informações confidenciais do EDM ou o SIT primário no qual um tipo EDM se baseia, todo o novo conteúdo (bem como o conteúdo modificado após fazer alterações nos SITs) será rastreado para conteúdo que corresponda às novas definições. No entanto, o conteúdo pré-existente não será rastreado até que seja modificado ou indexado novamente.

Para forçar o rastreamento de conteúdo existente em um site ou biblioteca do SharePoint ou no OneDrive, siga as instruções em Rastreamento de solicitação manual e re indexação de um site, uma biblioteca ou uma lista.

Testar seu EDM SIT com políticas de proteção de informações

Você pode ver onde seu EDM SIT está sendo usado e o quão preciso ele está em produção, usando-o em políticas:

  1. Crie uma política de rotulagem automática e execute-a em Visão geral de simulação.

  2. Adicione algum conteúdo que disparará o SIT do EDM, juntamente com o conteúdo que não disparará o EDM SIT, para um local que sua política está monitorando.

  3. Abra a guia Itens para examinar para marcar as correspondências.

  4. Ajuste suas políticas conforme apropriado.

Depois de estar satisfeito com os resultados de seus testes e ajustes, seu SIT personalizado baseado em EDM está pronto para uso em políticas de proteção de informações, por exemplo:

Dicas de solução de problemas

Se o EDM SIT não detectar nenhuma correspondência em seus dados, as dicas a seguir poderão ajudá-lo a diagnosticar o problema.

Problema Dica de solução de problemas
Nenhuma correspondência encontrada Confirme se seus dados confidenciais foram carregados corretamente usando os comandos explicados no Hash e carregue a tabela de fonte de informações confidenciais para que os dados exatos correspondam a tipos de informações confidenciais.
Nenhuma correspondência encontrada Teste o SIT usado quando você configurou o elemento primário em cada um de seus padrões. Este teste verifica se o SIT pode corresponder aos exemplos no item. Usar um SIT definido incorretamente como o elemento de classificação de um SIT EDM é a causa mais comum para falhas de detecção no EDM.
O SIT selecionado para um elemento primário no tipo EDM não encontra uma correspondência no item ou encontra menos correspondências do que você esperava Confirme se o SIT dá suporte aos separadores e delimitadores que ocorrem no conteúdo. Certifique-se de incluir os delimitadores ignorados definidos em seu esquema.
O SIT associado ao elemento primário encontra correspondências em seu conteúdo, mas o EDM SIT não.
  • Verifique se suas instruções REGEX estão capturando delimitadores de whitespace no início ou no final de um item que você deseja detectar. Por exemplo, procure instruções que incluam o \s delimitador. Se os delimitadores de whitespace forem incluídos, o whitespace não corresponderá ao valor hash na tabela de dados. Em vez disso, use um delimitador de palavras, como \b.
  • Verifique suas instruções REGEX para garantir que elas capturem toda a cadeia de caracteres que você deseja detectar, não apenas uma substring. Por exemplo, considere esse padrão para endereços de email: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b. Esse padrão corresponderá user@contoso.comcorretamente , mas só será capturado user@contoso.co.jp em uma forma incompleta.
Um SIT EDM com elementos primários, mas sem elementos secundários definidos, detecta itens, mas não detecta correspondências (ou detecta menos correspondências do que o esperado) quando elementos primários e secundários são necessários. Se os valores em uma coluna usada para evidências secundárias não forem compostos por uma única palavra ou de cadeias de caracteres que não contenham espaços, vírgulas ou outros separadores de palavras, há duas maneiras de testar:
  1. Selecione a opção de correspondência de vários tokens .
  2. Associe os valores a um SIT que usa um REGEX projetado para detectar cadeias de caracteres de várias palavras que seguem o padrão desejado (por exemplo, um número fixo de palavras consecutivas que começam com um caractere maiúsculas) ou um dicionário palavra-chave que lista todos os valores exclusivos nessa coluna. Por exemplo, se houver uma coluna de evidência adicional para a cidade ou residência de uma pessoa, você poderá criar uma lista com todos os nomes de cidade exclusivos da tabela e usá-la para criar um tipo de informação confidencial baseado em dicionário.

Use este SIT como o elemento de classificação para a coluna correspondente em seu EDM SIT exportando e editando a definição de SIT EDM no XML. Para obter mais informações, consulte Criar um pacote de regras manualmente.
A função de teste SIT não detecta nenhuma correspondência. Verifique se o SIT selecionado inclui requisitos para palavras-chave adicionais ou outras validações. Para SITs internos, consulte Definições de entidade de tipo de informação confidencial para determinar quais são os requisitos mínimos para corresponder a cada tipo.
A funcionalidade Teste funciona, mas seus itens do SharePoint ou do OneDrive não estão sendo detectados em regras de DLP ou rotulagem automática Verifique se os documentos em que você espera encontrar correspondências realmente aparecem no gerenciador de conteúdo. As correspondências só são detectadas no conteúdo criado depois que as alterações no SIT são aplicadas. Portanto, se as correspondências esperadas não aparecerem, re-rastreamento dos sites e bibliotecas para quaisquer itens pré-existentes. Para obter detalhes sobre como rastrear novamente o SharePoint e o OneDrive, consulte Rastreamento e indexação manual de solicitações de um site, uma biblioteca ou uma lista.
Regras de rotulagem automática ou DLP que exigem várias correspondências não disparam Verifique se os requisitos de proximidade para o SIT do EDM e os SITs base são atendidos. Por exemplo, se a distância máxima entre o elemento primário e as palavras-chave de suporte for de 300 caracteres, mas as palavras-chave só estiverem presentes na primeira linha de uma tabela longa, apenas as primeiras linhas de valores correspondentes provavelmente atenderão aos requisitos de proximidade. Modifique suas definições SIT para dar suporte a regras de proximidade mais relaxadas ou use a opção Em qualquer lugar do documento para as condições de evidência adicionais.
A detecção de um SIT EDM é inconsistente ou errática Verifique se o SIT usado como base para o elemento primário em seu EDM SIT não está detectando conteúdo desnecessário. Usar um SIT que corresponda a muito conteúdo não relacionado, como qualquer palavra, qualquer número ou todos os endereços de email, pode fazer com que o serviço ignore correspondências relevantes. Verifique o número de peças de conteúdo que correspondem ao tipo confidencial usado para seus elementos primários no gerenciador de conteúdo.

Para estimar se o SIT está correspondendo a muito conteúdo:
  1. Divida o número de itens de conteúdo no Conteúdo do Microsoft Purview Explorer pelo número de dias desde que o tipo confidencial foi criado.
  2. Se o número de correspondências por dia estiver no intervalo de centenas de milhares ou mais, é possível que o SIT primário seja muito amplo.

Para obter recomendações e práticas recomendadas sobre como selecionar o tipo de informações confidenciais correto para um SIT EDM, consulte Saiba mais sobre os tipos de informações confidenciais baseados em correspondência de dados exatos.