Introducción a los tipos de información confidencial personalizados
Si los tipos de información confidencial predefinidos no satisfacen sus necesidades, puede crear sus propios tipos de información confidencial personalizados. Al hacerlo, puede copiar uno de los tipos predefinidos y modificarlo o definirlo completamente usted mismo.
Los tipos de información confidencial personalizados se agregan al paquete de reglas denominado Microsoft.SCCManaged.CustomRulePack Microsoft.SCCManaged.CustomRulePack.
Hay dos formas de crear un tipo de información confidencial:
- Desde cero (usted define completamente todos los elementos)
- Copiando un tipo de información confidencial existente y modificándolo
Antes de empezar
Debe estar familiarizado con los tipos de información confidencial y saber de qué se componen. Consulte Obtener más información acerca de los tipos de información confidencial. Es fundamental comprender los roles de:
- Las expresiones regulares: los tipos de información confidencial de Microsoft 365 usan el motor Boost.RegEx 5.1.3
- Listas de palabras clave: puede crear las suyas a medida que defina el tipo de información confidencial o elegir entre listas de palabras clave existentes.
- Diccionario de palabras clave
- Funciones
- Niveles de confianza
Debe contar con los permisos de administrador global o de administrador de cumplimiento para crear, probar e implementar un tipo de información confidencial personalizada por medio de la interfaz de usuario. Vea Acerca de las funciones de administraciónen Office 365.
Su organización debe tener una suscripción, como Office 365 Enterprise, que incluye la prevención de pérdida de datos (DLP). Ver Política de Mensajería y Servicio de ServiceDescription
Importante
El soporte técnico y el servicio al cliente de Microsoft no puede ayudar a crear clasificaciones personalizadas o patrones de expresiones regulares. Los ingenieros de soporte técnico pueden ofrecer soporte limitado para la característica como, por ejemplo, proporcionar patrones de expresiones regulares de ejemplo para propósitos de prueba o ayudar con la solución de problemas de un patrón de expresión regular existente que no se activa de la forma esperada. Pero no pueden garantizar que el desarrollo personalizado que coincida con el contenido cumplirá sus requisitos u obligaciones.
Crear un tipo de información confidencial personalizado
Use este procedimiento para crear un nuevo tipo de información confidencial y definirlo usted mismo por completo.
- En el Centro de cumplimiento, vaya a Clasificación de datos Tipos de > información confidencial y elija Crear tipo de información confidencial.
- Rellene los valores de Nombre y Descripción y elija Siguiente.
- Elija Crear patrón. Puede crear varios patrones, cada uno con diferentes elementos y niveles de confianza, a medida que defina el nuevo tipo de información confidencial.
- Elija el valor predeterminado del Nivel de confianza para el patrón. Los valores son Confianza baja, Confianza media y Confianza alta.
- Elegir y definir el Elemento principal. El elemento principal puede ser una Expresión regular con un validador opcional, una lista de palabras clave, un diccionario de palabras clave o una de las funciones preconfiguradas. Para obtener más información sobre las funciones DLP, vea Qué buscan las funciones de DLP. Para obtener más información sobre la fecha y los validadores de suma de comprobación, vea More information on regular expression validators.
- Rellene un valor para Proximidad de caracteres.
- (Opcional) Si los tiene, agregue elementos de soporte. Los elementos de soporte pueden ser una expresión regular con un validador opcional, una lista de palabras clave, un diccionario de palabras clave o una de las funciones predefinidas. Los elementos de soporte pueden tener su propia configuración de proximidad de caracteres.
- (Opcional) Agregar comprobaciones adicionales de la lista de comprobaciones disponibles.
- Seleccione Crear.
- Elija Siguiente.
- Elija el nivel de confianza recomendado de este tipo de información confidencial.
- Revise la configuración y elija Enviar.
Importante
Microsoft 365 usa el rastreador de búsqueda para identificar y clasificar información confidencial en los sitios de SharePoint Online y OneDrive para la Empresa. Para identificar el nuevo tipo de información confidencial personalizado en el contenido existente, se necesita volver a rastrear el contenido. El contenido se rastrea en función de una programación, pero puede volver a rastrear de forma manual el contenido de una colección de sitios, lista o biblioteca. Para obtener más información, vea Solicitar manualmente el rastreo y una nueva indexación de un sitio, una biblioteca o una lista.
- En la clasificación de datos, verá todos los tipos de información confidencial. Elija Actualizar y luego encuentre el tipo de información confidencial que ha creado con la herramienta de búsqueda o explorando.
Cómo probar un tipo de información confidencial personalizado
Puede probar cualquier tipo de información confidencial en la lista. Le recomendamos que pruebe todos los tipos de información confidencial que cree antes de usarlos en una directiva.
- Prepare dos archivos, por ejemplo documentos de Word. Uno debe tener contenido que coincida con los elementos especificados en el tipo de información confidencial y el otro elementos que no coincidan.
- En el Centro de cumplimiento, vaya a Clasificación de datos > Tipos de información confidencial. Elija el tipo de información confidencial de la lista para abrir el panel de detalles y elija Probar.
- Cargue un archivo y elija Probar.
- En la página Resultados de coincidencia, revise los resultados y, después, seleccione Finalizar.
Modificar tipos personalizados de información confidencial en el Centro de cumplimiento
- En el Centro de cumplimiento, vaya a Clasificación de datos > Tipos de información confidencial. Elija el tipo de información confidencial de la lista que desee modificar y seleccione Editar.
- Puede agregar otros patrones, con elementos únicos principales y compatibles, niveles de confianza, proximidad de caracteres y comprobaciones adicionales, o editar o quitar los existentes.
Quitar tipos personalizados de información confidencial en el Centro de cumplimiento
Nota
Solo se pueden quitar los tipos personalizados de información confidencial; no se pueden quitar los tipos de información confidencial integrados.
Importante
Antes de quitar un tipo personalizado de información confidencial, asegúrese de que ninguna de las directivas DLP o reglas de flujo del correo de Exchange (también conocidas como reglas de transporte) hagan referencia al tipo de información confidencial.
- En el Centro de cumplimiento, vaya a Clasificación de datos > Tipos de información confidencial. Elija el tipo de información confidencial de la lista que desee quitar.
- En el menú desplegable que se abre, elija Eliminar.
Copiar y modificar un tipo de información confidencial existente
Use este procedimiento para crear un nuevo tipo de información confidencial que se base en un tipo de información confidencial existente.
- En el Centro de cumplimiento, vaya a Clasificación de datos > Tipos de información confidencial. Elija el tipo de información confidencial que desee copiar.
- En el menú flotante, elija Copiar.
- En la lista de tipos de información confidencial, seleccione Actualizar y examine o busque la copia que acaba de hacer. Se admite la búsqueda de cadenas parciales, por lo que puede buscar
copyy la búsqueda le devolverá todos los tipos de información confidencial con la cadenacopyen el nombre. - Rellene los valores de Nombre y Descripción y elija Siguiente.
- Elija su copia del tipo de información confidencial y seleccione Editar.
- Asigne al tipo de información confidencial un Nombre y Descripción nuevos.
- Puede elegir editar o quitar los patrones existentes y agregar otros nuevos. Elija el valor predeterminado del Nivel de confianza para el nuevo patrón. Los valores son Confianza baja, Confianza media y Confianza alta.
- Elegir y definir el Elemento principal. El elemento principal puede ser una Expresión regular, una lista de palabras clave, un diccionario de palabras clave o una de las funciones preconfiguradas. Consulte Qué buscan las funciones de DLP.
- Rellene un valor para Proximidad de caracteres.
- (Opcional) Si tiene Elementos de apoyo o Controles adicionales, agruégelos. Si es necesario, puede agrupar los Elementos de apoyo.
- Seleccione Crear.
- Elija Siguiente.
- Elija el nivel de confianza recomendado de este tipo de información confidencial.
- Revise la configuración y elija Enviar.
Nota
Estos SIT no se pueden copiar:
- Número de licencia de conducir de Canadá
- Número de licencia de conducir de la UE
- Número de identificación nacional de la UE
- Número de pasaporte de la UE
- Número de seguridad social de la UE o identificación equivalente
- Número de identificación fiscal de la UE
- Clasificación internacional de las enfermedades (ICD-10-CM)
- Clasificación internacional de las enfermedades (ICD-9-CM)
- Número de licencia de conducir de EE. UU.
También puede crear tipos de información confidencial con PowerShell y usar las funciones de coincidencia de datos exacta. Para obtener más información sobre estos métodos, vea:
- Crear un tipo personalizado de información confidencial en PowerShell del Centro de seguridad y cumplimientol
- Obtenga información sobre tipos de información confidencial basada en coincidencias de datos exactas
Más información sobre validadores de expresiones regulares
Validador de suma de comprobación
Si necesita ejecutar una suma de comprobación en un dígito de una expresión regular, puede usar el validador de suma de comprobación. Por ejemplo, diga que necesita crear un SIT para un número de licencia de ocho dígitos donde el último dígito es un dígito de suma de comprobación que se valida con un cálculo mod 9. Ha configurado el algoritmo de suma de comprobación de este tipo:
Sum = digit 1 * Weight 1 + digit 2 * weight 2 + digit 3 * weight 3 + digit 4 * weight 4 + digit 5 * weight 5 + digit 6 * weight 6 + digit 7 * weight 7 + digit 8 * weight 8 Mod value = Sum % 9 If Mod value == digit 8 Account number is valid If Mod value != digit 8 Account number is invalid
Defina el elemento principal con esta expresión regular:
\d{8}A continuación, agregue el validador de suma de comprobación.
Agregue los valores de peso separados por comas, la posición del dígito de comprobación y el valor mod. Para obtener más información sobre la operación Modulo, vea Modulo operation.
Nota
Si el dígito de comprobación no forma parte del cálculo de suma de comprobación, use 0 como el peso del dígito de comprobación. Por ejemplo, en el caso anterior, el peso 8 será igual a 0 si el dígito de comprobación no se va a usar para calcular el dígito de comprobación. Modulo_operation).

Validador de fechas
Si un valor de fecha incrustado en la expresión regular forma parte de un nuevo patrón que está creando, puede usar el validador de fechas para probar que cumple los criterios. Por ejemplo, diga que desea crear un SIT para un número de identificación de empleado de nueve dígitos. Los seis primeros dígitos son la fecha de contratación en formato DDMMYY y los tres últimos son números generados aleatoriamente. Para validar que los seis primeros dígitos tienen el formato correcto.
Defina el elemento principal con esta expresión regular:
\d{9}A continuación, agregue el validador de fecha.
Seleccione el formato de fecha y el desplazamiento de inicio. Dado que la cadena de fecha es los seis primeros dígitos, el desplazamiento es
0.

Procesadores funcionales como validadores
Puede usar procesadores de funciones para algunos de los SIT más usados como validadores. Esto le permite definir su propia expresión regular al mismo tiempo que garantiza que pasan las comprobaciones adicionales necesarias por el SIT. Por ejemplo, Func_India_Aadhar garantizará que la expresión regular personalizada definida por usted pase la lógica de validación necesaria para la tarjeta Aadhar india. Para obtener más información sobre las funciones DLP que se pueden usar como validadores, vea What the DLP functions look for.
Validador de comprobación de Luhn
Puede usar el validador de comprobación de Luhn si tiene un tipo de información confidencial personalizado que incluye una expresión regular que debe pasar el algoritmo Luhn.
Más información sobre comprobaciones adicionales
Aquí tiene las definiciones y algunos ejemplos de las comprobaciones adicionales disponibles.
Excluir coincidencias específicas: Esta comprobación le permite definir palabras clave para excluir al detectar coincidencias del patrón que esté editando. Por ejemplo, puede excluir números de prueba de tarjeta de crédito como "4111111111111111", para que no aparezcan como número válido.
Empezar o no empezar con caracteres: Esta comprobación le permite definir los caracteres con que los elementos coincidentes pueden o no pueden empezar. Por ejemplo, si quiere que el patrón detecte solo números de tarjeta de crédito que empiece con 41, 42 o 43, seleccione Empieza con y agregue 41, 42 y 43 a la lista, separados por comas.
Terminar o no terminar con caracteres: Esta comprobación le permite definir los caracteres con que los elementos coincidentes pueden o no pueden terminar. Por ejemplo, si su número de Id. de empleado no puede terminar con 0 o 1, seleccione No termina con y agregue 0 y 1 a la lista, separados por comas.
Excluir caracteres duplicados: esta comprobación le permite ignorar coincidencias en las que todos los dígitos son los mismos. Por ejemplo, si el número de Id. de empleado tiene seis dígitos y no son iguales, puede seleccionar Excluir caracteres duplicados para excluir 111111, 222222, 333333, 444444, 555555, 666666, 777777, 888888, 999999, y 000000 de la lista de coincidencias válidas para la Id. del empleado.
Incluir o excluir prefijos: Esta comprobación le permite definir las palabras clave que deben o no deben aparecer inmediatamente antes de la entidad coincidente. En función de su selección, las entidades aparecerán o no como coincidencias si son precedidas por los prefijos que incluya aquí. Por ejemplo, si Excluye el prefijo GUID:, toda entidad precedida por GUID: no se considerará una coincidencia.
Incluir o excluir sufijos: Esta comprobación le permite definir las palabras clave que deben o no deben aparecer inmediatamente después de la entidad coincidente. En función de su selección, las entidades aparecerán o no como coincidencias si aparecen seguidas de los sufijos que incluya aquí. Por ejemplo, si Excluye el sufijo GUID:, cualquier texto seguido de GUID: no se considerará una coincidencia.
Nota
Microsoft 365 Information Protection es compatible con los idiomas del juego de caracteres de doble byte para:
- Chino (simplificado)
- Chino (tradicional)
- Coreano
- Japonés
Este soporte está disponible para tipos de información confidencial. Para más información, consulte Notas de la versión sobre la compatibilidad de Information Protection con juegos de caracteres de doble byte (vista previa).
Sugerencia
Para detectar patrones que contengan caracteres chinos/japoneses y caracteres de un solo byte o para detectar patrones que contengan chino/japonés e inglés, defina dos variantes de la palabra clave o regex.
- Por ejemplo, para detectar una palabra clave como "机密的document", utilice dos variantes de la palabra clave; una con un espacio entre el texto japonés y el inglés y otra sin espacio entre el texto japonés y el inglés. Por lo tanto, las palabras clave que deben agregarse en el SIT deben ser "机密的document" y "机密的document". Del mismo modo, para detectar la frase "東京オリンピック2020", se deben utilizar dos variantes: "東京オリンピック 2020" y "東京オリンピック2020"".
Junto con los caracteres chinos/japoneses y de dos bytes, si la lista de palabras clave o frases también contiene palabras no chinas o no japonesas (solo en inglés), se recomienda crear dos diccionarios o listas de palabras clave. Uno para las palabras clave que contienen caracteres chinos, japoneses o de dos bytes; y otro solo para inglés.
- Por ejemplo, si desea crear una lista o diccionario de palabras clave con tres frases "Extremadamente confidencial", "機密性が高い" y "机密的document", deberá crear dos listas de teclado.
- Extremadamente confidencial
- 機密性が高い, 机密的document y 机密的 document
Al crear una regex que utilice un guión de doble byte o un punto de doble byte, asegúrese de escapar ambos caracteres como se escaparía un guión o un punto en una regex. A continuación le mostramos un ejemplo de regex a modo de referencia:
- (?<!\d)([4][0-9]{3}[-?\-\t]*[0-9]{4}
Se recomienda utilizar una coincidencia de cadenas en lugar de una coincidencia de palabras en una lista de palabras clave.