Creación de huella digital de documento

Se aplica a: Exchange Server 2013

Los trabajadores de la información en su organización tratan con diversos tipos de información confidencial durante un día normal. La huella digital de documentos facilita la protección de esta información mediante la identificación de formularios estándar que se usan en toda la organización. En este tema se describen los conceptos detrás de la creación de huella digital de documento. Si quiere aprender a crear una huella digital de documento, consulte Proteger los datos de formulario con huellas digitales de documentos.

Escenario básico para la creación de huella digital de documento

La huella digital de documentos es una característica de prevención de pérdida de datos (DLP) que convierte un formulario estándar en un tipo de información confidencial, que puede usar para definir reglas de transporte y directivas DLP. Por ejemplo, puede crear una huella digital de documento con base en una plantilla de patente en blanco y después crear una directiva DLP que detecte y bloquee todas las plantillas de patente salientes que incluyan contenido confidencial. Opcionalmente, puede configurar Sugerencias de directiva para notificar a los remitentes que podrían estar enviando información confidencial, y que el remitente deba comprobar que los destinatarios están calificados para recibir las patentes. Este proceso funciona con cualquier formulario basado en texto que se use en la organización. Algunos ejemplos adicionales de formularios que puede cargar son:

  • Formularios de gobierno

  • Formularios de cumplimiento de Health Insurance Portability and Accountability Act (HIPAA)

  • Formularios de información sobre empleados para los departamentos de recursos humanos

  • Formularios personalizados creados específicamente para la organización

Idealmente, la organización ya tiene una práctica de negocios establecida sobre el uso de determinados formularios para transmitir información confidencial. Tras cargar un formulario vacío para que se convierta en una huella digital de documento y se configure una directiva correspondiente, el agente de DLP detectará cualquier documento en el correo saliente que coincida con esa huella digital.

Funcionamiento de la creación de huella digital de documento

Probablemente ya adivinó que los documentos no tienen huellas digitales reales, pero el nombre ayuda a explicar la característica. Del mismo modo que las huellas digitales de una persona tienen patrones únicos, los documentos tienen patrones de palabras únicos. Cuando carga un archivo, el agente de DLP identifica el patrón de palabras único del documento, crea una huella digital de documento con base en dicho patrón y la usa para detectar documentos salientes que contenga el mismo patrón. Por ello, la carga de un formulario o plantilla crea el tipo más efectivo de huella digital de documento. Todas las personas que rellenan un formulario usan el mismo conjunto de palabras original y después agregan sus propias palabras al documento. Siempre y cuando el documento saliente no esté protegido por contraseña y tenga todo el texto del formulario original, el agente de DLP puede determinar si el documento coincide con la huella digital de documento.

El siguiente ejemplo muestra qué sucede si crea una huella digital de documento con base en una plantilla de patente, pero puede usar cualquier formulario como base para crear una huella digital de documento.

Un documento de patente que coincida con una huella digital del documento.

La plantilla de patente contiene los campos en blanco "Título de patente", "Inventores" y "Descripción" y descripciones para cada uno de esos campos, que es el patrón de palabra. Al cargar la plantilla de patente original, se encuentra en uno de los tipos de archivo admitidos y en texto sin formato. El agente DLP usa un algoritmo para convertir este patrón de palabra en una huella digital del documento, que es un pequeño archivo XML Unicode que contiene un valor hash único que representa el texto original, y la huella digital se guarda como una clasificación de datos en Active Directory. (Como medida de seguridad, el propio documento original no se almacena en el servicio; solo se almacena el valor hash y el documento original no se puede reconstruir a partir del valor hash). A continuación, la huella digital de patente se convierte en un tipo de información confidencial que puede asociar a una directiva DLP. Después de asociar la huella digital a una directiva DLP, el agente DLP detecta los correos electrónicos salientes que contienen documentos que coinciden con la huella digital de la patente y los trata según la directiva de su organización. Por ejemplo, es posible que desee configurar una directiva DLP que impida que los empleados regulares envíen mensajes salientes que contengan patentes. El agente DLP usará la huella digital de patente para detectar patentes y bloquear esos correos electrónicos. Como alternativa, es posible que quiera permitir que su departamento legal pueda enviar patentes a otras organizaciones porque tiene una necesidad empresarial para hacerlo. Puede permitir que departamentos específicos envíen información confidencial mediante la creación de excepciones para esos departamentos en la directiva DLP, o bien puede permitirles invalidar una sugerencia de directiva con una justificación empresarial. Para obtener información más detallada sobre cómo crear reglas de directiva DLP y excepciones, vea Procedimientos DLP y para obtener más información sobre cómo configurar sugerencias de directiva que los usuarios pueden invalidar, consulte Sugerencias de directivas en Exchange 2013.

Tipos de archivo compatibles

Creación de huella digital de documento admite los mismos tipos de archivo que se admiten en las reglas de transporte. Para obtener una lista de los tipos de archivo admitidos, consulte Tipos de archivo admitidos para la inspección de contenido de reglas de transporte. Nota rápida sobre los tipos de archivo: ni las reglas de transporte ni la creación de huella digital de documento admiten el tipo de archivo .dotx, lo cual puede resultar confuso porque es un archivo de plantilla de Word. Cuando ve la palabra "plantilla" en este y otros temas de creación de huella digital de documento, se refiere a un documento que se ha establecido como formulario estándar, no al tipo de archivo de plantilla.

Limitaciones de la creación de huella digital de documento

El agente de DLP de la creación de huella digital de documento no detectará información confidencial en los siguientes casos:

  • Archivos protegidos por contraseña

  • Archivos que solo contienen imágenes

  • Documentos que no contienen todo el texto del formulario original utilizado para crear la huella digital de documento

Más información

Proteger los datos de formulario con huellas digitales de documentos

Integración de las reglas de información confidencial con las reglas de transporte

Procedimientos de DLP