Obtener más información acerca de los tipos de información confidencialLearn about sensitive information types

Identificar y clasificar elementos confidenciales que están bajo el control de las organizaciones es el primer paso de la disciplina de Protección de la información.Identifying and classifying sensitive items that are under your organizations control is the first step in the Information Protection discipline. Microsoft 365 proporciona tres formas de identificar elementos para que se puedan clasificar:Microsoft 365 provides three ways of identifying items so that they can be classified:

  • manualmente por los usuariosmanually by users
  • reconocimiento automatizado de patrones, como tipos de información confidencialautomated pattern recognition, like sensitive information types
  • aprendizaje automáticomachine learning

Los tipos de información confidencial son clasificadores basados en patrones.Sensitive information types are pattern-based classifiers. Detectan información confidencial como seguridad social, tarjeta de crédito o números de cuenta bancaria para identificar elementos confidenciales, consulte Definiciones de entidades de tipos de información confidencialThey detect sensitive information like social security, credit card, or bank account numbers to identify sensitive items, see Sensitive information types entity definitions

Los tipos de información confidencial se usan enSensitive information types are used in

Partes fundamentales de un tipo de información confidencialFundamental parts of a sensitive information type

Cada entidad de tipo de información confidencial se define mediante estos campos:Every sensitive information type entity is defined by these fields:

  • nombre: cómo se hace referencia al tipo de información confidencialname: how the sensitive information type is referred to
  • descripción: describe lo que busca el tipo de información confidencialdescription: describes what the sensitive information type is looking for
  • patrón: un patrón define lo que detecta un tipo de información confidencial.pattern: A pattern defines what a sensitive information type detects. Consta de los siguientes componentesIt consists of the following components
    • Elemento principal: el elemento principal que busca el tipo de información confidencial.Primary element – the main element that the sensitive information type is looking for. Puede ser una expresión regular con o sin una validación de suma de comprobación, una lista de palabras clave, un diccionario de palabras clave o una función.It can be a regular expression with or without a checksum validation, a keyword list, a keyword dictionary, or a function.
    • Elemento de soporte: elementos que actúan como pruebas de soporte que ayudan a aumentar la confianza de la coincidencia.Supporting element – elements that act as supporting evidence that help in increasing the confidence of the match. Por ejemplo, la palabra clave "SSN" cerca de un número SSN.For example, keyword “SSN” in proximity of an SSN number. Puede ser una expresión regular con o sin validación de suma de comprobación, lista de palabras clave, diccionario de palabras clave.It can be a regular expression with or without a checksum validation, keyword list, keyword dictionary.
    • Nivel de confianza: los niveles de confianza (altos, medianos, bajos) reflejan la cantidad de evidencia de soporte que se detectó junto con el elemento principal.Confidence Level - Confidence levels (high, medium, low) reflect how much supporting evidence was detected along with the primary element. Cuanto más evidencia de soporte técnico contenga un elemento, mayor será la confianza de que un elemento coincidente contenga la información confidencial que está buscando.The more supporting evidence an item contains, the higher the confidence that a matched item contains the sensitive info you're looking for.
    • Proximidad: número de caracteres entre el elemento principal y el elemento de soporte técnicoProximity – Number of characters between primary and supporting element

Diagrama de prueba corroboradora y ventana de proximidad

Obtenga más información sobre los niveles de confianza en este vídeoLearn more about confidence levels in this video

Tipo de información confidencial de ejemploExample sensitive information type

Número de identidad nacional (DNI) de ArgentinaArgentina national identity (DNI) number

FormatoFormat

Ocho dígitos separados por puntosEight digits separated by periods

PatrónPattern

Ocho dígitos:Eight digits:

  • dos dígitostwo digits
  • un puntoa period
  • tres dígitosthree digits
  • un puntoa period
  • tres dígitosthree digits

Suma de comprobaciónChecksum

NoNo

DefiniciónDefinition

Una directiva DLP tiene confianza mediana en que se ha detectado este tipo de información confidencial si, en una proximidad de 300 caracteres:A DLP policy has medium confidence that it's detected this type of sensitive information if, within a proximity of 300 characters:

  • La expresión regular Regex_argentina_national_id encuentra contenido que coincide con el patrón.The regular expression Regex_argentina_national_id finds content that matches the pattern.
  • Se encuentra una palabra clave de Keyword_argentina_national_id.A keyword from Keyword_argentina_national_id is found.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Palabras claveKeywords

Keyword_argentina_national_idKeyword_argentina_national_id

  • Número de identidad nacional de ArgentinaArgentina National Identity number
  • IdentidadIdentity
  • Identificación tarjeta de identidad nacionalIdentification National Identity Card
  • DNIDNI
  • Registro nacional de personas de NICNIC National Registry of Persons
  • Documento Nacional de IdentidadDocumento Nacional de Identidad
  • Registro nacional de las personasRegistro Nacional de las Personas
  • IdentidadIdentidad
  • IdentificaciónIdentificación

Más información sobre los niveles de confianzaMore on confidence levels

En una definición de entidad de tipo de información confidencial, el nivel de confianza refleja la cantidad de evidencia compatible que se detecta además del elemento principal.In a sensitive information type entity definition, confidence level reflects how much supporting evidence is detected in addition to the primary element. Cuanto más evidencia de soporte técnico contenga un elemento, mayor será la confianza de que un elemento coincidente contenga la información confidencial que está buscando.The more supporting evidence an item contains, the higher the confidence that a matched item contains the sensitive info you're looking for. Por ejemplo, las coincidencias con un nivel de confianza alto contendrán evidencias más compatibles cerca del elemento principal, mientras que las coincidencias con un nivel de confianza bajo contendrán poca o ninguna evidencia compatible en proximidad.For example, matches with a high confidence level will contain more supporting evidence in close proximity of the primary element, whereas matches with a low confidence level would contain little to no supporting evidence in close proximity.

Un nivel de confianza alto devuelve el menor número de falsos positivos, pero puede dar como resultado más falsos negativos.A high confidence level returns the fewest false positives but might result in more false negatives. Los niveles de confianza bajos o medianos devuelven más falsos positivos, pero de pocos a cero falsos negativos.Low or medium confidence levels returns more false positives but few to zero false negatives.

  • confianza baja: valor de 65, los elementos coincidentes contendrán el menor número de falsos negativos, pero los más falsos positivos.low confidence: Value of 65, matched items will contain the fewest false negatives but the most false positives. La confianza baja devuelve todas las coincidencias de confianza baja, media y alta.Low confidence returns all low, medium, and high confidence matches.
  • confianza media: valor de 75, los elementos coincidentes contendrán una cantidad promedio de falsos positivos y falsos negativos.medium confidence: Value of 75, matched items will contain an average amount of false positives and false negatives. La confianza media devuelve todas las coincidencias de confianza media y alta.Medium confidence returns all medium, and high confidence matches.
  • elevada confianza: valor de 85, los elementos coincidentes contendrán el menor número de falsos positivos, pero los negativos más falsos.high confidence: Value of 85, matched items will contain the fewest false positives but the most false negatives. La confianza alta solo devuelve coincidencias de confianza alta.High confidence only returns high confidence matches.

Debe usar patrones de alto nivel de confianza con recuentos bajos, por ejemplo, de cinco a diez, y patrones de confianza bajos con recuentos más altos, por ejemplo, 20 o más.You should use high confidence level patterns with low counts, say five to ten, and low confidence patterns with higher counts, say 20 or more.

Nota

Si tiene directivas existentes o tipos de información confidencial personalizados (SIT) definidos con niveles de confianza basados en números (también conocidos como precisión), se asignarán automáticamente a los tres niveles de confianza discretos; confianza baja, confianza media y confianza alta, en toda la interfaz de usuario del Centro de seguridad y cumplimiento.If you have existing policies or custom sensitive information types (SITs) defined using number-based confidence levels (also know as accuracy), they will automatically be mapped to the three discrete confidence levels; low confidence, medium confidence, and high confidence, across the Security @ Compliance Center UI.

  • Todas las directivas con precisión mínima o patrones SIT personalizados con niveles de confianza de entre 76 y 100 se asignarán a una elevada confianza.All policies with minimum accuracy or custom SIT patterns with confidence levels of between 76 and 100 will be mapped to high confidence.
  • Todas las directivas con precisión mínima o patrones SIT personalizados con niveles de confianza de entre 66 y 75 se asignarán a confianza mediana.All policies with minimum accuracy or custom SIT patterns with confidence levels of between 66 and 75 will be mapped to medium confidence.
  • Todas las directivas con precisión mínima o patrones SIT personalizados con niveles de confianza inferiores o iguales a 65 se asignarán a una confianza baja.All policies with minimum accuracy or custom SIT patterns with confidence levels less than or equal to 65 will be mapped to low confidence.

Crear tipos de información confidencial personalizadosCreating custom sensitive information types

Para crear tipos de información confidencial personalizados en el Centro de seguridad y cumplimiento, puede elegir una de estas opciones:To create custom sensitive information types in the Security & Compliance Center, you can choose from several options:

Nota

Los niveles de confianza mejorados están disponibles para su uso inmediato en Prevención de pérdida de datos para servicios Microsoft 365, Microsoft Information Protection para servicios Microsoft 365, Cumplimiento de comunicaciones, Gobierno de la información y Administración de registros.Improved confidence levels are available for immediate use within Data Loss Prevention for Microsoft 365 services, Microsoft Information Protection for Microsoft 365 services, Communication Compliance, Information Governance, and Records Management.

Microsoft 365 Information Protection ahora es compatible con la vista previa de idiomas con conjunto de caracteres de doble byte para:Microsoft 365 Information Protection now supports in preview double byte character set languages for:

  • Chino (simplificado)Chinese (simplified)
  • Chino (tradicional)Chinese (traditional)
  • CoreanoKorean
  • JaponésJapanese

Este soporte está disponible para tipos de información confidencial.This support is available for sensitive information types. Para más información, consulte Notas de la versión sobre la compatibilidad de Information Protection con juegos de caracteres de doble byte (vista previa).See, Information protection support for double byte character sets release notes (preview) for more information.

Para obtener más informaciónFor further information

Para obtener información sobre cómo usar tipos de información confidencial para cumplir con las normativas de privacidad de datos, vea Deploy information protection for data privacy regulations with Microsoft 365 (aka.ms/m365dataprivacy).To learn how to use sensitive information types to comply with data privacy regulations, see Deploy information protection for data privacy regulations with Microsoft 365 (aka.ms/m365dataprivacy).