Obtenga información sobre los clasificadores entrenablesLearn about trainable classifiers

Clasificar y etiquetar el contenido para que pueda protegerse y controlarse correctamente es el punto de partida de la disciplina de protección de la información.Classifying and labeling content so it can be protected and handled properly is the starting place for the information protection discipline. Microsoft 365 tres maneras de clasificar el contenido.Microsoft 365 has three ways to classify content.

ManualmenteManually

Este método requiere juicio y acción humanas.This method requires human judgment and action. Un administrador puede usar las etiquetas existentes y los tipos de información confidencial o crear las suyas propias y, a continuación, publicarlas.An admin may either use the pre-existing labels and sensitive information types or create their own and then publish them. Los usuarios y administradores los aplican al contenido a medida que se encuentran con él.Users and admins apply them to content as they encounter it. A continuación, puede proteger el contenido y administrar su eliminación.You can then protect the content and manage its disposition.

Coincidencia de patrones automatizadaAutomated pattern matching

Esta categoría de mecanismos de clasificación incluye la búsqueda de contenido mediante:This category of classification mechanisms include finding content by:

Las etiquetas de confidencialidad y retención se pueden aplicar automáticamente para que el contenido esté disponible para su uso en Learn about data loss prevention) y aplicar automáticamente directivas para etiquetas de retención.Sensitivity and retention labels can then be automatically applied to make the content available for use in Learn about data loss prevention) and auto-apply polices for retention labels.

ClasificadoresClassifiers

Este método de clasificación es especialmente adecuado para el contenido que no se identifica fácilmente con los métodos de coincidencia de patrones manuales o automatizados.This classification method is particularly well suited to content that isn't easily identified by either the manual or automated pattern matching methods. Este método de clasificación consiste más en entrenar un clasificador para que identifique un elemento basándose en qué es el elemento y no en cuál es su contenido (coincidencia de patrones).This method of classification is more about training a classifier to identify an item based on what the item is, not by elements that are in the item (pattern matching). Un clasificador aprende a identificar un tipo de contenido al ver cientos de ejemplos del contenido que le interesa clasificar.A classifier learns how to identify a type of content by looking at hundreds of examples of the content you're interested in classifying. Empieza por darle ejemplos que definitivamente están en la categoría.You start by feeding it examples that are definitely in the category. Una vez que los procesa, se prueba con una combinación de ejemplos que coinciden y no coinciden.Once it processes those, you test it by giving it a mix of both matching and non-matching examples. A continuación, el clasificador realiza previsiones sobre si algún elemento determinado entra en la categoría que está creando.The classifier then makes predictions as to whether any given item falls into the category you're building. A continuación, confirme sus resultados, ordenando los verdaderos positivos, verdaderos negativos, falsos positivos y falsos negativos para ayudar a aumentar la precisión de sus previsiones.You then confirm its results, sorting out the true positives, true negatives, false positives, and false negatives to help increase the accuracy of its predictions.

Al publicar el clasificador, ordena los elementos en ubicaciones como SharePoint Online, Exchange y OneDrive, y clasifica el contenido.When you publish the classifier, it sorts through items in locations like SharePoint Online, Exchange, and OneDrive, and classifies the content. Después de publicar el clasificador, puede seguir entrenando con un proceso de comentarios similar al proceso de aprendizaje inicial.After you publish the classifier, you can continue to train it using a feedback process that is similar to the initial training process.

Dónde puede usar clasificadores entrenablesWhere you can use trainable classifiers

Tanto los clasificadores integrados como los clasificadores entrenables están disponibles como condición para el etiquetado automático de Officecon etiquetas de confidencialidad, aplicar automáticamente la directiva de etiquetas de retención según una condición y en el cumplimiento de las comunicaciones. Both built-in classifiers and trainable classifiers are available as a condition for Office autolabeling with sensitivity labels, auto-apply retention label policy based on a condition and in communication compliance.

Las etiquetas de confidencialidad pueden usar clasificadores como condiciones, vea Apply a sensitivity label to content automatically.Sensitivity labels can use classifiers as conditions, see Apply a sensitivity label to content automatically.

Importante

Los clasificadores solo funcionan con elementos que no están cifrados y están en inglés.Classifiers only work with items that are not encrypted and are in English.

Tipos de clasificadoresTypes of classifiers

  • clasificadores previamente formados: Microsoft ha creado y formado previamente una serie de clasificadores que puede empezar a usar sin entrenarlos.pre-trained classifiers - Microsoft has created and pre-trained a number of classifiers that you can start using without training them. Estos clasificadores aparecerán con el estado de Ready to use .These classifiers will appear with the status of Ready to use.
  • clasificadores personalizados: si tiene necesidades de clasificación que se extienden más allá de lo que cubren los clasificadores previamente formados, puede crear y entrenar a sus propios clasificadores.custom classifiers - If you have classification needs that extend beyond what the pre-trained classifiers cover, you can create and train your own classifiers.

Clasificadores previamente formadosPre-trained classifiers

Microsoft 365 viene con cinco clasificadores previamente formados:Microsoft 365 comes with five pre-trained classifiers:

Precaución

Estamos desaprobando el clasificador de lenguaje ofensivo previamente formado porque ha estado produciendo un gran número de falsos positivos.We are deprecating the Offensive Language pre-trained classifier because it has been producing a high number of false positives. No lo use y, si lo está usando actualmente, debe quitar los procesos empresariales de él.Don't use it and if you are currently using it, you should move your business processes off of it. Se recomienda usar los clasificadores de amenazas, profanidad y acoso previamente formados en su lugar.We recommend using the Threat, Profanity, and Harassment pre-trained classifiers instead.

  • Resumes: detecta elementos que son cuentas textuales de las cualificaciones personales, educativas, profesionales, experiencia laboral y otra información de identificación personal de un solicitanteResumes: detects items that are textual accounts of an applicant's personal, educational, professional qualifications, work experience, and other personally identifying information
  • Código fuente: detecta elementos que contienen un conjunto de instrucciones y instrucciones escritas en los 25 principales lenguajes de programación de equipos usados en GitHubSource Code: detects items that contain a set of instructions and statements written in the top 25 used computer programming languages on GitHub
    • ActionScriptActionScript
    • CC
    • C #C#
    • C++C++
    • ClojureClojure
    • CoffeeScriptCoffeeScript
    • IrGo
    • HaskellHaskell
    • JavaJava
    • JavaScriptJavaScript
    • LuaLua
    • MATLABMATLAB
    • Objective-CObjective-C
    • PerlPerl
    • PHPPHP
    • PythonPython
    • RR
    • RubyRuby
    • ScalaScala
    • ConsolaShell
    • SwiftSwift
    • TexTex
    • Vim ScriptVim Script

Nota

El código fuente está formado para detectar cuándo la mayor parte del texto es código fuente.Source Code is trained to detect when the bulk of the text is source code. No detecta texto de código fuente intercalado con texto sin formato.It does not detect source code text that is interspersed with plain text.

  • Acoso: detecta una categoría específica de elementos de texto de lenguaje ofensivo relacionados con conductas ofensivas dirigidas a una o varias personas en función de los siguientes rasgos: raza, origen étnico, religión, origen nacional, género, orientación sexual, edad, discapacidadHarassment: detects a specific category of offensive language text items related to offensive conduct targeting one or multiple individuals based on the following traits: race, ethnicity, religion, national origin, gender, sexual orientation, age, disability
  • Profanidad: detecta una categoría específica de elementos de texto de lenguaje ofensivo que contienen expresiones que ensoñan a la mayoría de las personasProfanity: detects a specific category of offensive language text items that contain expressions that embarrass most people
  • Amenaza: detecta una categoría específica de elementos de texto de lenguaje ofensivo relacionados con amenazas para cometer violencia o hacer daño físico o daño a una persona o propiedadThreat: detects a specific category of offensive language text items related to threats to commit violence or do physical harm or damage to a person or property

Aparecen en la vista Clasificadores Microsoft 365 de datos del centro de cumplimiento > > con el estado de Ready to use .These appear in the Microsoft 365 compliance center > Data classification > Trainable classifiers view with the status of Ready to use.

clasificadores-clasificadores previamente formados

Importante

Tenga en cuenta que el lenguaje ofensivo, el acoso, la profanación y los clasificadores de amenazas solo funcionan con texto que se puede buscar no son exhaustivos ni completos.Please note that the offensive language, harassment, profanity, and threat classifiers only work with searchable text are not exhaustive or complete. Además, los estándares lingüísticos y culturales cambian continuamente y, a la luz de estas realidades, Microsoft se reserva el derecho de actualizar estos clasificadores a su discreción.Further, language and cultural standards continually change, and in light of these realities, Microsoft reserves the right to update these classifiers in its discretion. Aunque los clasificadores pueden ayudar a su organización a supervisar la ofensiva y otro idioma usado, los clasificadores no abordan las consecuencias de dicho idioma y no están destinados a proporcionar los únicos medios de su organización para supervisar o responder al uso de dicho idioma.While the classifiers may assist your organization in monitoring offensive and other language used, the classifiers do not address consequences of such language and are not intended to provide your organization's sole means of monitoring or responding to the use of such language. Su organización, y no Microsoft o sus subsidiarias, sigue siendo responsable de todas las decisiones relacionadas con la supervisión, la aplicación, el bloqueo, la eliminación y la retención de cualquier contenido identificado por un clasificador previamente formado.Your organization, and not Microsoft or its subsidiaries, remains responsible for all decisions related to monitoring, enforcement, blocking, removal and retention of any content identified by a pre-trained classifier.

Clasificadores personalizadosCustom classifiers

Cuando los clasificadores previamente formados no satisfacen sus necesidades, puede crear y entrenar a sus propios clasificadores.When the pre-trained classifiers don't meet your needs, you can create and train your own classifiers. Hay mucho más trabajo implicado en la creación de los suyos, pero estarán mucho mejor adaptados a las necesidades de las organizaciones.There's significantly more work involved with creating your own, but they'll be much better tailored to your organizations needs.

Por ejemplo, podría crear clasificadores que se puedan entrenar para:For example you could create trainable classifiers for:

  • Documentos legales, como privilegios de cliente de abogado, conjuntos de cierre, declaración de trabajoLegal documents - such as attorney client privilege, closing sets, statement of work
  • Documentos de negocio estratégicos: como comunicados de prensa, fusiones y adquisiciones, acuerdos, planes de negocio o marketing, propiedad intelectual, patentes, documentos de diseñoStrategic business documents - like press releases, merger and acquisition, deals, business or marketing plans, intellectual property, patents, design docs
  • Información de precios: como facturas, cotizaciones de precios, pedidos de trabajo, documentos de ofertasPricing information - like invoices, price quotes, work orders, bidding documents
  • Información financiera, como inversiones organizativas, resultados trimestrales o anualesFinancial information - such as organizational investments, quarterly or annual results

Flujo de proceso para crear clasificadores personalizadosProcess flow for creating custom classifiers

La creación y publicación de un clasificador para su uso en soluciones de cumplimiento, como directivas de retención y supervisión de comunicaciones, sigue este flujo.Creating and publishing a classifier for use in compliance solutions, such as retention policies and communication supervision, follows this flow. Para obtener más información sobre cómo crear un clasificador personalizado, vea Creating a custom classifier.For more detail on creating a custom trainable classifier see, Creating a custom classifier.

clasificador personalizado de flujo de proceso

Reentrenamiento de clasificadoresRetraining classifiers

Puede ayudar a mejorar la precisión de todos los clasificadores personalizados y algunos clasificadores previamente formados al proporcionarles comentarios sobre la precisión de la clasificación que realizan.You can help improve the accuracy of all custom classifiers and some pre-trained classifiers by providing them with feedback on the accuracy of the classification that they perform. Esto se denomina reciclaje y seguir este flujo de trabajo.This is called retraining and follow this workflow.

Flujo de trabajo de reciclaje de clasificadores

Vea tambiénSee also