Introducción a los clasificadores que se pueden entrenar
Un Microsoft 365 clasificador que se puede entrenar es una herramienta que puede entrenar para reconocer varios tipos de contenido, ya que le proporciona ejemplos para que los vea. Una vez formado, puede usarlo para identificar el elemento para la aplicación de etiquetas de Office de confidencialidad, directivas de cumplimiento de comunicaciones y directivas de etiquetas de retención.
Crear un clasificador personalizado para entrenar primero implica darle muestras que son humanas seleccionada y coinciden positivamente con la categoría. A continuación, después de procesarlos, se prueba la capacidad de los clasificadores para predecir al darle una combinación de muestras positivas y negativas. En este artículo se muestra cómo crear y entrenar un clasificador personalizado y cómo mejorar el rendimiento de clasificadores personalizados y clasificadores previamente formados a lo largo de su vida a través de la readaptación.
Para obtener más información sobre los diferentes tipos de clasificadores, vea Learn about trainable classifiers.
Vea este vídeo para ver un resumen rápido de la creación de un clasificador que se puede entrenar. Todavía tendrá que leer este artículo completo para obtener los detalles.
Requisitos previos
Requisitos de licencias
Los clasificadores son una característica Microsoft 365 E5 o cumplimiento de E5. Debe tener una de estas suscripciones para poder usarlas.
Permisos
Para obtener acceso a clasificadores en la interfaz de usuario:
- El administrador global debe participar para que el inquilino cree clasificadores personalizados.
- El rol Administrador de cumplimiento es necesario para entrenar a un clasificador.
Necesitará cuentas con estos permisos para usar clasificadores en estos escenarios:
- Escenario de directiva de etiqueta de retención: roles de administración de registros y administración de retención
- Escenario de directiva de etiqueta de confidencialidad: Administrador de seguridad, Administrador de cumplimiento, Administrador de datos de cumplimiento
- Escenario de directiva de cumplimiento de comunicaciones: Administrador de administración de riesgos de Insider, Administrador de revisión de supervisión
Importante
De forma predeterminada, solo el usuario que crea un clasificador personalizado puede entrenar y revisar las previsiones realizadas por ese clasificador.
Prepararse para un clasificador personalizado que se puede entrenar
Es útil comprender lo que implica la creación de un clasificador personalizado para entrenar antes de profundizar.
Escala de tiempo
Esta escala de tiempo refleja una implementación de ejemplo de clasificadores entrenables.

Sugerencia
El opt-in es necesario la primera vez para clasificadores que se pueden entrenar. El proceso tarda doce días Microsoft 365 completar una evaluación de línea base del contenido de la organización. Póngase en contacto con el administrador global para iniciar el proceso de suscripción.
Flujo de trabajo general
Para obtener más información sobre el flujo de trabajo general de creación de clasificadores personalizados, vea Process flow for creating customer trainable classifiers.
Contenido de la ed.
Cuando desea que un clasificador entrenable identifique de forma independiente y precisa un elemento como una categoría concreta de contenido, primero debe presentarlo con muchas muestras del tipo de contenido que hay en la categoría. Esta alimentación de muestras al clasificador que se puede entrenar se conoce como edificación. Un humano selecciona el contenido de la seed y se considera que representa la categoría de contenido.
Sugerencia
Debe tener al menos 50 muestras positivas y hasta 500. El clasificador que se puede entrenar procesará hasta los 500 ejemplos creados más recientes (por marca de fecha y hora creada por archivo). Entre más muestras proporciones, más precisas serán las previsiones que realizará el clasificador.
Probar contenido
Una vez que el clasificador capacitado haya procesado suficientes ejemplos positivos para crear un modelo de predicción, debe probar las previsiones que realiza para ver si el clasificador puede distinguir correctamente entre los elementos que coinciden con la categoría y los elementos que no lo hacen. Para ello, selecciona otro conjunto de contenido seleccionado por humanos, que se espera que sea más grande, que consta de muestras que deben incluirse en la categoría y muestras que no lo hagan. Debe probar con datos diferentes a los datos iniciales de inicialización que proporcionó por primera vez. Una vez que los procesa, se pasan manualmente por los resultados y se comprueba si cada predicción es correcta, incorrecta o no está seguro. El clasificador que puede entrenar usa estos comentarios para mejorar su modelo de predicción.
Sugerencia
Para obtener mejores resultados, tenga al menos 200 elementos en el conjunto de muestras de prueba con una distribución uniforme de coincidencias positivas y negativas.
Cómo crear un clasificador que se puede entrenar
Recopilar entre 50 y 500 elementos de contenido de ed. Estos deben ser solo ejemplos que representen fuertemente el tipo de contenido que desea que el clasificador capacitado identifique positivamente como en la categoría de clasificación. Consulte Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.
Importante
Asegúrese de que los elementos del conjunto de posiciones son ejemplos sólidos de la categoría. El clasificador que se puede entrenar crea inicialmente su modelo en función de con qué lo edificó. El clasificador asume que todas las muestras de ed.0 son positivos fuertes y no tiene forma de saber si una muestra es una coincidencia débil o negativa con la categoría.
Coloque el contenido de la ed.ed en una carpeta SharePoint Online dedicada a mantener el contenido de la ed. Anote la dirección URL del sitio, la biblioteca y la carpeta.
Sugerencia
Si crea un nuevo sitio y una carpeta para los datos de edificadores, permita al menos una hora para que esa ubicación se indexe antes de crear el clasificador que se puede entrenar que usará los datos de ed.
Inicie sesión para iniciar sesión Centro de cumplimiento de Microsoft 365 acceso al rol de administrador de seguridad o administrador de cumplimiento y abrir Centro de cumplimiento de Microsoft 365 o Microsoft 365 Defender clasificación de datos del portal > ****.
Elija la pestaña Clasificadores que se pueden entrenar.
Elija Create trainable classifier.
Rellene los valores adecuados para los campos y de la categoría de elementos que desea que identifique este
NameDescriptionclasificador entrenable.Elija la dirección URL SharePoint sitio, biblioteca y carpeta en línea para el sitio de contenido de ed. del paso 2. Elija
Add.Revise la configuración y elija
Create trainable classifier.En un plazo de 24 horas, el clasificador que se puede entrenar procesará los datos de ed. y compilará un modelo de predicción. El estado del clasificador
In progresses mientras procesa los datos de ed. Cuando el clasificador termina de procesar los datos de ed.Need test itemsAhora puede ver la página de detalles eligiendo el clasificador.

Recopile al menos 200 elementos de contenido de prueba (10 000 como máximo) para obtener mejores resultados. Estos deben ser una combinación de elementos que son positivos fuertes, negativos fuertes y algunos que son un poco menos obvios en su naturaleza. Consulte Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.
Coloque el contenido de prueba en una carpeta SharePoint Online dedicada a mantener el contenido de prueba solo. Anote la dirección URL SharePoint sitio, biblioteca y carpeta en línea.
Sugerencia
Si crea un nuevo sitio y una carpeta para los datos de prueba, permita al menos una hora para que esa ubicación se indexe antes de crear el clasificador que se puede entrenar que usará los datos de ed.
Elija
Add items to test.Elija la dirección URL SharePoint sitio, biblioteca y carpeta en línea para el sitio de contenido de prueba del paso 12. Elija
Add.Para finalizar el asistente, elija
Done. El clasificador que se puede entrenar llevará hasta una hora procesar los archivos de prueba.Cuando el clasificador capacitado termine de procesar los archivos de prueba, el estado de la página de detalles cambiará a
Ready to review. Si necesita aumentar el tamaño de la muestra de prueba, elija y permita que el clasificador capacitadoAdd items to testprocese los elementos adicionales.
Elija
Tested items to reviewla pestaña para revisar los elementos.Microsoft 365 presentará 30 elementos a la vez. Repase y, en
We predict this item is "Relevant". Do you agree?el cuadro,Yeselija oNoNot sure, skip to next item. La precisión del modelo se actualiza automáticamente después de cada 30 elementos.
Revise al menos 200 elementos. Una vez estabilizada la puntuación de precisión, la opción de publicación estará disponible y el estado del clasificador dirá
Ready to use.
Publique el clasificador.
Una vez publicado, el clasificador estará disponible como condición en Office autoetiquetecon etiquetas de confidencialidad, aplicar automáticamente la directiva de etiqueta de retención según una condición y en cumplimiento de comunicaciones.