Per iniziare con i classificatori sottoponibili a training
Un classificatore sottoponibile a training di Microsoft 365 è uno strumento per eseguire il training per riconoscere vari tipi di contenuto fornendogli esempi da esaminare. Dopo il training, è possibile usarlo per identificare l'elemento per l'applicazione delle etichette di riservatezza di Office, dei criteri di conformità delle comunicazioni e dei criteri delle etichette di conservazione.
La creazione di un classificatore sottoponibile a training personalizzato comporta innanzitutto l'esecuzione di esempi che sono selezionati e corrispondono in modo positivo alla categoria. Quindi, dopo che sono stati elaborati, si testa la capacità dei classificatori di stimare fornendo una combinazione di campioni positivi e negativi. Questo articolo illustra come creare ed eseguire il training di un classificatore personalizzato e come migliorare le prestazioni dei classificatori sottoponibili a training personalizzati e dei classificatori con training preliminare nel corso della loro durata attraverso la ripetizione del training.
Per altre informazioni sui diversi tipi di classificatori, vedere Informazioni sui classificatori sottoponibili a training.
Guardare questo video per un breve riepilogo della creazione di un classificatore sottoponibile a training. Per ottenere i dettagli, è comunque necessario leggere questo articolo completo.
Prerequisiti
Requisiti di licenza
I classificatori sono una funzionalità di conformità Microsoft 365 E5 o E5. È necessario disporre di una di queste sottoscrizioni per usarle.
Autorizzazioni
Per accedere ai classificatori nell'interfaccia utente:
- L'amministratore globale deve acconsentire esplicitamente al tenant per creare classificatori personalizzati.
- Il ruolo Amministratore conformità è necessario per eseguire il training di un classificatore.
Sono necessari account con queste autorizzazioni per usare classificatori in questi scenari:
- Scenario dei criteri delle etichette di conservazione: ruoli Gestione record e Gestione conservazione
- Scenario dei criteri dell'etichetta di riservatezza: Amministratore sicurezza, Amministratore conformità, Amministratore dati conformità
- Scenario dei criteri di conformità delle comunicazioni: Insider Risk Management Amministrazione, Amministratore revisione supervisione
Importante
Per impostazione predefinita, solo l'utente che crea un classificatore personalizzato può eseguire il training e la revisione delle stime effettuate da tale classificatore.
Preparare un classificatore sottoponibile a training personalizzato
È utile comprendere cosa comporta la creazione di un classificatore sottoponibile a training personalizzato prima di iniziare.
Sequenza temporale
Questa sequenza temporale riflette una distribuzione di esempio di classificatori sottoponibili a training.

Suggerimento
Il consenso esplicito è necessario la prima volta per i classificatori sottoponibili a training. Sono necessari dodici giorni prima che Microsoft 365 completi una valutazione di base del contenuto dell'organizzazione. Contattare l'amministratore globale per avviare il processo di consenso esplicito.
Flusso di lavoro complessivo
Per altre informazioni sul flusso di lavoro complessivo della creazione di classificatori sottoponibili a training personalizzati, vedere Flusso di processo per la creazione di classificatori sottoponibili a training personalizzati.
Contenuto di inizializzazione
Quando si vuole che un classificatore sottoponibile a training possa identificare in modo indipendente e accurato un elemento come in una particolare categoria di contenuto, è prima necessario presentarlo con molti esempi del tipo di contenuto che si trovano nella categoria. Questa alimentazione dei campioni al classificatore sottoponibile al training è nota come seeding. Il contenuto di inizializzazione viene selezionato da un utente e viene giudicato come la categoria di contenuto.
Suggerimento
È necessario avere almeno 50 campioni positivi e fino a 500. Il classificatore sottoponibile al training estrarrà fino ai 500 esempi creati più di recente (in base al timestamp di data/ora creato dal file). Maggiore è il numero di esempi forniti, maggiore sarà la precisione delle stime effettuate dal classificatore.
Test del contenuto
Dopo che il classificatore sottoponibile al training ha elaborato campioni positivi sufficienti per compilare un modello di stima, è necessario testare le stime eseguite per verificare se il classificatore è in grado di distinguere correttamente tra gli elementi che corrispondono alla categoria e gli elementi che non lo fanno. A tale scopo, è possibile selezionare un altro set, si spera più grande, di contenuto selezionato dall'utente costituito da esempi che dovrebbero rientrare nella categoria e campioni che non lo faranno. È consigliabile eseguire il test con dati diversi rispetto ai dati di inizializzazione iniziali specificati per la prima volta. Una volta elaborati, è possibile esaminare manualmente i risultati e verificare se ogni stima è corretta, errata o non si è sicuri. Il classificatore sottoponibile a training usa questo feedback per migliorare il modello di stima.
Suggerimento
Per ottenere risultati ottimali, avere almeno 200 elementi nel set di campioni di test con una distribuzione uniforme di corrispondenze positive e negative.
Come creare un classificatore sottoponibile a training
Raccogliere tra 50-500 elementi di contenuto di inizializzazione. Questi devono essere solo esempi che rappresentano fortemente il tipo di contenuto che il classificatore sottoponibile al training deve identificare positivamente come nella categoria di classificazione. Vedere estensioni di file sottoposte a ricerca per indicizzazione predefinite e tipi di file analizzati in SharePoint Server per i tipi di file supportati.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.
Importante
Assicurarsi che gli elementi nel set di inizializzazioni siano esempi validi della categoria. Il classificatore sottoponibile a training compila inizialmente il modello in base al valore di inizializzazione. Il classificatore presuppone che tutti i campioni di inizializzazione siano positivi forti e non abbia modo di sapere se un campione è una corrispondenza debole o negativa alla categoria.
Inserire il contenuto di inizializzazione in una cartella di SharePoint Online dedicata solo al contenuto di inizializzazione. Prendere nota dell'URL del sito, della raccolta e della cartella.
Suggerimento
Se si crea un nuovo sito e una nuova cartella per i dati di inizializzazione, consentire l'indicizzazione di almeno un'ora per tale percorso prima di creare il classificatore sottoponibile al training che userà i dati di inizializzazione.
Accedere a Portale di conformità di Microsoft Purview con l'accesso al ruolo amministratore di conformità o amministratore della sicurezza e aprire Portale di conformità di Microsoft Purview o il portale > di Microsoft 365 Defender Classificazione dei dati.
Scegliere la scheda Classificatori sottoponibili a training .
Scegliere Crea classificatore sottoponibile a training.
Compilare i valori appropriati per i
Namecampi eDescriptiondella categoria di elementi che si vuole identificare da questo classificatore sottoponibile a training.Selezionare il sito, la raccolta e l'URL della cartella di SharePoint Online per il sito di contenuto di inizializzazione dal passaggio 2. Scegliere
Add.Esaminare le impostazioni e scegliere
Create trainable classifier.Entro 24 ore il classificatore sottoponibile al training elabora i dati di inizializzazione e compila un modello di stima. Lo stato del classificatore è
In progressmentre elabora i dati di inizializzazione. Al termine dell'elaborazione dei dati di inizializzazione, il classificatore cambia inNeed test items.È ora possibile visualizzare la pagina dei dettagli scegliendo il classificatore.

Raccogliere almeno 200 elementi di contenuto di test (massimo 10.000) per ottenere risultati ottimali. Questi dovrebbero essere un mix di elementi che sono forti positivi, negativi forti e alcuni che sono un po 'meno evidenti nella loro natura. Vedere estensioni di file sottoposte a ricerca per indicizzazione predefinite e tipi di file analizzati in SharePoint Server per i tipi di file supportati.See, Default crawled file name extensions and parsed file types in SharePoint Server for the supported file types.
Inserire il contenuto di test in una cartella di SharePoint Online dedicata solo al contenuto di test. Prendere nota dell'URL del sito, della raccolta e della cartella di SharePoint Online.
Suggerimento
Se si crea un nuovo sito e una nuova cartella per i dati di test, consentire l'indicizzazione di almeno un'ora per tale percorso prima di creare il classificatore sottoponibile al training che userà i dati di inizializzazione.
Scegliere
Add items to test.Selezionare il sito, la raccolta e l'URL della cartella di SharePoint Online per il sito di contenuto di test dal passaggio 12. Scegliere
Add.Completare la procedura guidata scegliendo
Done. Il classificatore sottoponibile al training richiederà fino a un'ora per elaborare i file di test.Al termine dell'elaborazione dei file di test da parte del classificatore sottoponibile al training, lo stato nella pagina dei dettagli verrà modificato in
Ready to review. Se è necessario aumentare le dimensioni dell'esempio di test, scegliereAdd items to teste consentire al classificatore sottoponibile al training di elaborare gli elementi aggiuntivi.
Scegliere
Tested items to reviewla scheda per esaminare gli elementi.Microsoft 365 presenterà 30 elementi alla volta. Esaminarli e nella
We predict this item is "Relevant". Do you agree?casella scegliereYesoNooNot sure, skip to next item. L'accuratezza del modello viene aggiornata automaticamente dopo ogni 30 elementi.
Esaminare almeno 200 elementi. Dopo che il punteggio di accuratezza si è stabilizzato, l'opzione di pubblicazione diventerà disponibile e lo stato del classificatore dirà
Ready to use.
Pubblicare il classificatore.
Dopo la pubblicazione, il classificatore sarà disponibile come condizione nell'etichettatura automatica di Office con etichette di riservatezza, applicare automaticamente i criteri delle etichette di conservazione in base a una condizione e in Conformità delle comunicazioni.