Aan de slag met trainbare classificaties
Een Microsoft 365 trainable classifier is een hulpmiddel dat u kunt trainen om verschillende soorten inhoud te herkennen door deze voorbeelden te geven om naar te kijken. Nadat u bent opgeleid, kunt u het gebruiken om het item te identificeren voor de toepassing van Office gevoeligheidslabels, compliancebeleid voor communicatie en bewaarlabelbeleid.
Bij het maken van een aangepaste, trainbare classificatie moet u eerst steekproeven geven die door de mens zijn genomen en die positief overeenkomen met de categorie. Nadat deze zijn verwerkt, test u de mogelijkheid voor classificaties om te voorspellen door een combinatie van positieve en negatieve steekproeven te geven. In dit artikel wordt beschreven hoe u een aangepaste classificatie kunt maken en trainen en hoe u de prestaties van aangepaste, trainbare classificaties en vooraf getrainde classificaties gedurende hun hele leven kunt verbeteren door omscholing.
Zie Meer informatie over leerbare classificaties voor meer informatie over de verschillende typen classificaties.
Bekijk deze video voor een beknopt overzicht van het maken van een trainable classifier. U moet dit volledige artikel nog steeds lezen voor meer informatie.
Vereisten
Licentievereisten
Classificaties zijn een Microsoft 365 E5 of E5 Compliance-functie. U moet een van deze abonnementen hebben om er gebruik van te kunnen maken.
Machtigingen
Toegang tot classificaties in de gebruikersinterface:
- de globale beheerder moet ervoor kiezen om aangepaste classificaties te maken voor de tenant.
- De rol compliancebeheerder is vereist voor het trainen van een classificatie.
U hebt accounts met deze machtigingen nodig om classificaties in deze scenario's te kunnen gebruiken:
- Scenario bewaarlabelbeleid: rollen recordbeheer en bewaarbeheer
- Scenario gevoeligheidslabelbeleid: beveiligingsbeheerder, compliancebeheerder, compliancegegevensbeheerder
- Scenario communicatie compliancebeleid: Insider Risk Management Admin, Supervisory Review Administrator
Belangrijk
Standaard kan alleen de gebruiker die een aangepaste classificatie maakt voorspellingen trainen en bekijken die door die classificatie zijn gemaakt.
Voorbereiden op een aangepaste, trainbare classificatie
Het is handig om te begrijpen wat er nodig is bij het maken van een aangepaste, trainbare classificatie voordat u binnen duikt.
Tijdlijn
Deze tijdlijn weerspiegelt een voorbeeldimplementatie van trainable classifiers.

Tip
Opt-in is de eerste keer vereist voor trainbare classificaties. Het duurt twaalf dagen voordat Microsoft 365 een basislijnevaluatie van de inhoud van uw organisatie voltooit. Neem contact op met de globale beheerder om het opt-inproces te starten.
Algemene werkstroom
Zie Process flow for creating customer trainable classifiers (Processtroom voor het maken van klants trainable classifiers)voor meer informatie over de algehele werkstroom van het maken van aangepaste, trainbare classificaties.
Inhoud van het zaad
Als u wilt dat een trainbare classificatie een item onafhankelijk en nauwkeurig identificeert als een bepaalde inhoudscategorie, moet u dit eerst presenteren met veel voorbeelden van het type inhoud in de categorie. Deze voeding van steekproeven aan de trainbare classificatie wordt seeding genoemd. De inhoud van het zaad wordt geselecteerd door een mens en wordt beoordeeld als de categorie met inhoud.
Tip
U moet ten minste 50 positieve steekproeven hebben en maar liefst 500. De trainable classifier verwerkt maximaal de 500 meest recente gemaakte steekproeven (per bestand dat datum-/tijdstempel is gemaakt). Hoe meer voorbeelden u op geeft, hoe nauwkeuriger de voorspellingen die de classificatie zal maken.
Inhoud testen
Nadat de trainbare classificatie voldoende positieve steekproeven heeft verwerkt om een voorspellingsmodel te maken, moet u de voorspellingen testen om te zien of de classificatie correct onderscheid kan maken tussen items die overeenkomen met de categorie en items die niet overeenkomen. U doet dit door een andere, hopelijk grotere, reeks door de mens genomen inhoud te selecteren die bestaat uit steekproeven die in de categorie moeten vallen en steekproeven die dat niet doen. U moet testen met andere gegevens dan de eerste begingegevens die u voor het eerst hebt opgegeven. Wanneer deze zijn verwerkt, gaat u handmatig door de resultaten en controleert u of elke voorspelling juist, onjuist of niet zeker is. De trainable classifier gebruikt deze feedback om het voorspellingsmodel te verbeteren.
Tip
Voor de beste resultaten hebt u ten minste 200 items in uw testvoorbeeldset met een gelijkmatige verdeling van positieve en negatieve overeenkomsten.
Een trainbare classificatie maken
Verzamel tussen 50-500 inhoudsitems voor zaad. Dit moeten alleen steekproeven zijn die sterk het type inhoud vertegenwoordigen dat door de trainbare classificatie wordt bepaald als zijnde in de classificatiecategorie. Zie Standaard verkende bestandsnaamextensies en geparseerde bestandstypen in SharePoint Server voor de ondersteunde bestandstypen.
Belangrijk
Zorg ervoor dat de items in de zaadset sterke voorbeelden van de categorie zijn. De trainable classifier bouwt in eerste instantie zijn model op basis van wat u het start. De classificatie gaat ervan uit dat alle zaadmonsters sterke positieve punten zijn en dat ze niet kunnen weten of een steekproef een zwakke of negatieve overeenkomst met de categorie is.
Plaats de inhoud van het zaad in een SharePoint onlinemap die alleen bestemd is voor het vasthouden van de inhoud van het zaad. Noteer de URL van de site, bibliotheek en map.
Tip
Als u een nieuwe site en map voor uw seedgegevens maakt, moet u ten minste een uur toestaan dat die locatie wordt geïndexeerd voordat u de trainbare classificatie maakt waarmee die seedgegevens worden gebruikt.
Meld u aan bij Microsoft 365-compliancecentrum compliancebeheerder of beveiligingsbeheerder roltoegang en open Microsoft 365-compliancecentrum of Microsoft 365 Defender portal > Gegevensclassificatie.
Kies het tabblad Trainable classifiers.
Kies Trainable classifier maken.
Vul de juiste waarden in voor de en velden van de categorie items die u wilt identificeren met
NameDescriptiondeze trainbare classificatie.Kies de SharePoint onlinesite, bibliotheek en map-URL voor de site met de inhoud van het zaad in stap 2. Kies
Add.Controleer de instellingen en kies
Create trainable classifier.Binnen 24 uur verwerkt de trainbare classificatie de seedgegevens en maakt u een voorspellingsmodel. De classificatiestatus is terwijl
In progressde seedgegevens worden verwerkt. Wanneer de classificatie klaar is met de verwerking van de seedgegevens, wordt de status gewijzigd inNeed test items.U kunt nu de detailspagina bekijken door de classificatie te kiezen.

Verzamel ten minste 200 testinhouditems (maximaal 10.000) voor de beste resultaten. Dit moet een combinatie zijn van items die sterke positieven, sterke negatieven en sommige items zijn die iets minder duidelijk zijn in hun aard. Zie Standaard verkende bestandsnaamextensies en geparseerde bestandstypen in SharePoint Server voor de ondersteunde bestandstypen.
Plaats de testinhoud in een SharePoint onlinemap die alleen is bedoeld om de testinhoud vast te houden. Noteer de SharePoint onlinesite, bibliotheek en map-URL.
Tip
Als u een nieuwe site en map voor uw testgegevens maakt, moet u ten minste een uur toestaan dat die locatie wordt geïndexeerd voordat u de trainbare classificatie maakt waarmee die seedgegevens worden gebruikt.
Kies
Add items to test.Kies de SharePoint onlinesite, bibliotheek en map-URL voor de testinhoudssite in stap 12. Kies
Add.Maak de wizard af door te kiezen
Done. Het duurt maximaal een uur voordat de testbestanden worden verwerkt door uw trainbare classificatie.Wanneer de trainable classifier klaar is met het verwerken van uw testbestanden, wordt de status op de detailspagina gewijzigd in
Ready to review. Als u de grootte van het testvoorbeeld wilt vergroten, kiest en laat u deAdd items to testtrainbare classifier de extra items verwerken.
Kies
Tested items to reviewhet tabblad om items te bekijken.Microsoft 365 presenteert 30 items tegelijk. Bekijk ze en kies in
We predict this item is "Relevant". Do you agree?het vak een of ofYesNoNot sure, skip to next item. De nauwkeurigheid van het model wordt automatisch bijgewerkt na elke 30 items.
Bekijk ten minste 200 items. Zodra de nauwkeurigheidsscore is gestabiliseerd, wordt de publicatieoptie beschikbaar en wordt de classificatiestatus ervan in het gelijk
Ready to usegesteld.
Publiceer de classificatie.
Nadat uw classificatie is gepubliceerd, is uw classificatie beschikbaar als voorwaarde in Office autolabelsmet gevoeligheidslabels , automatisch bewaarlabelbeleid toepassen op basis van een voorwaarde en in Communicatie compliance.