Meer informatie over trainbare classificaties
Het classificeren en labelen van inhoud, zodat deze op de juiste manier kan worden beveiligd en verwerkt, is de beginplaats voor de informatiebeveiligingsdiscipline. Microsoft 365 heeft drie manieren om inhoud te classificeren.
Handmatig
Voor deze methode zijn menselijke beoordeling en actie vereist. Een beheerder kan de bestaande etiketten en gevoelige informatietypen gebruiken of een eigen label maken en vervolgens publiceren. Gebruikers en beheerders passen deze toe op inhoud wanneer ze deze tegenkomen. Vervolgens kunt u de inhoud beveiligen en de positie ervan beheren.
Geautomatiseerde patroonmatching
Deze categorie classificatiemechanismen omvat het vinden van inhoud door:
- Trefwoorden of metagegevenswaarden (trefwoordquerytaal).
- Eerder geïdentificeerde patronen van gevoelige informatie gebruiken, zoals sociale zekerheid, creditcard- of bankrekeningnummers (definities van entiteitsdefinities van het type Gevoelige informatie).
- Een item herkennen omdat het een variatie is op een sjabloon (afdrukken met documentvinger).
- Met de aanwezigheid van exacte tekenreeksen komen exacte gegevens overeen.
Gevoeligheids- en bewaarlabels kunnen vervolgens automatisch worden toegepast om de inhoud beschikbaar te maken voorgebruik in Meer informatie over preventie van gegevensverlies) en om automatisch de politie voor bewaarlabels toe te passen.
Classificaties
Deze classificatiemethode is met name geschikt voor inhoud die niet gemakkelijk kan worden geïdentificeerd met de handmatige of geautomatiseerde methoden voor het koppelen van patronen. Deze classificatiemethode gaat meer over het trainen van een classificatie om een item te identificeren op basis van wat het item is, niet door elementen die zich in het item (patroonmatching) vormen. Een classificatie leert hoe u een type inhoud kunt identificeren door honderden voorbeelden te bekijken van de inhoud die u wilt classificeren. U begint met het geven van voorbeelden die zeker in de categorie staan. Wanneer deze voorbeelden zijn verwerkt, test u deze door een combinatie te maken van zowel overeenkomende als niet-overeenkomende voorbeelden. In de classificatie wordt vervolgens voorspeld of een bepaald item valt in de categorie die u maakt. Vervolgens bevestigt u de resultaten en sorteert u de werkelijke positieven, waar-negatieven, onwaar-positieven en onwaar-negatieven om de nauwkeurigheid van de voorspellingen te vergroten.
Wanneer u de classificatie publiceert, worden items gesorteerd op locaties zoals SharePoint Online, Exchange en OneDrive en classificeert u de inhoud. Nadat u de classificatie hebt gepubliceerd, kunt u deze blijven trainen met behulp van een feedbackproces dat lijkt op het eerste trainingsproces.
Waar u trainbare classificaties kunt gebruiken
Zowel ingebouwde classificaties als trainbare classificaties zijn beschikbaar als voorwaarde voor Office autolabelingmet gevoeligheidslabels, automatisch bewaarlabelbeleid toepassen op basis van een voorwaarde en incommunicatieconditie.
Gevoeligheidslabels kunnen classificaties gebruiken als voorwaarden, zie Een gevoeligheidslabelautomatisch toepassen op inhoud.
Belangrijk
Classificaties werken alleen met items die niet zijn versleuteld.
Typen classificaties
- vooraf getrainde classificaties: Microsoft heeft meerdere classificaties gemaakt en vooraf opgeleid die u kunt gebruiken zonder ze te trainen. Deze classificaties worden weergegeven met de status
Ready to usevan . - aangepaste classificaties: als u classificatiebehoeften hebt die verder gaan dan wat de vooraf getrainde classificaties dekken, kunt u uw eigen classificaties maken en trainen.
Vooraf getrainde classificaties
Microsoft 365 wordt geleverd met meerdere vooraf getrainde classificaties:
Waarschuwing
De vooraf getrainde classificatie Grof taalgebruik wordt afgeschaft omdat er veel fout-positieven worden geproduceerd. Gebruik deze niet en als u het momenteel gebruikt, moet u uw bedrijfsprocessen ervan af zetten. We raden u aan in plaats daarvan de vooraf getrainde classificaties Bedreiging, Godslastering en Pesterijen te gebruiken.
- Cv's: detecteert items die tekstuele accounts zijn van persoonlijke, educatieve, professionele kwalificaties, werkervaring en andere persoonlijk identificeerbare gegevens van een sollicitant
- Broncode: detecteert items die een reeks instructies en instructies bevatten die zijn geschreven in de 25 meest gebruikte programmeertalen op GitHub
- ActionScript
- C
- C #
- C++
- Klaveren
- CoffeeScript
- Ga
- Haskell
- Java
- JavaScript
- Lua
- MATLAB
- Objective-C
- Perl
- PHP
- Python
- R
- Ruby
- Scala
- Shell
- Swift
- TeX
- Vim-script
Notitie
Broncode is opgeleid om te detecteren wanneer het grootste deel van de tekst broncode is. Er wordt geen broncodetekst gedetecteerd die wordt afgewisseld met tekst zonder tekst.
- Overeenkomsten: detecteert inhoud met betrekking tot juridische overeenkomsten, zoals geheimhoudingsovereenkomsten, werkverklaringen, lenings- en leaseovereenkomsten, arbeidsovereenkomsten en niet-concurrentiebedingsovereenkomsten
- Discriminatie: detecteert expliciete discriminatietaal en is bijzonder gevoelig voor discriminatoire taal ten opzichte van de Afrikaanse Amerikaanse/zwarte gemeenschappen in vergelijking met andere gemeenschappen.
- Financiën: detecteert inhoud in de categorieën bedrijfs financiën, financiële sector, economie, bankwezen en investeringen
- Pesterijen: detecteert een specifieke categorie aanstootgevende taaltekstitems met betrekking tot aanstootgevend gedrag dat is gericht op een of meer personen op basis van de volgende kenmerken: ras, etniciteit, religie, nationale origin, geslacht, seksuele oriëntatie, leeftijd, handicap
- Gezondheidszorg: detecteert inhoud in medische en gezondheidsbeheeraspecten, zoals medische diensten, diagnoses, behandeling, claims, enzovoort
- HR: detecteert inhoud in personeelsgerelateerde categorieën van werving, sollicitatiegesprek, aanwerving, training, evaluatie, waarschuwing en beëindiging
- IP: detecteert inhoud in gerelateerde categorieën van intellectuele eigendom, zoals bedrijfsgeheimen en soortgelijke vertrouwelijke informatie
- IT: detecteert inhoud in de categorieën Informatietechnologie en Cyberbeveiliging, zoals netwerkinstellingen, informatiebeveiliging, hardware en software
- Juridische zaken: detecteert inhoud in juridische zaken gerelateerde categorieën, zoals rechtszaken, juridische procedures, wettelijke verplichting, juridische terminologie, recht en wetgeving
- Inkoop: detecteert inhoud in categorieën van bieden, citeren, kopen en betalen voor de levering van goederen en services
- Grof taalgebruik: detecteert een specifieke categorie aanstootgevende taaltekstitems die expressies bevatten die de meeste mensen voor schut zetten
- Belasting: detecteert de inhoud van de belastingrelatie, zoals belastingplanning, belastingformulieren, belastingaangifte, belastingvoorschriften
- Bedreiging: detecteert een specifieke categorie aanstootgevende taaltekstitems die betrekking hebben op bedreigingen om geweld te plegen of fysieke schade aan een persoon of eigenschap toe te brengen
Deze worden weergegeven in Microsoft 365-compliancecentrum > weergave Gegevensclassificatie > Trainable classifiers met de status Ready to use van .

Belangrijk
Houd er rekening mee dat de aanstootgevende taal, pesterijen, grof taalgebruik, discriminatie en bedreigingsclassifiers alleen werken met doorzoekbare tekst en geen volledige of volledige lijst met termen of taal zijn in deze gebieden. Bovendien veranderen taal- en culturele standaarden voortdurend en in het licht van deze realiteit behoudt Microsoft zich het recht voor om deze classificaties naar eigen goed inzicht bij te werken. Hoewel classificaties uw organisatie kunnen helpen bij het opsporen van deze gebieden, zijn classificaties niet bedoeld om uw organisatie de enige manier te bieden om het gebruik van deze taal te detecteren of aan te pakken. Uw organisatie, niet Microsoft of haar dochterondernemingen, blijft verantwoordelijk voor alle beslissingen met betrekking tot het bewaken, scannen, blokkeren, verwijderen en bewaren van inhoud die is geïdentificeerd door een vooraf getrainde classificatie, inclusief naleving van lokale privacy en andere toepasselijke wetgeving. Microsoft moedigt het raadplegen van juridische raadslieden aan vóór de implementatie en het gebruik.
Vooraf getrainde classificaties kunnen inhoud in deze talen scannen:
• Chinees (vereenvoudigd) • Engels • Frans • Duits • Italiaans • Japans • Portugees • Spaans
Aangepaste classificaties
Wanneer de vooraf getrainde classificaties niet aan uw behoeften voldoen, kunt u uw eigen classificaties maken en trainen. Er is aanzienlijk meer werk betrokken bij het maken van uw eigen werk, maar ze zijn veel beter afgestemd op de behoeften van uw organisatie.
U kunt bijvoorbeeld trainbare classificaties maken voor:
- Juridische documenten , zoals het privilege van een advocatenclient, het sluiten van sets, de werkverklaring
- Strategische zakelijke documenten: zoals persberichten, fusies en overnames, aanbiedingen, zakelijke of marketingplannen, intellectueel eigendom, octrooien, ontwerpdocumenten
- Prijsinformatie: zoals facturen, prijsophalingstekens, werkorders, biedingsdocumenten
- Financiële informatie, zoals bedrijfsinvesteringen, kwartaal- of jaarresultaten
Processtroom voor het maken van aangepaste classificaties
Het maken en publiceren van een classificatie voor gebruik in complianceoplossingen, zoals bewaarbeleid en communicatietoezicht, volgt deze stroom. Zie Een aangepaste classificatie maken voor meer informatie over het maken van een aangepaste, trainbare classificatie.

Omscholingsclassifiers
U kunt de nauwkeurigheid van alle aangepaste classificaties en sommige vooraf getrainde classificaties verbeteren door hen feedback te geven over de nauwkeurigheid van de classificatie die ze uitvoeren. Dit wordt omscholing genoemd en volgt deze werkstroom.
