Mer information om utbildningsbara klassificerare
Att klassificera och märka innehåll så att det kan skyddas och hanteras korrekt är startpunkten för informationsskyddsgrenen. Microsoft 365 finns tre sätt att klassificera innehåll.
Manuellt
Manuell klassificering kräver mänskligt omdöme och åtgärd. Användare och administratörer tillämpar dem på innehåll när de stöter på det. Du kan antingen använda befintliga etiketter och typer av känslig information eller använda anpassade. Sedan kan du skydda innehållet och hantera dess disposition.
Automatiserad mönstermatchning
Den här kategorin av klassificeringsmetoder omfattar att söka efter innehåll genom följande:
- Nyckelord eller metadatavärden (frågespråk för nyckelord).
- Använda tidigare identifierade mönster för känslig information som personnummer, kreditkortsnummer och bankkontonummer (definition av typen Typ av känslig information).
- Känna igen ett objekt eftersom det är en variant på en mall (fingerutskrift i dokument).
- Använd närvaro av exakta strängar som matchar exakta data.
Känslighets- och bevarandeetiketter kan sedan tillämpas automatiskt för att göra innehållet tillgängligt för användning i Läs mer om skydd mot dataförlust och tillämpar automatiskt bevarandeprinciper för bevarandeetiketter.
Klassificerare
Den här klassificeringsmetoden är bra lämpad för innehåll som inte enkelt identifieras med hjälp av de manuella eller automatiserade mönstermatchningsmetoderna. Den här klassificeringsmetoden handlar mer om att använda en klassificerare för att identifiera ett objekt baserat på vad objektet är, inte efter element som finns i objektet (mönstermatchning). En klassificerare lär sig att identifiera en typ av innehåll genom att titta på hundratals exempel på innehåll som du är intresserad av att klassificera.
Anteckning
I förhandsgranskning – Du kan visa de utbildande klassificerarna i innehållsutforskaren genom att expandera Trainable Classifiers i filterpanelen. De utbildande klassificerarna visar automatiskt antalet incidenter som påträffas i olika SharePoint, Teams och OneDrive, utan några etiketter. Om du inte vill använda den här funktionen måste du skicka en begäran till Microsoft Support för att inaktivera den in vise klassificering. Det här inaktiverar genomsökning av känsligt och etiketterat innehåll innan du skapar märkningsprinciper.
Där du kan använda klassificerare
Klassificerare är tillgängliga att använda som ett villkor för Office med känslighetsetiketter, tillämpa bevarandeprincip automatiskt utifrån ett villkor och i kommunikationsefterlevnad.
Känslighetsetiketter kan använda klassificerare som villkor, se Använda en känslighetsetikett på innehållet automatiskt.
Viktigt
Klassificerare fungerar bara med objekt som inte är krypterade.
Typer av klassificerare
- förskapade klassificerare – Microsoft har skapat och förinstallerat flera klassificerare som du kan börja använda utan att ha utbildat dem. De här klassificerarna visas med statusen för
Ready to use. - Anpassade utbildare – Om du har klassificeringsbehov som omfattar mer än vad de i förväg utbildade klassificerarna täcker kan du skapa och utbilda dina egna klassificerare.
Förbaserade klassificerare
Microsoft 365 levereras med flera förinstallerade klassificerare:
Varning
Vi använder inte längre den förtränade klassificeraren för anstötligt språk eftersom det har ökat ett stort antal falska positiva resultat. Använd den inte och om du använder den just nu bör du flytta bort dina affärsprocesser från den. Vi rekommenderar att du i stället använder de förinnade klassarna Hot, Svordomar och trakasserier.
- Meritförteckningar: identifierar docx-, .pdf-, .rtf- och .txt-objekt som är textbaserade konton till en sökandes personliga, utbildning, kvalifikationer, kompetens, yrkeserfarenhet och annan personlig information som identifierar dig personligen
- Källkod : Identifierar objekt som innehåller en uppsättning instruktioner och uttryck som skrivs på de 25 översta använda datorprogrammeringsspråken på GitHub: ActionScript, C, C#, C++, Phpjure, CoffeeScript, Go, Haskell, Java, JavaScript, Lua, MATLAB, Objective-C, Perl, PHP, Python, R, Ruby, Scala, Shell, Swift, TeX, Vim Script.
Anteckning
Källkod används för att identifiera när större delen av texten är källkod. Den identifierar inte källkodstext som är översedd med oformaterad text.
- Avtal: Identifierar innehåll som är relaterat till juridiska avtal, till exempel sekretessavtal, arbetsutdrag, låne- och leasingsavtal, anställnings- och icke-konkurrensavtal. Identifierar innehåll i .docx-, .docm-, .doc-, .dotx-, .dotm-, .dot-, .pdf-, .rtf-, .txt-, .one-, .msg- och .eml-filer.
- Färgning: Identifierar explicita språk och är känslig för att vara känslig för språk mot den amerikanska/svarta communityn i jämförelse med andra communities.
- Ekonomi: Identifierar innehåll inom företagsekonomi, redovisning, ekonomi, banktjänster och investeringskategorier. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm- och .potsx-, .ppsm-, .pps-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlam- och .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och .xla-filer.
- Trakasserier: Identifierar en specifik kategori med stötande språktextobjekt som är relaterade till stötande uppförande som är riktad mot en eller flera personer baserat på följande egenskaper: etnicitet, religion, nationella ursprung, kön, sexuell orientering, ålder, funktionshinder. Identifierar innehåll i .msg-, .docx-, .pdf-, .txt-, .rtf-, .jpeg-, .jpg-, .png-, .gif-, .bmp- och .svg-filer.
- Sjukvård: Identifierar innehåll inom olika aspekter av sjukvårdsadministration, t.ex. sjukvård, diagnoser, behandling och så vidare. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm- och .potsx-, .ppsm-, .pps-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlam- och .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och .xla-filer.
- HR: Upptäcker innehåll i personalrelaterade kategorier av intervjun, intervju, anställning, utbildning, utvärdering, varning och uppsägning. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm- och .potsx-, .ppsm-, .pps-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlam- och .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och .xla-filer.
- IP: Identifierar innehåll i upphovsrättsrelaterade kategorier som affärshemligheter och liknande konfidentiell information. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm- och .potsx-, .ppsm-, .pps-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlam- och .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och .xla-filer.
- IT: Identifierar innehåll i kategorier för informationsteknik och cybersäkerhet, till exempel nätverksinställningar, informationssäkerhet, maskinvara och programvara. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm- och .potsx-, .ppsm-, .pps-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlam- och .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och .xla-filer.
- Legal Affairs: Identifierar innehåll i rättsrelaterade kategorier som rättstvister, rättsprocesser, juridiska skyldigheter, juridisk terminologi, lag och lagstiftning. Identifierar innehåll i .docx-, .docm-, .doc-, .dotx-, .dotm-, .dot-, .pdf-, .rtf-, .txt-, .one-, .msg- och .eml-filer.
- Anskaffning: Identifierar innehåll i kategorier av kategori, citat, inköp och betalning för leverans av varor och tjänster. Identifierar innehåll i .docx-, .docm-, .doc-, .dotx-, .dotm-, .dot-, .pdf-, .rtf-, .txt-, .one-, .msg-, .eml-, .xlsx-, .xlsm-, .xlsb-.xls, .xla-.csv, .xla-filer.
- Svordomar: Identifierar en specifik kategori av stötande språktextobjekt som innehåller uttryck som är försämnande för de flesta. Identifierar innehåll i .msg-, .docx-, .pdf-, .txt-, .rtf-, .jpeg-, .jpg-, .png-, .gif-, .bmp- och .svg-filer.
- Skatt: Identifierar innehåll i skatterelationer, till exempel skatteplanering, skatteformulär, skattedeklaration och skatteregler. Identifierar innehåll i .docx, .docm, .doc, .dotx, .dotm, .dot, .pdf, .rtf, .txt .one-, .msg-, .eml-, .pptx-, .pptm-, .ppt-, .potx-, .potm-, .pot, .ppsx- och .ppsm-, .ppam-, .ppa-, .xlsx-, .xlsm-, .xlsb-, .xls-, .csv-, .xltx-, .xltm-, .xlt-, .xlam- och xla-filer.
- Hot: Upptäcker en specifik kategori av anstötliga språktextobjekt som är relaterade till hot om våld eller fysisk skada en person eller egendom. Identifierar innehåll i .msg-, .docx-, .pdf-, .txt-, .rtf-, .jpeg-, .jpg-, .png-, .gif-, .bmp- och .svg-filer.
De visas i vyn Microsoft 365 Efterlevnadscenter > DataklassificeringTrainable > classifiers med statusen för Ready to use.

Viktigt
Observera att det stötande språket, trakasserier, svordomar, sekretess och hotklassare endast fungerar med sökbar text och inte är en uttömmande eller fullständig lista över termer eller språk i dessa områden. Ytterligare, språk och kulturstandarder ändras kontinuerligt, och mot bakgrund av dessa omotiv, förbehåller sig Microsoft rätten att uppdatera dessa klassificerare enligt eget gottfinnande. Medan klassificerare kan hjälpa organisationen att identifiera dessa områden är klassificerare inte avsedda att tillhandahålla organisationens enbart sätt att identifiera eller adressera användningen av ett sådant språk. Din organisation, inte Microsoft eller dess dotterbolag, förblir ansvarig för alla beslut som rör övervakning, skanning, blockering, borttagning och lagring av innehåll som identifierats av en i förväg utbildad klassificerare, inklusive efterlevnad av lokal sekretess och andra tillämpliga lagar. Microsoft uppmuntrar konsultarbete med juridiska råd före distribution och användning.
Pre-trained classifiers can scan content in these languages:
• Kinesiska (förenklad) • Engelska • Franska • Tyska • Italienska • Japanska • Portugisiska • Spanska
Anpassade klassificerare
När de förinsorterade klassificerarna inte uppfyller dina behov kan du skapa och utbilda dina egna klassificerare. Det finns avsevärt mer arbete att skapa egna, men de kommer att bli mycket bättre skräddarsydda efter organisationens behov.
Du börjar skapa en egen utbildare genom att mata in den i exempel som definitivt ligger i kategorin. När du har bearbetar dessa exempel testar du dem genom att ge den en blandning av både matchande och icke-matchande exempel. Klassificeraren gör sedan prognoser om huruvida ett visst objekt faller inom den kategori som du skapar. Sedan bekräftar du resultatet och sorterar de verkliga positiva resultaten, sant negativa, falska positiva och falska negativa resultat för att öka noggrannheten i dess prognoser.
När du publicerar klassificeraren sorterar den igenom objekt på platser som SharePoint Online, Exchange och OneDrive, och klassificerar innehållet. När du har publicerat klassificeraren kan du fortsätta att utbilda den med hjälp av en feedbackprocess som liknar den första utbildningsprocessen.
Du kan till exempel skapa utbildare för:
- Juridiska dokument – t.ex. juristklientbehörighet, avslutande uppsättningar, arbetsutdrag
- Strategiska affärsdokument – t.e. pressmeddelanden, sammanslagningar och förvärv, avtal, affärsplaner, immateriell egendom, patent, designdokument
- Prisinformation – som fakturor, prisuppgifter, arbetsorder, dokument med hög prissättning
- Ekonomisk information – till exempel investeringar i organisationen, kvartalsvisa eller årliga resultat
Processflöde för att skapa anpassade klassificerare
Genom att skapa och publicera en klassificerare för användning i efterlevnadslösningar, till exempel kvarhållningsprinciper och kommunikations överanvändning, följer du det här flödet. Mer information om hur du skapar en egen utbildare finns i Skapa en anpassad klassificerare.

Omklassning av klassificerare
Du kan förbättra noggrannheten för alla anpassade utbildare och genom att ge dem feedback på noggrannheten i den klassificering de utför. Det kallas för omtämnande och följer det här arbetsflödet.
Anteckning
Pre-trained classifiers cannot be re-trained.
