Hashtagga och ladda upp tabellen för känslig information för att få en exakt matchning av känslig information
Den här artikeln visar hur du hashtaggar och laddar upp tabellen för känslig informationskälla.
Hashtagga och ladda upp källtabellen för känslig information
I den här fasen gör du följande:
- konfigurera en anpassad säkerhetsgrupp och ett användarkonto
- konfigurera agentverktyget EDM Upload
- Använd EDM Upload agentverktyget för att hashtagga, med ett saltvärde, tabellen för känslig informationskälla och ladda upp det.
Hashningen och uppladdningen kan göras på en dator eller så kan du separera hashningssteget från uppladdningssteget för större säkerhet.
Om du vill hasha och ladda upp från en dator måste du göra det från en dator som kan ansluta direkt till din Microsoft 365-klientorganisation. Det kräver att den rensade tabellfilen med textkänslig informationskälla finns på datorn för hash-kod.
Om du inte vill exponera tabellfilen med tydlig textkänslig informationskälla på direktåtkomstdatorn kan du hashtagga den på en dator som är på en säker plats och sedan kopiera hashfilen och saltfilen till en dator som kan ansluta direkt till Microsoft 365-klientorganisationen för uppladdning. I scenariot med separerad hash och uppladdning behöver du EDMUploadAgent på båda datorerna.
Viktigt
Om du skapade schemafilen med exakt datamatchning och typ av känslig information med hjälp av guiden Exakt datamatchning måste du hämta schemat för den här proceduren om du inte redan har gjort det. Mer information finns i Exportera av EDM-schemafilen i XML-format.
Anteckning
Om din organisation har ställt in kundnyckel för Microsoft 365på klientnivå så används exakt datamatchning av krypteringsfunktionen automatiskt. Det här är endast tillgängligt för E5-licensierade klientorganisationer i det kommersiella molnet.
Metodtips
Avgränsa processerna för hashtaggar och ladda upp känsliga data så att du lättare kan identifiera problem i processen.
När du är i produktionen ska du i de flesta fall hålla de två stegen separata. Genom att utföra hash-processen på en isolerad dator och sedan överföra filen för överföring till en Internetriktad dator säkerställer du att de verkliga data inte är tillgängliga i klartextform i en dator som kan ha komprometterats på grund av anslutningen till Internet.
Kontrollera att det inte finns formateringsproblem i din känsliga datatabell.
Innan du hashtaggar och laddar upp känsliga data gör du en sökning för att verifiera att det finns specialtecken som kan orsaka problem med att tolka innehållet. Du kan verifiera att tabellen är i ett format som passar för EDM genom att använda agenten för EDM-uppladdning med följande syntax:
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
Om verktyget anger en felmatchning i antalet kolumner kan det bero på att det finns kommatecken eller citattecken i värden i tabellen som förväxlas med kolumnavgränsare. Om de inte omger ett helt värde kan enkla och dubbla citattecken göra att verktyget felaktigt kan identifiera var en enskild kolumn börjar eller slutar.
Om du hittar enkla eller dubbla citattecken som omger fullständiga värden kan du låta dem vara som de är.
Om du hittar enkla citattecken eller kommatecken inuti ett värde : till exempel personens namn Tom O'Lte eller stadens-Gravenhage som börjar med ett apostroftecken, måste du ändra den dataexportprocess som används för att generera den känsliga informationstabellen för att omge sådana kolumner med dubbla citattecken.
Om dubbla citattecken finns inuti värden kan det vara bättre att använda det tabbavgränsade formatet för tabellen som är mindre känslig för sådana problem.
Förutsättningar
- ett arbets- eller skolkonto för Microsoft 365 som läggs till i säkerhetsgruppen EDM_DataUploaders
- en Windows 10 eller Windows Server 2016 dator med .NET version 4.6.2 för att köra EDMUploadAgent
- en katalog på uppladdningsdatorn för:
- EDM Upload Agent
- din fil för känsliga objekt .csv, .tsv eller rörformat (|),PatientRecords.csv i våra exempel
- Hash-utdata och saltfiler som skapats i den här proceduren
- namnet för datalagret från filen edm.xml,
PatientRecordsi vårt exempel
Konfigurera säkerhetsgruppen och användarkontot
Gå till administrationscentret som global administratör med lämplig länk för din prenumeration och skapa en säkerhetsgrupp med namnet EDM_DataUploaders.
Lägg till en eller flera användare i säkerhetsgruppen EDM_DataUploaders. (De här användarna kommer att hantera databasen med känslig information.)
Hasha och ladda upp från en dator
Den här datorn måste ha direkt åtkomst till din Microsoft 365-klientorganisation.
Anteckning
Innan du börjar försäkrar du dig om att du är medlem i säkerhetsgruppen EDM_DataUploaders.
Tips
Om du vill kan du köra en verifiering mot tabellfilen för känslig information om du vill söka efter fel innan du laddar upp den genom att köra:
EdmUploadAgent.exe /ValidateData /DataFile [data file] /Schema [schema file]
Mer information om alla parametrar som EdmUploadAgent.exe stöds körs
EdmUploadAgent.exe /?
Länkar till EDM-uppladdningsagenten efter prenumerationstyp
- Commercial + GCC – De flesta kommersiella kunder bör använda denna
- GCC-High – Specifikt för myndighetsmolnprenumeranter som kräver hög säkerhet
- DoD – Specifikt för USA:s försvarsdepartement (Department of Defense)
Skapa en arbetskatalog för EDMUploadAgent. Till exempel C:\EDM\Data. Placera filen PatientRecords.csv där.
Ladda ned och installera rätt EDM-uppladdningsagent för din prenumeration till katalogen som du skapade i steg 1.
Anteckning
EDMUploadAgent som nås via länkarna ovan har uppdaterats för att automatiskt lägga till ett saltvärde i hashade data. Alternativt kan du ange ett eget saltvärde. När du har använt den här versionen kommer du inte att kunna använda den föregående versionen av EDMUploadAgent.
Du kan ladda upp data med EDMUploadAgent till ett datalager endast två gånger per dag.
Auktorisera EDM Upload agenten, öppna Kommandotolken som administratör, växla till katalogen C:\EDM\Data och kör sedan följande kommando:
EdmUploadAgent.exe /Authorize
Viktigt
Du måste köra EdmUploadAgent från mappen där den är installerad och ange den fullständiga sökvägen till dina datafiler.
Logga in med det arbets- eller skolkonto för Microsoft 365 som du lade till i säkerhetsgruppen EDM_DataUploaders. Din innehavarinformation extraheras från användarkontot för att upprätta anslutningen.
VALFRITT: Om du har använt guiden Exakt datamatchning och typ av känslig information när du skapade schemat måste du ladda ned det för användning i de här procedurerna om du inte redan har gjort det. Kör det här kommandot i kommandotolken:
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>Om du vill hasha och ladda upp känsliga data kör du följande kommando i kommandotolksfönstret:
EdmUploadAgent.exe /UploadData /DataStoreName [DS Name] /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /ColumnSeparator ["{Tab}"|"|"] /AllowedBadLinesPercentage [value]Anteckning
Standardformatet för den känsliga datafilen är kommaavgränsade värden. Du kan ange en tabbavgränsad fil genom att ange alternativet "{Tab}" med parametern /ColumnSeparator, eller så kan du ange en röravgränsad fil genom att ange alternativet "|".
Exempel: EdmUploadAgent.exe /UploadData /DataStoreName PatientRecords /DataFile C:\Edm\Hash\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
Om tabellen med känslig information har några felaktigt formaterade värden, men du vill importera återstående data men ignorerar ogiltiga rader ändå, kan du använda parametern /AllowedBadLinesPercentage i kommandot. Exemplet ovan anger ett tröskelvärde på fem procent. Det innebär att verktyget hashtaggar och laddar upp tabellen för känslig information även om upp till fem procent av raderna är ogiltiga.
Det här kommandot lägger automatiskt till ett slumpmässigt genererat saltvärde i hashtaggen för bättre säkerhet. Om du vill använda ett eget saltvärde lägger du till /Salt i kommandot. Det här värdet måste vara 64 tecken långt och får endast innehåll tecknen a–z och 0–9.
Kontrollera uppladdningsstatus genom att köra det här kommandot:
EdmUploadAgent.exe /GetSession /DataStoreName \<DataStoreName\>Exempel: EdmUploadAgent.exe /GetSession /DataStoreName PatientRecords
Kontrollera statusen i ProcessingInProgress. Kontrollera igen var femte minut tills statusen ändras till Completed (Slutförd). När statusen är slutförd är dina EDM-data redo att användas. Beroende på storleken på tabellfilen för känslig information kan det ta från några minuter till flera timmar.
Tips
Om du vill bli meddelad när den överladdade känsliga informationen är klar att använda följer du procedurerna i Skapa meddelanden för exakt matchning av dataaktiviteter.
Separat hashning och uppladdning
Utför hashningen på en dator i en säker miljö. Du måste ha EDMUploadAgent installerad på båda datorerna.
VALFRITT: Om du har använt guiden Exakt datamatchningsschema och typ av känslig information till att skapa schemat och du inte redan har laddat ned det, kör du följande kommando i kommandotolken för att ladda ned filen i XML-format:
EdmUploadAgent.exe /SaveSchema /DataStoreName <schema name> /OutputDir <path to output folder>
Kör följande kommando i Kommandotolken på datorn i den säkra miljön:
EdmUploadAgent.exe /CreateHash /DataFile [data file] /HashLocation [hash file location] /Schema [Schema file] /AllowedBadLinesPercentage [value]Till exempel:
EdmUploadAgent.exe /CreateHash /DataFile C:\Edm\Data\PatientRecords.csv /HashLocation C:\Edm\Hash /Schema edm.xml /AllowedBadLinesPercentage 5
Anteckning
Standardformatet för den känsliga datafilen är kommaavgränsade värden. Du kan ange en tabbavgränsad fil genom att ange alternativet "{Tab}" med parametern /ColumnSeparator, eller så kan du ange en röravgränsad fil genom att ange alternativet "|".
Då matas en hashad fil och en saltfil ut med dessa filnamnstillägg om du inte har angett alternativet /Salt :
- .EdmHash
- .EdmSalt
Kopiera dessa filer på ett säkert sätt till den dator som du använder för att ladda upp källtabellfilen för känslig information (PatientRecords) till klientorganisationen.
Auktorisera EDM Upload agenten, öppna Kommandotolken som administratör, växla till katalogen C:\EDM\Data och kör sedan följande kommando:
EdmUploadAgent.exe /Authorize
Viktigt
Du måste köra EdmUploadAgent från mappen där den är installerad och ange den fullständiga sökvägen till dina datafiler.
Logga in med det arbets- eller skolkonto för Microsoft 365 som du lade till i säkerhetsgruppen EDM_DataUploaders. Din innehavarinformation extraheras från användarkontot för att upprätta anslutningen.
Om du vill ladda upp hashade data kör du följande kommando i kommandotolken i Windows:
EdmUploadAgent.exe /UploadHash /DataStoreName \<DataStoreName\> /HashFile \<HashedSourceFilePath\ /ColumnSeparator ["{Tab}"|"|"]Till exempel:
EdmUploadAgent.exe /UploadHash /DataStoreName PatientRecords /HashFile C:\\Edm\\Hash\\**PatientRecords.EdmHash**Om du vill kontrollera att känsliga data har laddats upp kör du följande kommando i kommandotolksfönstret:
EdmUploadAgent.exe /GetDataStoreDu ser en lista med datalager och när de uppdaterades senast.
Om du vill se alla data som överförs till en viss lagring kör du följande kommando i en kommandotolk i Windows för att visa en lista över alla datakällor och när de uppdaterades:
EdmUploadAgent.exe /GetSession /DataStoreName <DataStoreName>