Persoonlijke identificatiegegevens (PII) in gesprekken detecteren en redigeren

Met de functie Conversational PII kunnen gesprekken worden geëvalueerd om gevoelige informatie (PII) in de inhoud te extraheren in verschillende vooraf gedefinieerde categorieën en deze te redigeren. Deze API werkt op zowel getranscribeerde tekst (waarnaar wordt verwezen als transcripties) als chats. Voor transcripties maakt de API ook redactie van audiosegmenten mogelijk, die de PII-informatie bevatten door de audiotijdgegevens voor die audiosegmenten op te geven.

Bepalen hoe de gegevens moeten worden verwerkt (optioneel)

Het PII-detectiemodel opgeven

Deze functie maakt standaard gebruik van het nieuwste beschikbare AI-model voor uw invoer. U kunt uw API-aanvragen ook configureren voor het gebruik van een specifieke modelversie.

Taalondersteuning

Op dit moment ondersteunt de api voor de preview-versie van conversational PII alleen de Engelse taal.

Ondersteuning voor regio

Momenteel ondersteunt de conversationele PII Preview-API alle Azure-regio's die worden ondersteund door de Taalservice.

Gegevens verzenden

Notitie

Zie het artikel Language Studio voor informatie over het opmaken van gesprekstekst die moet worden verzonden met Behulp van Language Studio.

U kunt de invoer naar de API verzenden als lijst met gespreksitems. Analyse wordt uitgevoerd na ontvangst van de aanvraag. Omdat de API asynchroon is, kan er een vertraging zijn tussen het verzenden van een API-aanvraag en het ontvangen van de resultaten. Zie de onderstaande gegevenslimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.

Wanneer u de asynchrone functie gebruikt, zijn de API-resultaten 24 uur beschikbaar vanaf het moment dat de aanvraag is opgenomen en worden ze aangegeven in het antwoord. Na deze periode worden de resultaten opgeschoond en kunnen ze niet meer worden opgehaald.

Wanneer u gegevens verzendt naar conversational PII, kunt u één gesprek (chat of gesproken) per aanvraag verzenden.

De API probeert alle gedefinieerde entiteitscategorieën te detecteren voor een bepaalde gespreksinvoer. Als u wilt opgeven welke entiteiten worden gedetecteerd en geretourneerd, gebruikt u de optionele piiCategories parameter met de juiste entiteitscategorieën.

Voor gesproken transcripties worden de gedetecteerde entiteiten geretourneerd op basis van de redactionSource opgegeven parameterwaarde. Op dit moment zijn de ondersteunde waarden voor redactionSource , lexical, itnen maskedItn (die respectievelijk worden toegewezen aan de indeling , en maskedItn van de REST-API van lexicalitndisplaydisplayText\Speech aan tekst).text Daarnaast biedt deze API voor de gesproken transcriptie-invoer ook informatie over de timing van audio om audioredactie mogelijk te maken. Als u de functie audioRedaction wilt gebruiken, gebruikt u de optionele includeAudioRedaction vlag met true waarde. De audioredactie wordt uitgevoerd op basis van de lexicale invoerindeling.

Notitie

Gespreks-PII ondersteunt nu 40.000 tekens als documentgrootte.

PII-resultaten ophalen

Wanneer u resultaten van PII-detectie krijgt, kunt u de resultaten streamen naar een toepassing of de uitvoer opslaan in een bestand op het lokale systeem. Het API-antwoord bevat herkende entiteiten, inclusief hun categorieën en subcategorieën, en betrouwbaarheidsscores. De tekenreeks met de bewerkte PII-entiteiten wordt ook geretourneerd.

Voorbeelden

  1. Ga naar de overzichtspagina van uw resource in de Azure Portal

  2. Selecteer sleutels en eindpunt in het menu aan de linkerkant. U hebt een van de sleutels en het eindpunt nodig om uw API-aanvragen te verifiëren.

  3. Download en installeer het clientbibliotheekpakket voor de gewenste taal:

    Taal Versie van het pakket
    .NET 1.0.0
    Python 1.0.0
  4. Zie de volgende referentiedocumentatie voor meer informatie over de client en retourobject:

Service- en gegevenslimieten

Zie het artikel servicelimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.