Persoonlijke identificatiegegevens (PII) in gesprekken detecteren en redigeren
Met de functie Conversational PII kunnen gesprekken worden geëvalueerd om gevoelige informatie (PII) in de inhoud te extraheren in verschillende vooraf gedefinieerde categorieën en deze te redigeren. Deze API werkt op zowel getranscribeerde tekst (waarnaar wordt verwezen als transcripties) als chats. Voor transcripties maakt de API ook redactie van audiosegmenten mogelijk, die de PII-informatie bevatten door de audiotijdgegevens voor die audiosegmenten op te geven.
Bepalen hoe de gegevens moeten worden verwerkt (optioneel)
Het PII-detectiemodel opgeven
Deze functie maakt standaard gebruik van het nieuwste beschikbare AI-model voor uw invoer. U kunt uw API-aanvragen ook configureren voor het gebruik van een specifieke modelversie.
Taalondersteuning
Op dit moment ondersteunt de api voor de preview-versie van conversational PII alleen de Engelse taal.
Ondersteuning voor regio
Momenteel ondersteunt de conversationele PII Preview-API alle Azure-regio's die worden ondersteund door de Taalservice.
Gegevens verzenden
Notitie
Zie het artikel Language Studio voor informatie over het opmaken van gesprekstekst die moet worden verzonden met Behulp van Language Studio.
U kunt de invoer naar de API verzenden als lijst met gespreksitems. Analyse wordt uitgevoerd na ontvangst van de aanvraag. Omdat de API asynchroon is, kan er een vertraging zijn tussen het verzenden van een API-aanvraag en het ontvangen van de resultaten. Zie de onderstaande gegevenslimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.
Wanneer u de asynchrone functie gebruikt, zijn de API-resultaten 24 uur beschikbaar vanaf het moment dat de aanvraag is opgenomen en worden ze aangegeven in het antwoord. Na deze periode worden de resultaten opgeschoond en kunnen ze niet meer worden opgehaald.
Wanneer u gegevens verzendt naar conversational PII, kunt u één gesprek (chat of gesproken) per aanvraag verzenden.
De API probeert alle gedefinieerde entiteitscategorieën te detecteren voor een bepaalde gespreksinvoer. Als u wilt opgeven welke entiteiten worden gedetecteerd en geretourneerd, gebruikt u de optionele piiCategories
parameter met de juiste entiteitscategorieën.
Voor gesproken transcripties worden de gedetecteerde entiteiten geretourneerd op basis van de redactionSource
opgegeven parameterwaarde. Op dit moment zijn de ondersteunde waarden voor redactionSource
, lexical
, itn
en maskedItn
(die respectievelijk worden toegewezen aan de indeling , en maskedItn
van de REST-API van lexical
itn
display
displayText
\Speech aan tekst).text
Daarnaast biedt deze API voor de gesproken transcriptie-invoer ook informatie over de timing van audio om audioredactie mogelijk te maken. Als u de functie audioRedaction wilt gebruiken, gebruikt u de optionele includeAudioRedaction
vlag met true
waarde. De audioredactie wordt uitgevoerd op basis van de lexicale invoerindeling.
Notitie
Gespreks-PII ondersteunt nu 40.000 tekens als documentgrootte.
PII-resultaten ophalen
Wanneer u resultaten van PII-detectie krijgt, kunt u de resultaten streamen naar een toepassing of de uitvoer opslaan in een bestand op het lokale systeem. Het API-antwoord bevat herkende entiteiten, inclusief hun categorieën en subcategorieën, en betrouwbaarheidsscores. De tekenreeks met de bewerkte PII-entiteiten wordt ook geretourneerd.
Voorbeelden
Ga naar de overzichtspagina van uw resource in de Azure Portal
Selecteer sleutels en eindpunt in het menu aan de linkerkant. U hebt een van de sleutels en het eindpunt nodig om uw API-aanvragen te verifiëren.
Download en installeer het clientbibliotheekpakket voor de gewenste taal:
Taal Versie van het pakket .NET 1.0.0 Python 1.0.0 Zie de volgende referentiedocumentatie voor meer informatie over de client en retourobject:
Service- en gegevenslimieten
Zie het artikel servicelimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.