Személyazonosítási információk (PII) észlelése és újbóli megadása beszélgetésekben
A Beszélgetési PII funkció kiértékeli a beszélgetéseket, hogy bizalmas információkat (PII) nyerjen ki a tartalomban több előre meghatározott kategóriából, és újra ki tudja őket terjeszteni. Ez az API átírt szövegeken (átiratként hivatkozva) és csevegéseken is működik. Az átiratok esetében az API lehetővé teszi a hangszegmensek újbóli használatát is, amely tartalmazza a PII-információkat az adott hangszegmensek hangidőzítési információinak megadásával.
Az adatok feldolgozásának meghatározása (nem kötelező)
A PII-észlelési modell megadása
Alapértelmezés szerint ez a funkció a legújabb elérhető AI-modellt fogja használni a bemeneten. Az API-kéréseket konfigurálhatja egy adott modellverzió használatára is.
Nyelvi támogatás
A beszélgetési PII előzetes API jelenleg csak az angol nyelvet támogatja.
Régiós támogatás
A beszélgetési PII előzetes API jelenleg a Language szolgáltatás által támogatott összes Azure-régiót támogatja.
Adatok elküldése
Megjegyzés
A Language Studio cikkből megtudhatja, hogy a Language Studio használatával szeretné-e elküldeni a beszélgetési szöveget.
A bemenetet elküldheti az API-nak beszélgetési elemek listájaként. Az elemzés a kérelem megkapásakor történik meg. Mivel az API aszinkron, előfordulhat, hogy egy API-kérés küldése és az eredmények fogadása között késés tapasztalható. A percenként és másodpercenként küldhető kérelmek méretével és számával kapcsolatos információkért lásd az alábbi adatkorlátokat.
Az aszinkron funkció használatakor az API-eredmények a kérés betöltésétől számítva 24 órán át érhetők el, és a válasz jelzi. Ezt az időtartamot követően az eredmények törlődnek, és már nem érhetők el lekérésre.
Amikor adatokat küld a beszélgetési PII-nek, kérésenként egy beszélgetést (csevegést vagy beszéltet) küldhet.
Az API megpróbálja észlelni az adott beszélgetési bemenet összes definiált entitáskategóriát . Ha meg szeretné adni, hogy mely entitásokat észleli és adja vissza, használja a választható piiCategories
paramétert a megfelelő entitáskategóriákkal.
A beszélt átiratok esetében az észlelt entitások a redactionSource
megadott paraméterértéken lesznek visszaadva. Jelenleg a támogatott értékek redactionSource
a következők: text
, lexical
, itn
, és maskedItn
(amelyek a Speech-ra vannak leképezve a szöveg REST API-jának , lexical
és itn
maskedItn
formátumának display
\displayText
megfelelően). Emellett a beszélt átirat bemenetéhez ez az API hangidőzítési információkat is biztosít a hang újraeladásának elősegítéséhez. Az audioRedaction funkció használatához használja az opcionális includeAudioRedaction
jelzőt értékekkel true
. A hang újraírása a lexikális bemeneti formátum alapján történik.
Megjegyzés
A beszélgetési PII mostantól 40 000 karaktert támogat dokumentumméretként.
PII-eredmények lekérése
A PII-észlelés eredményeinek lekérése után streamelheti az eredményeket egy alkalmazásba, vagy mentheti a kimenetet egy fájlba a helyi rendszeren. Az API-válasz tartalmazza a felismert entitásokat, köztük a kategóriákat és alkategóriákat, valamint a megbízhatósági pontszámokat. A rendszer a PII-entitásokat tartalmazó szöveges sztringet is visszaadja.
Példák
Nyissa meg az erőforrás áttekintési lapját a Azure Portal
A bal oldali menüben válassza a Kulcsok és végpont lehetőséget. Az API-kérések hitelesítéséhez szüksége lesz az egyik kulcsra és a végpontra.
Töltse le és telepítse az ügyféloldali kódtárcsomagot a választott nyelvhez:
Nyelv Csomag verziója .NET 1.0.0 Python 1.0.0 Az ügyfélről és a visszatérési objektumról az alábbi referenciadokumentációban talál további információt:
Szolgáltatási és adatkorlátok
A percenként és másodpercenként küldhető kérelmek méretével és számával kapcsolatos információkért tekintse meg a szolgáltatáskorlátokról szóló cikket.