Share via


Személyazonosítási információk (PII) észlelése és újbóli megadása beszélgetésekben

A Beszélgetési PII funkció kiértékeli a beszélgetéseket, hogy bizalmas információkat (PII) nyerjen ki a tartalomban több előre meghatározott kategóriából, és újra ki tudja őket terjeszteni. Ez az API átírt szövegeken (átiratként hivatkozva) és csevegéseken is működik. Az átiratok esetében az API lehetővé teszi a hangszegmensek újbóli használatát is, amely tartalmazza a PII-információkat az adott hangszegmensek hangidőzítési információinak megadásával.

Az adatok feldolgozásának meghatározása (nem kötelező)

A PII-észlelési modell megadása

Alapértelmezés szerint ez a funkció a legújabb elérhető AI-modellt fogja használni a bemeneten. Az API-kéréseket konfigurálhatja egy adott modellverzió használatára is.

Nyelvi támogatás

A beszélgetési PII előzetes API jelenleg csak az angol nyelvet támogatja.

Régiós támogatás

A beszélgetési PII előzetes API jelenleg a Language szolgáltatás által támogatott összes Azure-régiót támogatja.

Adatok elküldése

Megjegyzés

A Language Studio cikkből megtudhatja, hogy a Language Studio használatával szeretné-e elküldeni a beszélgetési szöveget.

A bemenetet elküldheti az API-nak beszélgetési elemek listájaként. Az elemzés a kérelem megkapásakor történik meg. Mivel az API aszinkron, előfordulhat, hogy egy API-kérés küldése és az eredmények fogadása között késés tapasztalható. A percenként és másodpercenként küldhető kérelmek méretével és számával kapcsolatos információkért lásd az alábbi adatkorlátokat.

Az aszinkron funkció használatakor az API-eredmények a kérés betöltésétől számítva 24 órán át érhetők el, és a válasz jelzi. Ezt az időtartamot követően az eredmények törlődnek, és már nem érhetők el lekérésre.

Amikor adatokat küld a beszélgetési PII-nek, kérésenként egy beszélgetést (csevegést vagy beszéltet) küldhet.

Az API megpróbálja észlelni az adott beszélgetési bemenet összes definiált entitáskategóriát . Ha meg szeretné adni, hogy mely entitásokat észleli és adja vissza, használja a választható piiCategories paramétert a megfelelő entitáskategóriákkal.

A beszélt átiratok esetében az észlelt entitások a redactionSource megadott paraméterértéken lesznek visszaadva. Jelenleg a támogatott értékek redactionSource a következők: text, lexical, itn, és maskedItn (amelyek a Speech-ra vannak leképezve a szöveg REST API-jának , lexicalés itnmaskedItn formátumának display\displayTextmegfelelően). Emellett a beszélt átirat bemenetéhez ez az API hangidőzítési információkat is biztosít a hang újraeladásának elősegítéséhez. Az audioRedaction funkció használatához használja az opcionális includeAudioRedaction jelzőt értékekkel true . A hang újraírása a lexikális bemeneti formátum alapján történik.

Megjegyzés

A beszélgetési PII mostantól 40 000 karaktert támogat dokumentumméretként.

PII-eredmények lekérése

A PII-észlelés eredményeinek lekérése után streamelheti az eredményeket egy alkalmazásba, vagy mentheti a kimenetet egy fájlba a helyi rendszeren. Az API-válasz tartalmazza a felismert entitásokat, köztük a kategóriákat és alkategóriákat, valamint a megbízhatósági pontszámokat. A rendszer a PII-entitásokat tartalmazó szöveges sztringet is visszaadja.

Példák

  1. Nyissa meg az erőforrás áttekintési lapját a Azure Portal

  2. A bal oldali menüben válassza a Kulcsok és végpont lehetőséget. Az API-kérések hitelesítéséhez szüksége lesz az egyik kulcsra és a végpontra.

  3. Töltse le és telepítse az ügyféloldali kódtárcsomagot a választott nyelvhez:

    Nyelv Csomag verziója
    .NET 1.0.0
    Python 1.0.0
  4. Az ügyfélről és a visszatérési objektumról az alábbi referenciadokumentációban talál további információt:

Szolgáltatási és adatkorlátok

A percenként és másodpercenként küldhető kérelmek méretével és számával kapcsolatos információkért tekintse meg a szolgáltatáskorlátokról szóló cikket.