Share via


PII(개인 식별 정보) 검색 및 수정 방법

PII 기능은 구조화되지 않은 텍스트를 평가하고 사전 정의된 여러 범주에 걸쳐 텍스트에서 중요한 정보(PII) 및 상태 정보(PHI)를 추출 및 편집할 수 있습니다.

개발 옵션

PII 감지를 사용하려면 분석을 위해 텍스트를 제출하고 애플리케이션에서 API 출력을 처리합니다. 분석은 데이터에 사용되는 모델에 대한 사용자 지정 없이 있는 그대로 수행됩니다. PII 감지를 사용하는 방법에는 다음 두 가지가 있습니다.

개발 옵션 설명
Language Studio Language Studio는 등록 시 Azure 계정 및 고유한 데이터 없이 텍스트 예제와 엔터티 링크 설정을 시도할 수 있는 웹 기반 플랫폼입니다. 자세한 내용은 Language Studio 웹 사이트 또는 Language Studio 빠른 시작을 참조하세요.
REST API 또는 클라이언트 라이브러리(Azure SDK) REST API 또는 다양한 언어로 제공되는 클라이언트 라이브러리를 사용하여 PII 감지를 애플리케이션에 통합합니다. 자세한 내용은 PII 감지 빠른 시작을 참조하세요.

데이터 처리 방법 결정(선택 사항)

PII 검색 모델 지정

기본적으로 이 기능은 텍스트에서 사용 가능한 최신 AI 모델을 사용합니다. 특정 모델 버전을 사용하도록 API 요청을 구성할 수도 있습니다.

입력 언어

처리할 문서를 제출할 때 문서가 작성된 지원되는 언어를 지정할 수 있습니다. 언어를 지정하지 않으면 추출은 기본적으로 영어로 설정됩니다. API는 다양한 다국어 및 그림 이모티콘 인코딩을 지원하기 위해 응답에 오프셋을 반환할 수 있습니다.

데이터 제출

요청을 받으면 분석이 수행됩니다. PII 검색 기능을 동기적으로 사용하는 것은 상태 비저장입니다. 계정에 데이터가 저장되지 않으며, 결과가 응답에서 즉시 반환됩니다.

이 기능을 비동기적으로 사용하는 경우 요청이 수집된 시간부터 24시간 동안 API 결과를 사용할 수 있으며 응답에 표시됩니다. 이 기간이 지나면 결과가 제거되고 더 이상 검색할 수 없습니다.

반환할 엔터티 선택

API는 지정된 문서 언어에 대해 정의된 항목 범주를 검색하려고 시도합니다. 검색하고 반환할 엔터티를 지정하려면 적절한 엔터티 범주가 포함된 선택적 piiCategories 매개 변수를 사용합니다. 이 매개 변수를 사용하여 문서 언어에 대해 기본적으로 사용되지 않는 엔터티를 검색할 수도 있습니다. 다음 예에서는 Person만 검색합니다. 반환할 엔터티 형식을 하나 이상 지정할 수 있습니다.

엔터티 범주를 지정할 때 default가 포함되지 않으면 API에서 사용자가 지정한 엔터티 범주만 반환합니다.

입력:

참고 항목

이 예에서는 person 엔터티 형식만 반환합니다.

https://<your-language-resource-endpoint>/language/:analyze-text?api-version=2022-05-01

{
    "kind": "PiiEntityRecognition",
    "parameters": 
    {
        "modelVersion": "latest",
        "piiCategories" :
        [
            "Person"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

출력:


{
    "kind": "PiiEntityRecognitionResults",
    "results": {
        "documents": [
            {
                "redactedText": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is ********) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!",
                "id": "1",
                "entities": [
                    {
                        "text": "John Doe",
                        "category": "Person",
                        "offset": 226,
                        "length": 8,
                        "confidenceScore": 0.98
                    }
                ],
                "warnings": []
            }
        ],
        "errors": [],
        "modelVersion": "2021-01-15"
    }
}

PII 결과 가져오기

PII 검색에서 결과를 얻은 경우 결과를 애플리케이션으로 스트리밍하거나 출력을 로컬 시스템의 파일에 저장할 수 있습니다. API 응답에는 범주, 하위 범주, 신뢰도 점수를 비롯한 인식된 엔터티가 포함됩니다. PII 엔터티가 수정된 텍스트 문자열도 반환됩니다.

서비스 및 데이터 제한

분당 및 초당 보낼 수 있는 요청의 크기와 수에 대한 내용은 서비스 제한 문서를 참조하세요.

다음 단계

명명된 엔터티 인식 개요