Share via


Document Intelligence 계약 모델

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)

이 콘텐츠 적용 대상:확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)

Document Intelligence 계약 모델은 강력한 OCR(광학 인식) 기능을 사용하여 중요한 계약 엔터티의 선택된 그룹에서 키 필드와 품목을 분석하고 추출합니다. 계약은 휴대폰으로 캡처한 이미지, 스캔한 문서, 디지털 PDF 등의 다양한 형식과 품질이 가능합니다. API는 문서 텍스트를 분석합니다. 당사자, 관할권, 계약 ID, 제목과 같은 주요 정보를 추출합니다. 구조화된 JSON 데이터 표현을 반환합니다. 이 모델은 현재 영어 문서 형식을 지원합니다.

자동화된 계약 처리

자동화된 계약 처리는 문서에서 주요 계약 필드를 추출하는 프로세스입니다. 지금까지 계약 분석 프로세스는 수동으로 수행되었으므로 시간이 많이 걸립니다. 계약에서 키 데이터를 정확하게 추출하는 것은 일반적으로 계약 자동화 프로세스에서 가장 중요한 첫 번째 단계 중 하나입니다.

개발 옵션

문서 인텔리전스 v4.0(2024-02-29-미리 보기)은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
계약 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

문서 인텔리전스 v3.1은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
계약 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

문서 인텔리전스 v3.0은 다음 도구, 애플리케이션, 라이브러리를 지원합니다.

기능 리소스 Model ID
계약 모델 문서 인텔리전스 스튜디오
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-contract

입력 요구 사항

  • 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.

  • 지원 파일 형식:

    모델 PDF 이미지:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word(DOCX), Excel(XLSX), PowerPoint(PPTX) 및 HTML
    읽음
    레이아웃 ✔ (2024-02-29-미리 보기, 2023-10-31-미리 보기)
    일반 문서
    사전 제작
    사용자 지정 추출
    사용자 지정 분류 ✔ (2024-02-29-미리 보기)
  • PDF 및 TIFF의 경우 최대 2000페이지를 처리할 수 있습니다(무료 계층 구독의 경우 처음 2페이지만 처리됨).

  • 문서 분석을 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.

  • 이미지 크기는 50 x 50픽셀에서 10,000 x 10,000픽셀 사이여야 합니다.

  • PDF가 암호로 잠긴 경우에는 제출하기 전에 잠금을 해제해야 합니다.

  • 추출할 텍스트의 최소 높이는 1024 x 768 픽셀 이미지의 경우 12픽셀입니다. 이 차원은 150DPI(인치당 도트 수)에서 약 8포인트 텍스트에 해당합니다.

  • 사용자 지정 모델 학습의 경우 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 인공신경망 모델의 경우 50,000개입니다.

    • 사용자 지정 추출 모델 학습의 경우 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1G-MB입니다.

    • 사용자 지정 분류 모델 학습의 경우 학습 데이터의 총 크기는 최대 10,000페이지인 1GB입니다.

계약 문서 데이터 추출 시도

고객 정보, 공급업체 세부 정보, 품목을 포함한 데이터가 계약에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.

  • Azure 구독은 무료로 만들 수 있습니다.

  • Azure Portal의 Document Intelligence 인스턴스입니다. 무료 가격 책정 계층(F0)을 사용하여 서비스를 시도할 수 있습니다. 리소스가 배포된 후 리소스로 이동을 선택하여 키 및 엔드포인트를 가져옵니다.

Azure Portal에서 키 및 엔드포인트 위치의 스크린샷

Document Intelligence Studio

  1. 문서 인텔리전스 스튜디오 홈페이지에서 세금 문서를 선택합니다.

  2. 샘플 세금 문서를 분석하거나 자체 파일을 업로드할 수 있습니다.

  3. 분석 실행 버튼을 선택하고 필요한 경우 분석 옵션을 구성합니다.

    문서 인텔리전스 스튜디오의 분석 실행과 분석 옵션 버튼 스크린샷.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 언어 지원 - 미리 빌드된 모델 페이지를 참조하세요.

필드 추출

다음은 JSON 출력 응답의 계약에서 추출된 필드입니다.

이름 형식 설명 예제 출력
타이틀 문자열 계약 제목 서비스 계약
ContractId 문자열 계약 제목 AB12956
파티 배열 법적 당사자 목록
ExecutionDate 날짜 모든 당사자가 계약에 모두 서명하고 합의한 날짜 On this twenty-third day of February two thousand and twenty two
ExpirationDate 날짜 계약 효력이 종료되는 날짜 1년
RenewalDate 날짜 계약을 갱신해야 하는 날짜 On this twenty-third day of February two thousand and twenty two
관할권 배열 관할권 목록

추출된 계약 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

다음 단계