Share via


Azure AI 문서 인텔리전스의 새로운 기능

이 콘텐츠의 적용 대상:확인 표시v4.0(미리 보기)확인 표시v3.1(GA)확인 표시v3.0(GA)확인 표시v2.1(GA)

문서 인텔리전스 서비스는 지속적으로 업데이트됩니다. 릴리스 정보, 향상된 기능, 최신 설명서를 최신 상태로 유지하려면 이 페이지에 책갈피를 지정하세요.

Important

미리 보기 API 버전은 GA API가 릴리스되면 사용 중지됩니다. 미리 보기 API 또는 관련 SDK 버전을 계속 사용하는 경우 2023-02-28-preview API 버전이 사용 중지됩니다. 최신 API 버전 2023-07-31(GA)을 대상으로 코드를 업데이트하세요.

2024년 5월

문서 인텔리전스 스튜디오에는 Microsoft Entra(이전의 Azure Active Directory) 인증에 대한 지원이 추가되었습니다. 자세한 내용은 문서 인텔리전스 스튜디오 개요참조하세요.

2024년 2월

이제 문서 인텔리전스 2024-02-29-preview는 REST API를 사용할 수 있습니다. 이 미리 보기 API는 다음과 같은 새로운 기능과 업데이트된 기능을 소개합니다.

  • 공개 미리 보기 버전 2024-02-29-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다.

    • 미국 동부
    • 미국 서부2
    • 서유럽
  • 이제 레이아웃 모델그림 검색계층적 문서 구조 분석(섹션 및 하위 섹션)을 지원합니다. 읽는 순서 및 논리적 역할 검색의 AI 품질도 개선되었습니다.

  • 사용자 지정 추출 모델

    • 이제 사용자 지정 추출 모델이 셀, 행 및 테이블 수준 신뢰도 점수를 지원합니다. 표, 행 및 셀 신뢰도에 대해 자세히 알아봅니다.
    • 사용자 지정 추출 모델에는 필드 추출에 대한 AI 품질이 개선되었습니다.
    • 이제 사용자 지정 템플릿 추출 모델이 겹치는 필드 추출을 지원합니다. 겹치는 필드와 사용 방법에 대해 자세히 알아봅니다.
  • 사용자 지정 분류 모델

    • 이제 사용자 지정 분류 모델은 추가 샘플 또는 추가 클래스로 분류자 모델을 업데이트해야 하는 시나리오에 대한 증분 학습을 지원합니다. 증분 학습에 대해 자세히 알아봅니다.
    • 사용자 지정 분류 모델은 Office 문서 형식(.docx, .pptx 및 .xls)에 대한 지원을 추가합니다. 확장된 문서 형식 지원에 대해 자세히 알아봅니다.
  • 청구서 모델

    • 새 로캘에 대한 지원:
    Locale 코드
    아랍어 (ar)
    불가리아어 (bg)
    그리스어 (el)
    히브리어 (he)
    마케도니아어 (mk)
    러시아어(ru) 세르비아 키릴 자모(sr-cyrl)
    우크라이나어 (uk)
    태국어 (th)
    터키어 (tr)
    베트남어 (vi)
    • 새로운 통화 코드 지원:
    통화 Locale 코드
    BAM 보스니아 컨버터블 마크 (ba)
    BGN 불가리아 레프 (bg)
    ILS 이스라엘 뉴 셰켈 (il)
    MKD 마케도니아어 데나르 (mk)
    RUB 러시아 루블 (ru)
    THB 태국 바트 (th)
    TRY 터키 리라 (tr)
    UAH 우크라이나어 흐리브냐 (ua)
    VND 베트남 동 (vn)
    • 세금 항목은 독일(de), 스페인(es), 포르투갈(pt), 영국 캐나다 en-CA에 대한 확장을 지원합니다.
  • ID 모델

  • 🆕 모기지 서류

    • Uniform Residential Loan 신청서(양식 1003)에서 정보를 추출합니다.
    • Uniform Underwriting and Transmittal Summary 또는 양식 1008에서 정보를 추출합니다.
    • 모기지 마감 공개에서 정보를 추출합니다.
  • 🆕 신용/직불 카드 모델

    • 은행 카드에서 정보를 추출합니다.
  • 🆕 결혼 증명서

    • 결혼 인증서에서 정보를 추출하기 위해 새로 미리 빌드되었습니다.

2023년 12월

이제 REST API 2023-10-31-preview를 대상으로 하는 문서 인텔리전스 클라이언트 라이브러리를 사용할 수 있습니다.

2023년 11월

이제 문서 인텔리전스 2023-10-31-preview는 REST API를 사용할 수 있습니다. 이 미리 보기 API는 다음과 같은 새로운 기능과 업데이트된 기능을 소개합니다.

  • 공개 미리 보기 버전 2023-10-31-preview는 현재 다음 Azure 지역에서만 사용할 수 있습니다.

    • 미국 동부
    • 미국 서부2
    • 서유럽
  • 읽기 모델

    • 필기용 언어 확장: 러시아어(ru), 아랍어(ar), 태국어(th).
    • 사이버 EO(행정 명령) 규정 준수.
  • 레이아웃 모델

    • Office 및 HTML 파일을 지원합니다.
    • Markdown 출력 지원.
    • 테이블 추출, 읽기 순서 및 섹션 제목 검색이 향상되었습니다.
    • 문서 인텔리전스 2023-10-31-preview를 사용하면 일반 문서 모델(미리 빌드된 문서)이 더 이상 사용되지 않습니다. 앞으로 문서에서 키-값 쌍을 추출하려면 선택적 쿼리 문자열 매개 변수 features=keyValuePairs가 사용하도록 설정된 prebuilt-layout 모델을 사용합니다.
  • 영수증 모델

    • 이제 모든 가격 관련 필드에 대한 통화를 추출합니다.
  • 의료 보험 카드 모델

    • Medicare 및 Medicaid 정보에 대한 새 필드 지원.
  • 미국 세금 문서 모델

    • 새로운 1099 세금 모델. 기본 1099 양식과 A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB​ 변형을 지원합니다..
  • 청구서 모델

    • KVK 필드를 지원합니다.
    • BPAY 필드를 지원합니다.
    • 다양한 필드 구체화.
  • 사용자 지정 분류

    • 다 언어 문서에 대한 지원.
    • 새 페이지 분할 옵션: 자동 분할, 항상 페이지별로 분할, 분할 없음.
  • 추가 기능

    • 쿼리 필드2023-10-31-preview 릴리스에서 사용할 수 있습니다.
    • 추가 기능은 읽기 모델을 제외한 모든 모델 내에서 사용할 수 있습니다.

참고 항목

2022년 8월 31일 API GA(일반 공급) 릴리스부터 관련 미리 보기 API가 더 이상 사용되지 않습니다. 2021-09-30-미리 보기, 2022-01-30-미리 보기 또는 2022-06-30-미리 보기 API 버전을 사용하는 경우 2022-08-31 API 버전을 대상으로 하도록 애플리케이션을 업데이트하세요. 몇 가지 사소한 변경 내용이 포함됩니다. 자세한 내용은 마이그레이션 가이드를 참조하세요.

2023년 7월

참고 항목

Form Recognizer는 이제 Azure AI 문서 인텔리전스입니다!

  • Document, Azure AI 서비스는 이전에 Cognitive Services 및 Azure Applied AI Services로 알려진 모든 서비스를 포함합니다.
  • 가격 책정에는 변화가 없습니다.
  • Cognitive ServicesAzure Applied AI라는 이름은 Azure 청구, 비용 분석, 가격 목록 및 가격 API에서 계속 사용됩니다.
  • API(애플리케이션 프로그래밍 인터페이스) 또는 클라이언트 라이브러리에 대한 호환성이 손상되는 변경은 없습니다.
  • 일부 플랫폼은 여전히 이름 변경 업데이트를 기다리고 있습니다. 설명서에서 Form Recognizer 또는 문서 인텔리전스에 대한 모든 언급은 동일한 Azure 서비스를 나타냅니다.

문서 인텔리전스 v3.1(GA)

문서 인텔리전스 버전 3.1 API가 이제 일반 공급(GA)되었습니다! API 버전은 2023-07-31에 해당합니다. v3.1 API에는 새로운 기능과 업데이트된 기능이 도입되었습니다.

문서 인텔리전스 스튜디오 UX 업데이트

✔️ 옵션 분석

  • 문서 인텔리전스는 이제 보다 정교한 분석 기능을 지원하며 스튜디오에서는 추가 기능을 쉽게 구성할 수 있는 하나의 진입점(분석 옵션 버튼)을 허용합니다.

  • 문서 추출 시나리오에 따라 분석 범위, 문서 페이지 범위, 선택적 탐지, 프리미엄 탐지 기능을 구성합니다.

    스튜디오에서 옵션을 구성하기 위해 옵션 분석 단추를 사용하는 모습을 보여주는 애니메이션 스크린샷.

    참고 항목

    문서 인텔리전스 스튜디오에서는 글꼴 추출이 시각화되지 않습니다. 하지만 JSON 출력의 스타일 섹션에서 글꼴 탐지 결과를 확인할 수 있습니다.

✔️ 사전 제작된 모델 또는 자체 모델 중 하나를 사용하여 문서에 자동 레이블 지정

  • 사용자 지정 추출 모델 레이블 지정 페이지에서 이제 문서 인텔리전스 Service 사전 빌드된 모델 또는 이전에 학습한 모델 중 하나를 사용하여 문서에 자동 레이블을 지정할 수 있습니다.

    스튜디오의 자동 레이블 지정을 보여주는 애니메이션 스크린샷.

  • 일부 문서의 경우 자동 레이블을 실행한 후 레이블이 중복될 수 있습니다. 이후 레이블 지정 페이지에 중복 레이블이 없도록 레이블을 수정하시기 바랍니다.

    자동 레이블 지정 후 중복 레이블 경고를 보여주는 스크린샷.

✔️ 자동 레이블 지정 표

  • 사용자 지정 추출 모델 레이블 지정 페이지에서 이제 테이블에 수동으로 레이블을 지정할 필요 없이 문서의 테이블에 자동으로 레이블을 지정할 수 있습니다.

    스튜디오의 자동 테이블 레이블 지정을 보여주는 애니메이션 스크린샷.

✔️ 학습 데이터 세트에 직접 테스트 파일 추가

  • 사용자 지정 추출 모델을 학습시킨 후에는 테스트 페이지를 사용하여 필요한 경우 테스트 문서를 학습 데이터 세트에 업로드하여 모델 품질을 향상시킵니다.

  • 일부 레이블에 대해 낮은 신뢰도 점수가 반환되면 레이블이 올바르게 지정되었는지 확인하세요. 그렇지 않은 경우 학습 데이터 세트에 추가하고 레이블을 다시 지정하여 모델 품질을 향상시키세요.

학습 데이터 세트에 테스트 파일을 추가하는 방법을 보여주는 애니메이션 스크린샷

✔️ 맞춤 프로젝트에서 문서 목록 옵션 및 필터를 활용하세요.

  • 사용자 지정 추출 모델 레이블 지정 페이지를 사용합니다. 이제 검색, 필터링, 정렬 기능을 사용하여 학습 문서를 쉽게 탐색할 수 있습니다.

  • 그리드 보기를 활용하여 문서를 미리 보거나 목록 보기를 사용하여 문서를 더 쉽게 스크롤할 수 있습니다.

    문서 목록 보기 옵션 및 필터를 보여주는 스크린샷.

✔️ 프로젝트 공유

2023년 5월

빌드 2023에 대한 새로워진 문서 소개

2023년 4월

최신 문서 인텔리전스 클라이언트 라이브러리 공개 미리 보기 릴리스 발표

2023년 3월

Important

2023-02-28-preview 기능은 현재는 다음 지역에서만 제공됩니다.

  • 서유럽
  • 미국 서부2
  • 미국 동부
  • 사용자 지정 분류 모델2023-02-28-preview API로 시작하는 문서 인텔리전스의 새로운 기능입니다. 문서 인텔리전스 스튜디오 또는 REST API를 사용하여 문서 분류 기능을 사용해 보세요.
  • 일반 문서 모델에 추가된 쿼리 필드 기능은 Azure OpenAI 모델을 사용하여 문서에서 특정 필드를 추출합니다. 문서 인텔리전스 스튜디오를 사용하여 쿼리 필드가 있는 일반 문서 기능을 사용해 보세요. 쿼리 필드는 현재 East US 지역의 리소스에 대해서만 활성화되어 있습니다.
  • 추가 기능:
    • 글꼴 추출은 이제 2023-02-28-preview API를 사용하여 인식됩니다.
    • 수식 추출은 이제 2023-02-28-preview API를 사용하여 인식됩니다.
    • 고해상도 추출은 이제 2023-02-28-preview API를 사용하여 인식됩니다.
  • 사용자 지정 추출 모델 업데이트:
  • 문서 인텔리전스 스튜디오 업데이트:
    • 분류 및 쿼리 필드와 같은 모든 새로운 기능을 지원하는 것 외에도 Studio는 이제 사용자 지정 모델 프로젝트에 대한 프로젝트 공유를 사용하도록 설정합니다.
    • 제한적 미리 보기에 새로운 모델 추가: 예방 접종 카드, 계약서, 미국 세금 1098, 미국 세금 1098-E 미국 세금 1098-T. 제한적 미리 보기 모델에 대한 액세스를 요청하려면 문서 인텔리전스 비공개 미리 보기 요청 양식을 작성하여 제출하세요.
  • 영수증 모델 업데이트:
    • 영수증 모델은 열 영수증에 대한 지원을 추가합니다.
    • 이제 영수증 모델에 18개 언어와 3개 지역 언어(영어, 프랑스어, 포르투갈어)에 대한 언어 지원을 추가합니다.
    • 영수증 모델은 이제 TaxDetails 추출을 지원합니다.
  • 이제 레이아웃 모델에서 테이블 인식이 향상되었습니다.
  • 이제 읽기 모델에서 한 자리 문자 인식에 대한 개선이 추가되었습니다.

2023년 2월

  • 이제 v3.0용 Select 문서 인텔리전스 컨테이너를 사용할 수 있습니다!

  • 현재 읽기 v3.0레이아웃 v3.0 컨테이너를 사용할 수 있습니다.

    자세한 내용은문서 인텔리전스 컨테이너 설치 및 실행을 참조하세요.


2023년 1월

  • 미리 빌드된 영수증 모델 - 지원되는 언어가 추가되었습니다. 영수증 모델은 이제 이러한 추가된 언어 및 로캘을 지원합니다

    • 일본어 - 일본(ja-JP)
    • 프랑스어 - 캐나다(fr-CA)
    • 네덜란드어 - 네덜란드(nl-NL)
    • 영어 - 아랍에미리트(en-AE)
    • 포르투갈어 - 브라질(pr-BR)
  • 미리 빌드된 청구서 모델 - 지원되는 언어가 추가되었습니다. 청구서 모델은 이제 이러한 추가된 언어 및 로캘을 지원합니다

    • 영어 - 미국(en-US), 오스트레일리아(en-AU), 캐나다(en-CA), 영국(en-UK), 인도(en-IN)
    • 스페인어 - 스페인(es-ES)
    • 프랑스어 - 프랑스(fr-FR)
    • 이탈리아어 - 이탈리아(it-IT)
    • 포르투갈어 -포르투갈(pt-PT)
    • 네덜란드어 - 네덜란드(nl-NL)
  • 미리 빌드된 청구서 모델 - 인식된 필드가 추가되었습니다. 이제 청구서 모델에서 이러한 추가 필드를 인식합니다

    • 통화 코드
    • 지불 옵션
    • 총 할인
    • 세금 항목(en-IN에만 해당)
  • 미리 빌드된 ID 모델 - 지원되는 문서 형식이 추가되었습니다. 이제 ID 모델은 이러한 추가된 문서 형식을 지원합니다

    • 미국 군사 ID

모든 2023년 1월 업데이트는 REST API 버전 2022-08-31(GA)에서 사용할 수 있습니다.

  • 미리 빌드된 영수증 모델 - 추가 언어 지원:

    미리 빌드된 영수증 모델에 다음 언어에 대한 지원이 추가됩니다.

    • 영어 - 아랍에미리트(en-AE)
    • 네덜란드어 - 네덜란드(nl-NL)
    • 프랑스어 - 캐나다(fr-CA)
    • 독일어 - (de-DE)
    • 이탈리아어 - (it-IT)
    • 일본어 - 일본(ja-JP)
    • 포르투갈어 - 브라질(pr-BR)
  • 미리 빌드된 청구서 모델 - 추가 언어 지원 및 필드 추출

    미리 빌드된 청구서 모델에 다음 언어에 대한 지원이 추가됩니다.

    • 영어 - 오스트레일리아(en-AU), 캐나다(en-CA), 영국(en-UK), 인도(en-IN)
    • 포르투갈어 - 브라질(pr-BR)

    이제 미리 빌드된 청구서 모델에 다음 필드 추출에 대한 지원이 추가됩니다.

    • 통화 코드
    • 지불 옵션
    • 총 할인
    • 세금 항목(en-IN에만 해당)
  • 미리 빌드된 ID 문서 모델 - 추가 문서 유형 지원

    이제 미리 빌드된 ID 문서 모델에 다음 문서 유형에 대한 지원이 추가됩니다.

    • 인도, 캐나다, 영국 및 호주를 지원하도록 운전 면허증 확장
    • 미군 신분증 및 문서
    • 인도 ID 카드 및 문서(PAN 및 아드하르)
    • 오스트레일리아 ID 카드 및 문서(사진 카드, 키 패스 ID)
    • 캐나다 ID 카드 및 문서(ID 카드, 메이플 카드)
    • 영국 신분증 및 서류(국가/지역 신분증)

2022년 12월

  • 문서 인텔리전스 스튜디오 업데이트

    12월 문서 인텔리전스 스튜디오 릴리스에는 문서 인텔리전스 스튜디오에 대한 최신 업데이트가 포함되어 있습니다. 주로 사용자 지정 모델 레이블 지정 지원을 통해 사용자 환경이 크게 개선되었습니다.

    • 페이지 범위. 이제 Studio는 문서에서 지정된 페이지 분석을 지원합니다.

    • 사용자 지정 모델 레이블 지정:

      • 레이아웃 API를 자동으로 실행합니다. 사용자 지정 모델에 대한 설정 프로세스 중에 Blob Storage의 모든 문서에 대해 레이아웃 API를 자동으로 실행하도록 선택할 수 있습니다.

      • 검색. 이제 Studio에는 문서 내에서 단어를 찾는 검색 기능이 포함되어 있습니다. 이렇게 개선하면 레이블을 지정하는 동안 탐색이 더 쉬워질 수 있습니다.

      • 탐색. 레이블을 선택하여 문서 내에서 레이블이 지정된 단어를 대상으로 지정할 수 있습니다.

      • 자동 테이블 레이블 지정. 문서 내에서 테이블 아이콘을 선택한 후 레이블 지정 보기에서 추출된 테이블의 레이블을 자동으로 지정하도록 선택할 수 있습니다.

      • 레이블 하위 형식 및 두 번째 수준 하위 형식 이제 Studio는 날짜 및 숫자와 같은 형식에 대해 테이블 열, 테이블 행 및 두 번째 수준 하위 형식에 대한 하위 형식을 지원합니다.

  • 이제 US Gov 버지니아 지역에서 사용자 지정 신경망 모델 빌드가 지원됩니다.

  • 미리 보기 API 버전 2022-01-30-preview2021-09-30-preview 는 2023년 1월 31일에 사용 중지됩니다. 서비스 중단을 방지하기 위해 2022-08-31 API 버전으로 업데이트하세요.


2022년 11월

  • Azure AI 문서 인텔리전스 라이브러리의 최신 안정 릴리스 발표
    • 이 릴리스에는 .NET, Java, JavaScript 및 Python 클라이언트 라이브러리에 대한 중요한 변경 내용과 업데이트가 포함되어 있습니다. 자세한 내용은 Azure SDK DevBlog참조하세요.
    • 가장 중요한 향상된 기능은 및 의 두 개의 새 클라이언트 DocumentAnalysisClientDocumentModelAdministrationClient를 도입하는 것입니다.

2022년 10월

  • 문서 인텔리전스 버전이 지정된 콘텐츠

    • 버전별 환경을 제공하기 위해 문서 인텔리전스 문서가 업데이트됩니다. 이제 v3.0 GA 환경 또는 v2.1 GA 환경을 대상으로 지정하는 콘텐츠를 보도록 선택할 수 있습니다. v3.0 환경이 기본값입니다.

      버전 드롭다운 메뉴를 나타내는 문서 인텔리전스 시작 페이지의 스크린샷.

  • 문서 인텔리전스 스튜디오 샘플 코드

    • 이제 문서 인텔리전스 스튜디오 레이블 지정 환경의 샘플 코드를 GitHub에서 사용할 수 있습니다. 고객은 문서 인텔리전스를 개발하여 자신의 UX에 통합하거나 문서 인텔리전스 스튜디오 샘플 코드를 사용하여 자신만의 새로운 UX를 빌드할 수 있습니다.
  • 언어 확장

    • 최신 미리 보기 릴리스를 통해 문서 인텔리전스의 OCR(읽기), 레이아웃 및 사용자 지정 템플릿 모델은 134개의 새로운 언어를 지원합니다. 추가된 언어에는 그리스어, 라트비아어, 세르비아어, 태국어, 우크라이나어, 베트남어와 여러 라틴어, 키릴 자모 언어가 포함됩니다. 문서 인텔리전스는 이제 최신 GA 및 새 미리 보기 버전에서 총 299개 언어를 지원합니다. 지원되는 모든 언어를 보려면 지원되는 언어 페이지를 참조하세요.
    • API 또는 해당 SDK를 사용하여 애플리케이션의 새 언어를 지원하는 경우 REST API 매개 변수 api-version=2022-06-30-preview를 사용합니다.
  • 새로운 미리 빌드된 계약 모델

    • 당사자, 타이틀, 계약 ID, 실행 날짜 등의 정보를 계약에서 추출하는 새로운 미리 빌드된 모델입니다. 계약 모델은 현재 미리 보기로 제공되며 여기에서 액세스를 요청합니다.
  • 사용자 지정 인공신경망 모델 학습 대상 지역 확장

    • 이제 추가 지역에서 사용자 지정 신경망 모델 학습이 지원됩니다.
      • 미국 동부
      • 미국 동부2
      • US Gov 애리조나

2022년 9월

참고 항목

버전 4.0.0부터 문서 인텔리전스 서비스의 최신 기능을 활용하기 위해 새로운 클라이언트 세트가 도입되었습니다.

SDK 버전 4.0.0 GA 릴리스에는 다음 업데이트가 포함되어 있습니다.

  • 버전 4.0.0 GA(2022-09-08)
  • REST API v3.0 및 v2.0 클라이언트 지원

패키지(NuGet)

변경 로그/릴리스 기록

마이그레이션 가이드

추가 정보

샘플

  • 사용자 지정 신경망 모델 학습을 위한 지역 확장은 이제 6개의 새로운 지역에서 지원됩니다

    • 오스트레일리아 동부
    • 미국 중부
    • 동아시아
    • 프랑스 중부
    • 영국 남부
    • 미국 서부2
    • 학습이 지원되는 지역의 전체 목록은 사용자 지정 인공신경망 모델을 참조하세요.

    • 문서 인텔리전스 SDK 버전 4.0.0 GA 릴리스

      • 문서 인텔리전스 클라이언트 라이브러리 버전 4.0.0(.NET/C#, Java, JavaScript) 및 버전 3.2.0(Python)이 일반 공급되어 프로덕션 애플리케이션에서 사용할 수 있습니다!.
      • 문서 인텔리전스 클라이언트 라이브러리에 대한 자세한 내용은 SDK 개요를 참조하세요.
      • 프로그래밍 언어의 마이그레이션 가이드를 사용하여 애플리케이션을 업데이트합니다.

2022년 8월

문서 인텔리전스 SDK 베타 2022년 8월 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.

버전 4.0.0-beta.5(2022-08-09)

변경 로그/릴리스 기록

패키지(NuGet)

SDK 참조 설명서

  • 문서 인텔리전스 v3.0 정식 출시

    • 문서 인텔리전스 REST API v3.0이 이제 정식 출시되어 프로덕션 애플리케이션에서 사용할 수 있습니다! REST API 버전 2022-08-31로 애플리케이션을 업데이트합니다.
  • 문서 인텔리전스 스튜디오 업데이트

    • 다음 단계. 이제 스튜디오의 각 모델 페이지에는 다음 단계 섹션이 있습니다. 사용자는 샘플 코드, 문제 해결 지침 및 가격 정보를 빠르게 참조할 수 있습니다.
    • 사용자 지정 모델. 이제 스튜디오에는 레이블 지정 효율성을 개선하기 위해 사용자 지정 모델 프로젝트에서 레이블을 다시 정렬하는 기능이 포함되어 있습니다.
    • 모델 복사 사용자 지정 모델은 스튜디오 내에서 문서 인텔리전스 서비스 간에 복사할 수 있습니다. 이 작업을 통해 학습된 모델을 다른 환경 및 지역으로 승격할 수 있습니다.
    • 문서 삭제. 이제 스튜디오가 사용자 지정 프로젝트 내에서 레이블이 지정된 데이터 세트에서의 문서 삭제를 지원합니다.
  • 문서 인텔리전스 서비스 업데이트

    • prebuilt-read. 읽기 OCR 모델은 이제 두 가지 새로운 기능인 단락 및 언어 탐지와 함께 문서 인텔리전스에서도 사용할 수 있습니다. 문서 인텔리전스 Read는 문서 인텔리전스의 광범위한 문서 인텔리전스 기능과 연계된 고급 문서 시나리오를 대상으로 합니다.
    • prebuilt-layout. 레이아웃 모델은 단락을 추출하며, 추출된 텍스트는 단락, 제목, 섹션 머리글, 각주, 페이지 머리글, 페이지 바닥글 또는 페이지 번호입니다.
    • prebuilt-invoice. 이제 TotalVAT 및 Line/VAT 필드가 각각 기존 TotalTax 및 Line/Tax 필드로 확인됩니다.
    • prebuilt-idDocument. 미국 주 ID, 사회 보장 및 그린 카드에 대한 데이터 추출 지원. 여권 비자 정보 지원.
    • prebuilt-receipt. 프랑스어(fr-FR), 스페인어(es-ES), 포르투갈어(pt-PT), 이탈리아어(it-IT) 및 독일어(de-DE)에 대한 로캘 지원이 확장되었습니다.
    • prebuilt-businessCard. 주소, 도시, 주, 국가/지역 및 우편번호와 같은 주소 구성 요소에 대한 하위 필드를 추출하는 주소 구문 분석 지원.
  • AI 품질 향상

    • prebuilt-read. 단일 문자, 필기한 날짜, 금액, 이름, 영수증 및 청구서에서 일반적으로 볼 수 있는 기타 키 데이터에 대한 지원이 개선되고 디지털 PDF 문서 처리가 개선되었습니다.
    • prebuilt-layout. 잘린 표, 테두리 없는 테이블 및 긴 스패닝 셀의 향상된 인식에 대한 향상된 검색을 지원합니다.
    • prebuilt-document. 값 및 확인란 검색이 향상되었습니다.
    • custom-neural. 테이블 검색 및 추출에 대한 정확도가 향상되었습니다.

2022년 6월

  • 문서 인텔리전스 SDK 베타 2022년 6월 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.
  • 문서 인텔리전스 스튜디오 6월 릴리스는 문서 인텔리전스 스튜디오의 최신 업데이트입니다. 이 업데이트에서는 사용자 환경과 손쉬운 사용 부분이 크게 향상되었습니다.

    • JavaScript 및 C#용 코드 샘플. 이제 스튜디오 코드 탭은 기존 Python 샘플 외에도 JavaScript 및 C# 코드 샘플을 추가합니다.
    • 새 문서 업로드 UI. 이제 Studio에서 끌어서 놓기를 사용하여 새 업로드 사용자 인터페이스로 문서를 업로드할 수 있습니다.
    • 사용자 지정 프로젝트를 위한 새로운 기능. 이제 사용자 지정 프로젝트는 프로젝트를 구성할 때 스토리지 계정 및 Blob 만들기를 지원합니다. 또한 사용자 지정 프로젝트는 이제 Studio 내에서 직접 학습 파일 업로드 및 기존 사용자 지정 모델 복사를 지원합니다.
  • 문서 인텔리전스 v3.0 2022-06-30-preview 릴리스에서는 기능 API 전반에 걸쳐 광범위한 업데이트를 제공합니다.


2022년 2월

  • 문서 인텔리전스 v3.0 미리 보기 릴리스에는 다음과 같은 몇 가지 새로운 기능 및 향상된 기능이 도입되었습니다.

    • 사용자 지정 신경망 모델 또는 사용자 지정 문서 모델은 정형 양식, 반정형 및 비정형 문서에서 텍스트와 선택 표시를 추출하는 새로운 사용자 지정 모델입니다.
    • W-2 미리 빌드된 모델은 세금 보고 및 소득 확인 시나리오를 위해 W-2 양식에서 필드를 추출하는 새로운 미리 빌드된 모델입니다.
    • 읽기 API는 검색된 경우 출력된 텍스트 줄, 단어, 텍스트 위치, 검색된 언어 및 필기 텍스트를 추출합니다.
    • 일반 문서 미리 학습된 모델이 이제 양식 및 문서의 API 텍스트, 테이블, 구조, 키-값 쌍 외에도 선택 표시를 지원하도록 업데이트되었습니다.
    • 청구서 API 미리 빌드된 청구서 모델은 스페인어 청구서를 지원하도록 확장합니다.
    • 문서 인텔리전스 스튜디오는 읽기, W2, 호텔 영수증 샘플에 대한 새로운 데모를 추가하고 새로운 사용자 지정 인공신경망 모델 학습을 지원합니다.
    • 언어 확장 문서 인텔리전스 읽기, 레이아웃 및 사용자 지정 양식은 아랍어 및 데바나가리 스크립트를 사용하여 아랍어, 힌디어 및 기타 언어를 포함한 42개의 새로운 언어에 대한 지원을 추가하여 적용 범위를 164개 언어로 확장합니다. 필기 언어 지원은 일본어와 한국어로 확장됩니다.
  • v3.0 미리 보기 API에 대한 새로운 REST API, Python 또는 .NET SDK를 시작합니다.

  • 문서 인텔리전스 모델 데이터 추출

    모델 텍스트 추출 키/값 쌍 선택 표시 테이블 시그니처
    읽음
    일반 문서
    레이아웃
    송장
    Receipt
    ID 문서
    명함
    사용자 지정 템플릿
    사용자 지정 인공신경망
  • 문서 인텔리전스 SDK 베타 미리 보기 릴리스에는 다음 업데이트가 포함되어 있습니다.


2021년 11월

  • 문서 인텔리전스 v3.0 미리 보기 SDK 출시 업데이트(beta.2)에는 버그 수정 및 사소한 기능 업데이트가 포함되어 있습니다.

2021년 10월

  • 문서 인텔리전스 v3.0 미리 보기 출시 버전 4.0.0-beta.1(2021-10-07)에는 몇 가지 새로운 기능이 도입되었습니다.

    • 일반 문서 모델은 미리 학습된 모델을 사용하여 양식 및 문서에서 텍스트, 테이블, 구조, 키-값 쌍을 추출하는 새로운 API입니다.

    • 호텔 영수증 모델이 미리 빌드된 영수증 처리에 추가되었습니다.

    • ID 문서에 대한 확장된 필드 ID 모델은 미국 운전 면허증에서 보증, 제한 및 차량 분류 추출을 지원합니다.

    • 서명 필드는 양식 필드에 서명이 있는지 감지하기 위한 사용자 지정 양식의 새로운 필드 형식입니다.

    • 언어 확장 122개 언어(인쇄) 및 7개 언어(필기)를 지원합니다. 문서 인텔리전스 레이아웃 및 사용자 지정 양식은 최신 미리 보기를 통해 지원 언어를 122개로 확장합니다. 미리 보기에는 러시아어, 불가리아어 및 기타 키릴 자모 및 기타 라틴 언어를 포함하여 새로운 49개 언어의 인쇄 텍스트에 대한 텍스트 추출이 포함됩니다. 또한 필기 텍스트 추출 기능은 이제 영어를 포함한 7개 언어를 지원하고 중국어 간체, 프랑스어, 독일어, 이탈리아어, 포르투갈어 및 스페인어의 새로운 미리 보기를 지원합니다.

    • 향상된 테이블 및 텍스트 추출 기능 이제 레이아웃에서 키-값 테이블이라고도 하는 단일 행 테이블 추출을 지원합니다. 향상된 텍스트 추출 기능에는 일반 성능과 함께 ID 문서에서 향상된 디지털 PDF 및 MRZ(Machine Readable Zone) 텍스트 기능이 포함됩니다.

    • 문서 인텔리전스 스튜디오 서비스 사용을 단순화하기 위해 이제 문서 인텔리전스 스튜디오에 액세스하여 사전 빌드된 다양한 모델을 테스트하거나 사용자 지정 모델에 레이블을 지정하고 학습시킬 수 있습니다.

    • v3.0 미리 보기 API에 대한 새로운 REST API, Python 또는 .NET SDK를 시작합니다.

  • 문서 인텔리전스 모델 데이터 추출

    모델 텍스트 추출 키/값 쌍 선택 표시 테이블
    일반 문서
    레이아웃
    송장
    Receipt
    ID 문서
    명함
    사용자 지정

2021년 9월

  • Azure 메트릭 탐색기 고급 기능은 Azure portal의 문서 인텔리전스 리소스 개요 페이지에서 사용할 수 있습니다.

  • 모니터링 메뉴:

    Azure Portal의 모니터링 메뉴를 보여 주는 스크린샷.

  • 차트:

    Azure Portal의 예 메트릭 차트를 보여 주는 스크린샷.

  • ID 문서 모델 업데이트: 마침표의 유무에 관계없이 접미사가 포함된 이름을 지정하면 성공적으로 처리됩니다.

    입력 텍스트 업데이트 결과
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr

2021년 7월

  • 시스템 할당 관리 ID 지원: 이제 시스템 할당 관리 ID를 활성화하여 Virtual Network, 방화벽 또는 BYOS(Bring-Your-Own-Storage)로 보호되는 계정을 포함하여 프라이빗 스토리지 계정에 문서 인텔리전스 제한된 액세스 권한을 부여할 수 있습니다. 자세한 내용은 문서 인텔리전스 리소스에 대한 관리 ID 생성 및 사용을 참조하세요.

2021년 6월

  • 제한 미리 보기로 출시된 문서 인텔리전스 컨테이너 v2.1은 이제 6가지 기능 컨테이너(레이아웃, 명함,ID 문서, 영수증, 청구서사용자 지정)에서 지원됩니다. 이 컨테이너를 사용하려면 온라인 요청을 제출하고 승인을 받아야 합니다.

  • 미리 보기로 출시된 문서 인텔리전스 커넥터: 문서 인텔리전스 커넥터Azure Logic Apps, Microsoft Power AutomateMicrosoft Power Apps와 통합됩니다. 커넥터는 사용자 지정 및 미리 빌드된 양식, 청구서, 영수증, 명함, ID 문서 등에서 문서 데이터와 구조를 추출하고 분석하는 워크플로 작업 및 트리거를 지원합니다.

  • 문서 인텔리전스 SDK v3.1.0은 C#, Java 및 Python용 v3.1.1로 패치되었습니다. 이 패치는 Text가 있지만 BoundingBox 또는 Page 정보가 없는 FormField와 같이 검색된 하위 품목 필드가 없는 청구서를 처리합니다.


2021년 5월

  • 문서 인텔리전스 2.1이 정식 출시되었습니다. GA(일반 공급) 릴리스는 이전의 2.1 미리 보기 패키지 버전에 도입된 변경 내용의 안정성을 표시합니다. 이 릴리스를 사용하면 문서 형식에서 정보 및 데이터를 검색하고 추출할 수 있습니다.

  • 시작하려면 문서 인텔리전스 샘플 도구를 사용해 보고 빠른 시작을 따르세요.

  • 업데이트된 레이아웃 API 테이블 기능은 여러 행에 걸쳐 있을 수 있는 열 머리글을 사용하여 머리글 인식을 추가합니다. 각 테이블 셀에는 머리글의 일부인지 여부를 나타내는 특성이 있습니다. 이 업데이트는 테이블 머리글을 구성하는 행을 식별하는 데 사용할 수 있습니다.


2021년 4월

  • NuGet 패키지 버전 3.1.0-beta.4

  • 변경 로그/릴리스 기록.

  • ID 문서의 데이터를 분석하는 새로운 방법:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    필드 값 목록은 문서 인텔리전스 문서의 참조추출된 필드를 참조하세요.

  • StartRecognizeContent 메서드에 제공할 수 있는 문서 언어 세트가 확장되었습니다.

  • 다음 클래스에서 지원하는 새 Pages 속성:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    Pages 속성을 사용하면 다중 페이지 PDF 및 TIFF 문서에 대한 개별 또는 페이지 범위를 선택할 수 있습니다. 개별 페이지의 경우 페이지 번호(예: 3)를 입력합니다. 페이지 범위(예: 2페이지 및 5~7페이지)의 경우 페이지 번호와 범위를 쉼표로 구분하여 입력합니다(2, 5-7).

  • 다음 클래스에 대해 지원되는 새 속성 ReadingOrder:

    RecognizeContentOptions

    ReadingOrder 속성은 basic 또는 natural의 읽기 순서 알고리즘 중에서 텍스트 요소의 추출 순서에 적용할 알고리즘을 지정할 수 있는 선택적 매개 변수입니다. 지정하지 않으면 기본값 basic입니다.

  • API 버전 2.1-preview.3에 대한 SDK 미리 보기 업데이트는 기능 업데이트 및 향상된 기능을 도입합니다.

2021년 3월

문서 인텔리전스 v2.1 공개 미리 보기 v2.1-preview.3이 출시되었으며 다음 기능이 포함되어 있습니다.

  • 새롭게 미리 빌드된 ID 모델 새롭게 미리 빌드된 ID 모델로 고객은 ID를 가져오고 구조화된 데이터를 반환하여 처리를 자동화할 수 있습니다. 강력한 OCR(광학 인식) 기능과 ID 이해 모델을 결합하여 여권 및 미국 운전 면허증에서 주요 정보를 추출합니다.

    미리 빌드된 ID 모델에 대한 자세한 정보

    샘플 여권의 스크린샷.

  • 청구서 모델에 대한 품목 추출 - 이제 미리 빌드된 청구서 모델에서 품목 추출을 지원합니다. 이제 모든 항목 및 해당 부분(설명, 금액, 수량, 제품 ID, 날짜 등)이 추출됩니다. 간단한 API/SDK 호출로 청구서에서 유용한 데이터(텍스트, 표, 키-값 쌍, 품목)를 추출할 수 있습니다.

    청구서 모델에 대한 자세한 정보.

  • 감독된 테이블 레이블 지정 및 학습, 빈 값 레이블 지정 - 문서 인텔리전스의 최첨단 딥 러닝 자동 테이블 추출 기능 외에도 이제 고객이 테이블에서 레이블을 지정하고 학습할 수 있습니다. 이 새 릴리스에는 품목/표(동적 및 고정)에 대해 레이블을 지정하고 학습시키는 기능과 키-값 쌍 및 품목을 추출하는 사용자 지정 모델을 학습시키는 기능이 포함됩니다. 모델을 학습시키고 나면 모델은 documentResults 섹션에서 JSON 출력의 일부로 품목을 추출합니다.

    테이블 레이블 지정 기능의 스크린샷.

    이제 테이블에 레이블을 지정하는 것 외에도 빈 값 및 지역에 레이블을 지정할 수 있습니다. 학습 집합의 일부 문서에 특정 필드에 대한 값이 없는 경우 모델에서 분석된 문서로부터 값을 적절하게 추출할 수 있도록 레이블을 지정할 수 있습니다.

  • 66개의 새로운 언어 지원 - 문서 인텔리전스용 레이아웃 API 및 사용자 지정 모델은 이제 73개 언어를 지원합니다.

    문서 인텔리전스의 언어 지원에 대해 자세히 알아보기

  • 자연스러운 읽기 순서, 필기 분류 및 페이지 선택 - 이 업데이트를 사용하면 기본 왼쪽에서 오른쪽 방향으로, 위쪽에서 아래쪽으로 정렬하는 대신 기본 읽기 순서로 텍스트 줄 출력을 가져오도록 선택할 수 있습니다. 새 readingOrder 쿼리 매개 변수를 사용하고 사용자에게 더 친숙한 읽기 순서로 출력되도록 "natural" 값으로 설정합니다. 또한 라틴어 언어의 경우 문서 인텔리전스는 텍스트 줄을 손으로 쓴 스타일인지 여부를 분류하고 신뢰도 점수를 제공합니다.

  • 미리 빌드된 영수증 모델 품질 개선 사항 이 업데이트에는 특히 품목 추출과 관련하여 미리 빌드된 영수증 모델에 대한 많은 품질 개선 사항이 포함되어 있습니다.


2020년 11월

  • 문서 인텔리전스 v2.1-preview.2가 출시되었으며 다음 기능이 포함되어 있습니다.

    • 새롭게 미리 빌드된 청구서 모델 - 새롭게 미리 빌드된 청구서 모델로 고객은 다양한 형식의 청구서를 가져오고 구조화된 데이터를 반환하여 청구서 처리를 자동화할 수 있습니다. 강력한 OCR(광학 인식) 기능을 청구서 해석 딥 러닝 모델과 결합하여 영어로 된 청구서에서 주요 정보를 추출합니다. 키 텍스트, 표 및 고객, 공급업체, 청구서 ID, 청구서 기한, 총액, 지불액, 세금, 배송지, 청구지 등과 같은 정보를 추출합니다.

      미리 빌드된 청구서 모델에 대한 자세한 정보

      샘플 청구서의 스크린샷

    • 향상된 테이블 추출 - 문서 인텔리전스는 이제 강력한 광학 문자 인식(OCR) 기능과 딥 러닝 테이블 추출 모델을 결합한 향상된 테이블 추출을 제공합니다. 문서 인텔리전스는 병합된 열, 행, 테두리 없음 등이 포함된 복잡한 테이블을 포함하여 테이블에서 데이터를 추출할 수 있습니다.

      테이블 분석의 스크린샷.

      레이아웃 추출에 대한 자세한 정보.

    • 클라이언트 라이브러리 업데이트 - .NET, Python, Java 및 JavaScript용 클라이언트 라이브러리의 최신 버전은 문서 인텔리전스 2.1 API를 지원합니다.

    • 지원되는 새 언어: 일본어 - 이제 다음 새 언어가 지원됩니다. AnalyzeLayoutAnalyzeCustomForm에 대해 일본어(ja)가 지원됩니다. 언어 지원.

    • 텍스트 줄 스타일 표시(필기/기타)(라틴어만 해당) - 문서 인텔리전스는 이제 각 텍스트 줄이 필기 스타일인지 여부를 분류하는 appearance 개체를 신뢰도 점수와 함께 출력합니다. 이 기능은 라틴어에 대해서만 지원됩니다.

    • 품질 개선 사항 - 한 자릿수 추출 개선 사항을 포함하여 추출 기능이 개선되었습니다.

    • 문서 인텔리전스 샘플 및 레이블 지정 도구의 새로운 시험 기능 - 문서 인텔리전스 샘플 레이블 지정 도구를 사용하여 미리 작성된 청구서, 영수증, 명함 모델과 레이아웃 API를 시험해 볼 수 있는 기능입니다. 코드를 작성하지 않고 데이터를 추출하는 방법을 참조하세요.

    • 문서 인텔리전스 샘플 레이블 지정 도구를 사용해 보세요.

      샘플 레이블 지정 도구 홈페이지의 스크린샷.

      • 피드백 반복 - 샘플 레이블 지정 도구를 통해 파일을 분석할 때 이제 이를 학습 세트에 추가하고, 필요한 경우 레이블을 조정하고, 모델을 향상시키기 위해 학습시킬 수도 있습니다.
      • 문서 자동 레이블 지정 - 프로젝트에서 이전에 레이블이 지정된 문서를 기준으로 추가된 문서에 자동으로 레이블을 지정합니다.

2020년 8월

  • **문서 인텔리전스 v2.1-preview.1에는 다음 기능이 포함됩니다.

    • REST API 참조 사용 가능 - v2.1-preview.1 reference 보기
    • 영어 외에 지원되는 새 언어, 이제 다음 언어가 지원됩니다. LayoutTrain Custom Model에 대해 영어(en), 중국어(간체)(zh-Hans), 네덜란드어(nl), 프랑스어(fr), 독일어(de), 이탈리아어(it), 포르투갈어(pt), 스페인어(es)가 지원됩니다.
    • 확인란/선택 표시 탐지 – 문서 인텔리전스는 체크박스, 라디오 버튼과 같은 선택 표시의 탐지 및 추출을 지원합니다. 선택 표시는 Layout에서 추출되며, 이제 Train Custom Model - 레이블을 사용하여에서 레이블을 지정하고 학습시켜 선택 표시에 대한 키 값 쌍을 추출할 수도 있습니다.
    • 모델 작성 - 단일 모델 ID로 여러 개의 모델을 작성하고 호출할 수 있습니다. 작성된 모델 ID를 사용하여 분석할 문서를 제출하면 먼저 분류 단계를 수행하여 올바른 사용자 지정 모델로 라우팅합니다. 모델 작성 기능은 Train Custom Model - 레이블을 사용하여 학습에서 사용할 수 있습니다.
    • 모델 이름 - 더 쉽게 관리하고 추적할 수 있도록 사용자 지정 모델에 식별 이름을 추가합니다.
    • 명함용 새로운 미리 빌드된 모델 - 영어 명함에서 일반 필드를 추출합니다.
    • 미리 빌드된 영수증용 새로운 로캘 - EN-US 외에 이제 EN-AU, EN-CA, EN-GB, EN-IN에 대한 지원이 제공됩니다.
    • 품질 개선 사항Layout, Train Custom Model - 레이블 없이 학습레이블을 사용하여 학습.
  • v2.0에는 다음 업데이트가 포함됩니다.

    새 샘플은 GitHub에서 사용할 수 있습니다.

    • Knowledge Extraction Recipes - Forms Playbook은 실제 문서 인텔리전스 고객 참여에서 모범 사례를 수집하고 이러한 프로젝트 개발에 사용되는 사용 가능한 코드 샘플, 체크리스트 및 샘플 파이프라인을 제공합니다.
    • 샘플 레이블 지정 도구는 새 v2.1 기능을 지원하도록 업데이트됩니다. 도구를 시작하려면 이 빠른 시작을 참조하세요.
    • Intelligent Kiosk 문서 인텔리전스 샘플은 Analyze ReceiptTrain Custom Model - 레이블 없이 학습을 통합하는 방법을 보여줍니다.

2020년 7월

  • 사용 가능한 문서 인텔리전스 v2.0 참조 - v2.0 API 참조.NET, Python, JavaJavaScript대한 업데이트된 클라이언트 라이브러리를 봅니다.
    • 표 기능 향상 및 추출 기능 향상 - 정확도 개선 및 표 추출 기능 향상, 특히 레이블 없이 사용자 지정 학습에서 표 헤더와 구조를 학습하는 기능을 포함합니다.

    • 통화 지원 - 전세계 통화 기호의 검색 및 추출을 지원합니다.

    • Azure Gov - 이제 Azure Gov에서도 문서 인텔리전스를 사용할 수 있습니다.

    • 강화된 보안 기능:

      • 자체 키 가져오기 - 문서 인텔리전스는 데이터를 클라우드에 보관할 때 자동으로 암호화하여 데이터를 보호하고 조직의 보안 및 규정 준수 약속을 이행하도록 돕습니다. 기본적으로 구독은 Microsoft에서 관리하는 암호화 키를 사용합니다. 이제 사용자 고유의 암호화 키로 구독을 관리할 수도 있습니다. 고객 관리 키(BYOK(Bring Your Own Key)라고도 함)를 사용하여 훨씬 더 유연하게 액세스 제어를 만들고, 회전하고, 해제하고, 취소할 수 있습니다. 데이터를 보호하는 데 사용되는 암호화 키를 감사할 수도 있습니다.
      • 프라이빗 엔드포인트 – 가상 네트워크에서 프라이빗 링크를 통해 데이터에 안전하게 액세스할 수 있게 합니다.

2020년 6월


2020년 4월

  • 문서 인텔리전스 API v2.0 공개 미리 보기에 대한 SDK 지원 - 이번 달에는 문서 인텔리전스 v2.0 릴리스용 미리 보기 SDK를 포함하도록 서비스 지원을 확장했습니다. 아래 링크를 사용하여 선택한 언어로 시작합니다.
  • .NET SDK
  • Java SDK
  • Python SDK
  • JavaScript SDK

새 SDK는 문서 인텔리전스용 v2.0 REST API의 모든 기능을 지원합니다. SDK 피드백 양식을 통해 클라이언트 라이브러리에 대한 피드백을 공유할 수 있습니다.

  • 사용자 지정 모델 복사 이제 새로운 사용자 지정 모델 복사 기능을 사용하여 지역과 구독 간에 모델을 복사할 수 있습니다. 사용자 지정 모델 복사 API를 호출하기 전에 먼저 대상 리소스로 복사할 권한 부여를 가져와야 합니다. 이 권한 부여는 대상 리소스 엔드포인트에 대해 권한 부여 복사 작업을 호출하여 보호됩니다.

  • 복사 권한 부여 생성 REST API.

  • 사용자 지정 모델 복사 REST API.

  • 보안이 개선되었습니다.

  • 이제 FormRecognizer에서 고객 관리형 키를 사용할 수 있습니다. 자세한 내용은 문서 인텔리전스를 위한 저장 데이터 암호화를 참조하세요.

  • Azure Active Directory로 Azure 리소스에 액세스하기 위해 관리 ID를 사용합니다. 자세한 내용은 관리 ID에 대한 액세스 권한 부여를 참조하세요.


2020년 3월

  • 레이블 지정을 위한 값 유형 이제 문서 인텔리전스 샘플 레이블 지정 도구를 사용하여 레이블을 지정하는 값 유형을 지정할 수 있습니다. 현재 지원되는 값 형식 및 변형은 다음과 같습니다.
  • string
    • 기본값, no-whitespaces, alphanumeric
  • number
    • 기본값, currency
  • date
    • 기본값, dmy, mdy, ymd
  • time
  • integer

이 기능을 사용하는 방법에 대한 자세한 내용은 샘플 레이블 지정 도구 가이드를 참조하세요.

  • 테이블 시각화 이제 샘플 레이블 지정 도구에는 문서에서 인식된 테이블이 표시됩니다. 이 기능을 사용하면 레이블을 지정하고 분석하기 전에 문서에서 인식되고 추출된 테이블을 볼 수 있습니다. 이 기능은 레이어 옵션을 사용하여 켜거나 끌 수 있습니다.

  • 다음 이미지는 표를 인식하고 추출하는 방법의 예입니다.

    샘플 레이블 지정 도구를 사용한 표 시각화 스크린샷.

  • 추출된 표는 "pageResults" 아래의 JSON 출력에서 사용할 수 있습니다.

    Important

    표에 레이블을 지정하는 기능은 지원되지 않습니다. 표가 자동으로 인식 및 추출되지 않으면 키/값 쌍으로만 레이블을 지정할 수 있습니다. 표에 키/값 쌍으로 레이블을 지정할 때 각 셀에 고유한 값으로 레이블을 지정합니다.

  • 추출 기능 향상.

  • 이 릴리스에는 추출 기능 향상 및 정확성 개선, 특히 동일한 텍스트 줄에서 여러 개의 키/값 쌍을 레이블 지정하고 추출하는 기능이 포함되어 있습니다.

  • 이제 오픈 소스로 제공되는 샘플 레이블 지정 도구

  • 이제 문서 인텔리전스 샘플 레이블 지정 도구를 오픈 소스 프로젝트로 사용할 수 있습니다. 솔루션 내에서 통합하고 필요에 맞게 고객 전용 변경을 수행할 수 있습니다.

  • 문서 인텔리전스 샘플 레이블 지정 도구에 대한 자세한 내용은 GitHub에서 제공되는 문서를 검토하세요.

  • TLS 1.2 적용

  • TLS 이제 이 서비스에 대한 모든 HTTP 요청에 1.2가 적용됩니다. 자세한 내용은 Azure AI 서비스 보안을 참조하세요.


2020년 1월

이번 릴리스에는 문서 인텔리전스 2.0이 도입되었습니다. 다음 섹션에서 새로운 기능, 기능 향상, 변경 내용에 대한 자세한 정보를 확인할 수 있습니다.

  • 새로운 기능

    • 사용자 지정 모델

      • 레이블을 사용하여 학습 이제 수동으로 레이블이 지정된 데이터로 사용자 지정 모델을 학습시킬 수 있습니다. 이 방법을 통해 모델 성능이 향상되며, 복잡한 양식 또는 키 없는 값을 포함하는 양식과 함께 작동하는 모델을 생성할 수 있습니다.
      • 비동기 API 비동기 API 호출을 사용하여 대량의 데이터 세트 및 파일을 학습하고 분석할 수 있습니다.
      • TIFF 파일 지원 이제 TIFF 문서로 학습시키고 이 문서의 데이터를 추출할 수 있습니다.
      • 추출 정확도 개선.
    • 미리 빌드된 영수증 모델

      • 팁 금액 이제 팁 금액과 기타 필기 값을 추출할 수 있습니다.
      • 품목 추출 영수증에서 품목 값을 추출할 수 있습니다.
      • 신뢰도 값 추출된 각 값에 대한 모델의 신뢰도를 볼 수 있습니다.
      • 추출 정확도 개선.
      • 레이아웃 추출 이제 레이아웃 API를 사용하여 양식에서 텍스트 데이터 및 표 데이터를 추출할 수 있습니다.
  • 사용자 지정 모델 API 변경 내용

    사용자 지정 모델을 학습하고 사용하기 위한 모든 API의 이름이 변경되고 일부 동기식 메서드는 이제 비동기식입니다. 다음은 주요 변경 내용입니다.

    • 모델을 학습시키는 프로세스는 이제 비동기식입니다. /custom/models API 호출을 통해 학습을 시작합니다. 이 호출은 custom/models/{modelID}에 전달하여 학습 결과를 반환할 수 있는 작업 ID를 반환합니다.
    • 이제 키/값 추출이 /custom/models/{modelID}/analyze API 호출에 의해 시작됩니다. 이 호출은 custom/models/{modelID}/analyzeResults/{resultID}에 전달하여 추출 결과를 반환할 수 있는 작업 ID를 반환합니다.
    • 이제 학습 작업을 위한 작업 ID가 Operation-Location 헤더가 아니라 HTTP 응답의 Location 헤더에 있습니다.
  • 영수증 API 변경 내용

    • 판매 영수증을 읽기 위한 API의 이름이 바뀝니다.

    • 이제 영수증 데이터 추출이 /prebuilt/receipt/analyze API 호출에 의해 시작됩니다. 이 호출은 /prebuilt/receipt/analyzeResults/{resultID}에 전달하여 추출 결과를 반환할 수 있는 작업 ID를 반환합니다.

  • 출력 형식 변경 내용

    • 이제 API 호출 모두에 대한 JSON 응답에서 새로운 형식을 사용합니다. 일부 키 및 값이 추가되거나, 제거되거나, 이름이 변경됩니다. 현재의 JSON 형식 예에 대해서는 빠른 시작을 참조하세요.

다음 단계