Share via


문서 인텔리전스 스튜디오

Important

  • 문서 인텔리전스 공개 미리 보기 릴리스에서는 현재 개발 중인 기능에 대한 조기 액세스를 제공합니다.
  • 기능, 방식 및 프로세스는 GA(일반 공급) 전에 사용자 피드백에 따라 변경될 수 있습니다.
  • 문서 인텔리전스 클라이언트 라이브러리의 공개 미리 보기 버전은 기본적으로 REST API 버전 2024-02-29-미리 보기로 설정됩니다.
  • 공개 미리 보기 버전 2024-02-29-미리 보기는 현재 다음 Azure 지역에서만 사용할 수 있습니다.
  • 미국 동부
  • 미국 서부2
  • 서유럽

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.1(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.0

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v3.0(GA) | 최신 버전:보라색 확인 표시v4.0(미리 보기)보라색 확인 표시v3.1

Important

문서 인텔리전스 스튜디오는 문서 인텔리전스 서비스의 기능을 시각적으로 탐색, 이해 및 애플리케이션에 통합하기 위한 온라인 도구입니다. 문서 인텔리전스 스튜디오를 사용하여 다음을 수행합니다.

  • 문서 인텔리전스의 다양한 기능에 대해 자세히 알아봅니다.
  • 문서 인텔리전스 리소스를 사용하여 샘플 문서에서 모델을 테스트하거나 자체 문서를 업로드합니다.
  • 다양한 추가 기능 및 미리 보기 기능을 실험하여 필요에 맞게 출력을 조정합니다.
  • 사용자 지정 분류 모델을 학습시켜 문서를 분류합니다.
  • 사용자 지정 추출 모델을 학습시켜 문서에서 필드를 추출합니다.
  • 애플리케이션에 통합하려면 언어별 SDKs에 대한 샘플 코드를 가져오세요.

문서 분석 또는 미리 빌드된 모델을 사용하여 문서 분석을 시작하려면 문서 인텔리전스 스튜디오 빠른 시작을 사용하세요. 언어별 SDKs 중 하나와 기타 빠른 시작을 사용하여 사용자 지정 모델을 빌드하고 애플리케이션에서 모델을 참조합니다.

시작

스튜디오를 처음 방문하는 경우 시작 가이드에 따라 사용할 스튜디오를 설정합니다.

분석 옵션

  • 문서 인텔리전스는 정교한 분석 기능을 지원합니다. 스튜디오에서 추가 기능 구성을 위한 하나의 진입점(분석 옵션 단추)을 쉽게 구성할 수 있습니다.

  • 문서 추출 시나리오에 따라 분석 범위, 문서 페이지 범위, 선택적 탐지, 프리미엄 탐지 기능을 구성합니다.

    분석 옵션 대화 상자 창의 스크린샷.

    참고 항목

    문서 인텔리전스 스튜디오에서는 글꼴 추출이 시각화되지 않습니다. 하지만 JSON 출력의 스타일 섹션에서 글꼴 탐지 결과를 확인할 수 있습니다.

✔️ 사전 제작된 모델 또는 자체 모델 중 하나를 사용하여 문서에 자동 레이블 지정

  • 이제 사용자 지정 추출 모델 레이블 지정 페이지에서 문서 인텔리전스 서비스 미리 빌드된 모델 또는 학습시킨 모델 중 하나를 사용하여 문서에 자동으로 레이블을 지정할 수 있습니다.

    스튜디오의 자동 레이블 지정을 보여주는 애니메이션 스크린샷.

  • 일부 문서의 경우 자동 레이블 실행 후 레이블이 중복될 수 있습니다. 이후 레이블 지정 페이지에 중복 레이블이 없도록 레이블을 수정하시기 바랍니다.

    자동 레이블 지정 후 중복 레이블 경고를 보여주는 스크린샷.

✔️ 자동 레이블 지정 표

  • 사용자 지정 추출 모델 레이블 지정 페이지에서 이제 테이블에 수동으로 레이블을 지정할 필요 없이 문서의 테이블에 자동으로 레이블을 지정할 수 있습니다.

    스튜디오의 자동 테이블 레이블 지정을 보여주는 애니메이션 스크린샷.

✔️ 학습 데이터 세트에 직접 테스트 파일 추가

  • 사용자 지정 추출 모델을 학습시킨 후에는 테스트 페이지를 사용하여 필요한 경우 테스트 문서를 학습 데이터 세트에 업로드하여 모델 품질을 향상시킵니다.

  • 일부 레이블에 대해 낮은 신뢰도 점수가 반환되면 레이블이 올바르게 지정되었는지 확인하세요. 그렇지 않은 경우 학습 데이터 세트에 추가하고 레이블을 다시 지정하여 모델 품질을 향상시키세요.

학습 데이터 세트에 테스트 파일을 추가하는 방법을 보여주는 애니메이션 스크린샷

✔️ 맞춤 프로젝트에서 문서 목록 옵션 및 필터를 활용하세요.

  • 사용자 지정 추출 모델 레이블 지정 페이지를 사용하면 검색, 필터링 및 정렬 기능을 사용하여 학습 문서를 쉽게 탐색할 수 있습니다.

  • 그리드 보기를 활용하여 문서를 미리 보거나 목록 보기를 사용하여 문서를 더 쉽게 스크롤할 수 있습니다.

    문서 목록 보기 옵션 및 필터 스크린샷

✔️ 프로젝트 공유

문서 인텔리전스 모델 지원

  • 읽기: 문서 인텔리전스의 읽기 기능을 사용해 텍스트 줄, 단어, 감지된 언어 및 필기 스타일이 감지되면 추출해 보세요. Studio 읽기 기능으로 시작합니다. 샘플 문서 및 사용자 문서를 탐색합니다. 대화형 시각화 및 JSON 출력을 사용하여 기능의 작동 방식을 이해합니다. 자세히 알아보려면 읽기 개요를 참조하고 레이아웃용 Python SDK 빠른 시작을 시작하세요.

  • 레이아웃: 문서 인텔리전스의 레이아웃 기능을 사용해 텍스트, 표, 선택 표시 및 구조 정보를 추출해 보세요. Studio 레이아웃 기능으로 시작합니다. 샘플 문서 및 사용자 문서를 탐색합니다. 대화형 시각화 및 JSON 출력을 사용하여 기능의 작동 방식을 이해합니다. 자세히 알아보려면 레이아웃 개요를 참조하고 레이아웃용 Python SDK 빠른 시작을 시작하세요.

  • 미리 빌드된 모델: 문서 인텔리전스의 미리 빌드된 모델을 사용하면 자체 모델을 학습하고 빌드할 필요 없이 앱 및 흐름에 지능적인 문서 처리를 추가할 수 있습니다. 예를 들어 Studio 청구서 기능으로 시작합니다. 샘플 문서 및 사용자 문서를 탐색합니다. 대화형 시각화, 추출된 필드 목록 및 JSON 출력을 사용하여 기능의 작동 방식을 이해합니다. 자세히 알아보려면 모델 개요를 참조하고 미리 빌드된 청구서용 Python SDK 빠른 시작을 시작하세요.

  • 사용자 지정 추출 모델: 문서 인텔리전스의 맞춤 모델을 사용하면 데이터로 학습된 모델에서 양식과 문서에 맞게 맞춤화된 필드와 값을 추출할 수 있습니다. 여러 양식 형식에서 데이터를 추출하려면 독립 실행형 사용자 지정 모델을 만들거나 두 개 이상의 사용자 지정 모델을 결합하여 구성된 모델을 만듭니다. Studio 사용자 지정 모델 기능으로 시작합니다. 도움말 마법사, 레이블 지정 인터페이스, 학습 단계 및 시각화를 사용하여 기능 작동 방식을 이해하세요. 샘플 문서를 사용하여 사용자 지정 모델을 테스트하고 반복하여 모델을 개선합니다. 자세한 내용은 사용자 지정 모델 개요참조하세요.

  • 맞춤 분류 모델: 문서 분류는 문서 인텔리전스에서 지원하는 새로운 시나리오입니다. 문서 분류자 API는 분류 및 분할 시나리오를 지원합니다. 분류 모델을 학습하여 애플리케이션이 지원하는 다양한 유형의 문서를 식별합니다. 분류 모델에 대한 입력 파일은 여러 문서를 포함할 수 있으며 연결된 페이지 범위 내에서 각 문서를 분류합니다. 자세한 내용은 사용자 지정 분류 모델을 참조하세요.

  • 추가 기능: 문서 인텔리전스는 이제 더욱 정교한 분석 기능을 지원합니다. 이러한 선택적 기능은 각 모델 페이지의 Analze Options 버튼을 사용하여 스튜디오에서 활성화 및 비활성화할 수 있습니다. highResolution, 수식, 글꼴, 바코드 추출 기능 등 4가지 추가 기능을 사용할 수 있습니다. 자세한 내용은 추가 기능참조하세요.

다음 단계