Share via


시작: 문서 인텔리전스 스튜디오

이 콘텐츠의 적용 대상은 다음과 같습니다.확인 표시v4.0(미리 보기) | 이전 버전:파란색 확인 표시v3.1(GA)파란색 확인 표시v3.0(GA)

문서 인텔리전스 스튜디오는 문서 인텔리전스 서비스의 기능을 애플리케이션에서 시각적으로 탐색, 이해 및 통합하기 위한 온라인 도구입니다. 샘플 또는 자체 문서를 사용하여 미리 학습된 모델을 탐색하여 시작할 수 있습니다. Python SDK 및 기타 빠른 시작을 사용하여 사용자 지정 템플릿 모델을 빌드하고 애플리케이션에서 모델을 참조하는 프로젝트를 만들 수도 있습니다.

새 사용자를 위한 필수 구성 요소

단일 엔드포인트/키에서 여러 Azure AI 서비스에 액세스하려는 경우 Azure AI 서비스 리소스를 만듭니다. 문서 인텔리전스 액세스에 대해서만 문서 인텔리전스 리소스를 만듭니다. Microsoft Entra ID 인증을 사용하려는 경우 단일 서비스 리소스가 필요합니다.

Azure 역할 할당

문서 분석 및 미리 빌드된 모델의 경우 다양한 시나리오에 다음 역할 할당이 필요합니다.

  • Basic
    • Cognitive Services 사용자: 분석 페이지에 들어가려면 문서 인텔리전스 또는 Azure AI 서비스 리소스에 이 역할이 필요합니다.
  • 고급
    • 기여자: 리소스 그룹, 문서 인텔리전스 서비스 또는 Azure AI 서비스 리소스를 만들려면 이 역할이 필요합니다.

권한 부여에 대한 자세한 내용은 문서 인텔리전스 스튜디오 권한 부여 정책참조하세요.

모델

미리 빌드된 모델을 사용하면 자체 모델을 빌드, 학습 및 게시할 필요 없이 앱에 문서 인텔리전스 기능을 추가할 수 있습니다. 미리 빌드된 몇 가지 모델 중에서 선택할 수 있으며, 각 모델에는 지원되는 자체 필드 세트가 있습니다. 분석 작업에 사용할 모델 선택은 분석할 문서 유형에 따라 달라집니다. 문서 인텔리전스는 현재 다음과 같은 미리 빌드된 모델을 지원합니다.

문서 분석

  • 레이아웃: 문서(PDF, TIFF) 및 이미지(JPG, PNG, BMP)에서 텍스트, 테이블, 선택 표시 및 구조 정보를 추출합니다.
  • 읽기: 문서(PDF, TIFF) 및 이미지(JPG, PNG, BMP)에서 검색된 경우 텍스트 줄, 단어, 위치, 검색된 언어 및 필기 스타일을 추출합니다.

사전 제작

  • 청구서: 청구서에서 텍스트, 선택 표시, 테이블, 키-값 쌍 및 키 정보를 추출합니다.
  • 영수증: 영수증에서 텍스트 및 키 정보를 추출합니다.
  • 의료 보험 카드: 미국 의료 보험 카드에서 보험사, 회원, 처방전, 그룹 번호 및 기타 주요 정보를 추출합니다.
  • W-2: W-2 세금 양식에서 텍스트 및 키 정보를 추출합니다.
  • ID 문서: 운전 면허증과 국제 여권에서 텍스트 및 키 정보를 추출합니다.

사용자 지정

  • 사용자 지정 추출 모델: 사용자 지정 추출 모델을 사용하여 양식 및 문서에서 정보를 추출합니다. 샘플 문서에 5개까지 레이블을 지정하여 모델을 신속하게 학습시킵니다.
  • 사용자 지정 분류 모델: 사용자 지정 분류자를 학습시켜 애플리케이션 내의 다양한 문서 유형을 구분합니다. 2개 이내의 클래스, 클래스당 5개 샘플로 모델을 빠르게 학습시킵니다.

필수 조건을 완료한 후 문서 인텔리전스 스튜디오로 이동합니다.

  1. 스튜디오 홈페이지에서 문서 인텔리전스 서비스 기능을 선택합니다.

  2. 이 단계는 이전 사용에서 이미 서비스 리소스를 선택하지 않은 경우 일회용 프로세스입니다. Azure 구독, 리소스 그룹 및 리소스를 선택합니다. (상단 메뉴의 "설정"에서 언제든지 리소스를 변경할 수 있습니다.) 선택 사항을 검토 및 확인합니다.

  3. [분석] 단추를 선택하여 샘플 문서에 대한 분석을 실행하거나 [추가] 명령을 사용하여 문서를 사용해 봅니다.

  4. 화면 아래쪽의 컨트롤을 사용하여 문서 보기를 확대/축소하고 회전시킵니다.

  5. 문서 보기에서 강조 표시된 추출된 콘텐츠를 관찰합니다. 키와 값 위로 마우스를 가져가 세부 정보를 확인합니다.

  6. 출력 섹션의 [결과] 탭에서 JSON 출력을 찾아 서비스 응답 형식을 이해합니다.

  7. 코드 탭에서 통합을 위한 샘플 코드를 찾습니다. 시작하려면 복사하고 다운로드합니다.

사용자 지정 프로젝트에 대한 추가 필수 구성 요소

Azure 계정과 문서 인텔리전스 또는 Azure AI 서비스 리소스 외에 다음이 필요합니다.

Azure Blob Storage 컨테이너

표준 성능Azure Blob Storage 계정. 스토리지 계정 내에서 학습 문서를 저장하고 구성하는 컨테이너를 만듭니다. 컨테이너를 사용하여 Azure 스토리지 계정을 만드는 방법을 모르는 경우 다음 빠른 시작을 따릅니다.

  • 스토리지 계정 만들기 스토리지 계정을 만드는 경우 인스턴스 세부 정보 → 성능 필드에서 표준 성능을 선택해야 합니다.
  • 컨테이너를 만듭니다. 컨테이너를 만드는 경우 새 컨테이너 창에서 퍼블릭 액세스 수준 필드를 컨테이너(컨테이너 및 Blob에 대한 익명 읽기 액세스)로 설정합니다.

Azure 역할 할당

사용자 지정 프로젝트의 경우 다양한 시나리오에 다음 역할 할당이 필요합니다.

  • Basic
    • Cognitive Services 사용자: 사용자 지정 모델을 학습시키거나 학습된 모델을 사용하여 분석하려면 문서 인텔리전스 또는 Azure AI 서비스 리소스에 이 역할이 필요합니다.
    • Storage Blob 데이터 기여자: 스토리지 계정이 프로젝트를 만들고 데이터에 레이블을 지정하려면 이 역할이 필요합니다.
  • 고급
    • 스토리지 계정 기여자: 스토리지 계정이 CORS 설정을 설정하려면 이 역할이 필요합니다(동일한 스토리지 계정을 다시 사용하는 경우 일회성 작업).
    • 기여자: 리소스 그룹과 리소스를 만들려면 이 역할이 필요합니다.

CORS 구성

문서 인텔리전스 스튜디오에서 액세스할 수 있으려면 Azure Storage 계정에 CORS(원본 간 리소스 공유)를 구성해야 합니다. Azure Portal에서 CORS를 구성하려면 스토리지 계정의 CORS 탭에 액세스해야 합니다.

  1. 스토리지 계정에 대한 CORS 탭을 선택합니다.

    Azure Portal에서 CORS 설정 메뉴의 스크린샷

  2. Blob 서비스에서 새 CORS 항목을 만들어 시작합니다.

  3. 허용된 원본https://documentintelligence.ai.azure.com로 설정합니다.

    스토리지 계정에 대한 CORS 구성을 보여주는 스크린샷.

    지정된 도메인 대신 와일드카드 문자 ‘*’를 사용하여 모든 원본 도메인이 CORS를 통해 요청을 수행하도록 허용할 수 있습니다.

  4. 허용된 메서드에 사용할 수 있는 8가지 옵션을 모두 선택합니다.

  5. 각 필드에 *를 입력하여 허용된 헤더노출된 헤더를 모두 승인합니다.

  6. Max Age를 120초 또는 허용되는 값으로 설정합니다.

  7. 페이지 위쪽에 있는 {b>저장

이제 문서 인텔리전스 스튜디오의 스토리지 계정을 사용하도록 CORS를 구성해야 합니다.

샘플 문서 세트

  1. Azure Portal에 로그인하고 스토리지 계정>데이터 스토리지>컨테이너로 이동합니다.

    Azure Portal의 데이터 스토리지 메뉴 스크린샷.

  2. 목록에서 컨테이너를 선택합니다.

  3. 페이지 위쪽의 메뉴에서 업로드를 선택합니다.

    Azure Portal의 컨테이너 업로드 단추 스크린샷.

  4. Blob 업로드 창이 표시됩니다.

  5. 업로드할 파일을 선택합니다.

    Azure Portal의 Blob 업로드 창 스크린샷.

참고 항목

기본적으로 Studio는 컨테이너의 루트에 있는 문서를 사용합니다. 그러나 사용자 지정 양식 프로젝트 만들기 단계에서 폴더 경로를 지정하여 폴더에 구성된 데이터를 사용할 수 있습니다. 하위 폴더에 데이터 구성참조하세요.

사용자 지정 모델

사용자 지정 모델을 만들려면 프로젝트 구성부터 시작합니다.

  1. Studio 홈에서 사용자 지정 모델 카드를 선택하여 사용자 지정 모델 페이지를 엽니다.

  2. "프로젝트 만들기" 명령을 사용하여 새 프로젝트 구성 마법사를 시작합니다.

  3. 프로젝트 세부 정보를 입력하고, Azure 구독 및 리소스, 데이터가 포함된 Azure Blob 스토리지 컨테이너를 선택합니다.

  4. 설정을 검토하고 제출하여 프로젝트를 만듭니다.

  5. 레이블 지정 프로세스를 빠르게 시작하려면 자동 레이블 기능을 사용하여 이미 학습된 모델이나 미리 빌드된 모델 중 하나를 사용하여 레이블을 지정합니다.

  6. 처음부터 수동으로 레이블을 지정하려면 추출하려는 레이블과 해당 형식을 정의합니다.

  7. 문서의 텍스트를 선택하고 드롭다운 목록 또는 레이블 창에서 레이블을 선택합니다.

  8. 레이블을 4개 이상의 문서에 지정하여 레이블을 5개 이상의 문서에 지정합니다.

  9. 학습 명령을 선택하고 모델 이름을 입력한 후 사용자 지정 모델 학습을 시작할 신경(권장) 모델 또는 템플릿 모델을 선택합니다.

  10. 모델이 준비되면 테스트 명령을 사용하여 테스트 문서를 통해 모델의 유효성을 검사하고 결과를 관찰합니다.

문서 인텔리전스 사용자 지정 모델 데모

테이블로 레이블 지정

참고 항목

  • API 버전 2022-06-30-preview 이상의 릴리스에서 사용자 지정 템플릿 모델은 페이지 간 테이블 형식 필드(테이블)에 대한 지원을 추가합니다.
  • API 버전 2022-06-30-preview 이상 릴리스와 함께 사용자 지정 신경망 모델은 테이블 형식 필드(테이블)를 지원하고 API 버전 2022-08-31 이상으로 학습된 모델은 테이블 형식 필드 레이블을 허용합니다.
  1. [삭제] 명령을 사용하여 필요하지 않은 모델을 삭제합니다.

  2. 오프라인 보기를 위한 모델 세부 정보를 다운로드합니다.

  3. 여러 모델을 선택하고, 애플리케이션에서 사용할 새 모델로 구성합니다.

테이블을 시각적 패턴으로 사용:

사용자 지정 양식 모델의 경우 사용자 지정 모델을 만드는 동안 문서에서 데이터 컬렉션을 추출해야 할 수 있습니다. 데이터 컬렉션은 몇 가지 형식으로 나타날 수 있습니다. 테이블을 시각적 패턴으로 사용:

  • 지정된 필드(열) 세트에 대한 동적 또는 변수 값(행)의 개수

  • 지정된 필드(열 및/또는 행) 세트에 대한 특정 값(행)의 컬렉션

동적 테이블로 레이블 지정

동적 테이블을 사용하여 지정된 필드(열) 세트에 대한 값(행)의 변수 수를 추출합니다.

  1. 새 "테이블" 형식 레이블을 추가하고, "동적 테이블" 형식을 선택한 다음, 레이블 이름을 지정합니다.

  2. 필요한 열(필드) 및 행(데이터용)의 수를 추가합니다.

  3. 페이지에서 텍스트를 선택한 다음 텍스트에 할당할 셀을 선택합니다. 모든 문서의 모든 페이지에 있는 모든 행과 열에 대해 반복합니다.

동적 테이블로 문서 인텔리전스 레이블 지정 예

고정 테이블로 레이블 지정

고정 테이블을 사용하여 지정된 필드(열 및/또는 행) 세트에 대한 특정 값(행)의 컬렉션을 추출합니다.

  1. 새 "테이블" 형식 레이블을 만들고, "고정 테이블" 형식을 선택한 다음, 이름을 지정합니다.

  2. 두 필드 세트에 해당하는 필요한 열과 행의 수를 추가합니다.

  3. 페이지에서 텍스트를 선택한 다음 텍스트에 할당할 셀을 선택합니다. 다른 문서에 대해 반복합니다.

고정 테이블로 문서 인텔리전스 레이블 지정 예

서명 검색

참고 항목

서명 필드는 현재 사용자 지정 템플릿 모델에 대해서만 지원됩니다. 사용자 지정 신경망 모델을 학습할 때 레이블이 지정된 서명 필드는 무시됩니다.

서명 검색 레이블 지정(사용자 지정 양식에만 해당)하려면 다음을 수행합니다.

  1. 레이블 보기에서 새 "서명" 형식 레이블을 만들고, 이름을 지정합니다.

  2. [영역] 명령을 사용하여 사각형 영역을 서명의 예상 위치에 만듭니다.

  3. 그린 영역을 선택하고 서명 형식 레이블을 선택하여 그린 영역에 할당합니다. 다른 문서에 대해 반복합니다.

서명 검색을 위한 문서 인텔리전스 레이블 지정 예

다음 단계

문서 인텔리전스 스튜디오를 시작합니다.