Azure AI 문서 인텔리전스 FAQ

이 콘텐츠의 적용 대상:확인 표시v4.0(미리 보기)확인 표시v3.1(GA)확인 표시v3.0(GA)확인 표시v2.1(GA)

일반 개념

Azure AI 문서 인텔리전스란 무엇이며 Azure AI Form Recognizer는 어떻게 되었나요?

Azure AI 문서 인텔리전스는 기계 학습 모델을 사용하여 문서에서 키-값 쌍, 텍스트 및 테이블을 추출하는 클라우드 기반 서비스입니다. 반환된 결과는 정형 JSON 출력입니다. 문서 인텔리전스 사용 사례에는 자동화된 데이터 처리, 향상된 데이터 기반 전략, 보강된 문서 검색 기능이 포함됩니다.

문서 인텔리전스는 Azure AI 서비스의 일부입니다. Azure AI 서비스는 이전에 Azure Cognitive Services 및 Azure Applied AI Services로 알려진 모든 서비스를 포함합니다.

문서 인텔리전스의 이전 이름은 Azure AI Form Recognizer였습니다. Form Recognizer는 2023년 7월에 공식적으로 문서 인텔리전스가 되었습니다.

가격 책정에는 변화가 없습니다. Cognitive Services 및 Applied AI Services라는 이름은 Azure 청구, 비용 분석, 가격표, 가격 API에서 계속 사용됩니다.

API 또는 클라이언트 라이브러리(SDK)에 대한 호환성이 손상되는 변경은 없습니다. REST API 및 SDK 버전 2024-02-29-preview, 2023-10-31-preview 이상은 document intelligence로 이름이 바뀝니다.

일부 플랫폼은 여전히 이름 변경 업데이트를 기다리고 있습니다. Microsoft 설명서에서 Form Recognizer 및 문서 인텔리전스에 대한 모든 언급은 동일한 Azure 서비스를 나타냅니다.

문서 생성 AI와 문서 인텔리전스는 어떤 관련이 있나요?

문서 생성 AI 솔루션을 사용하여 문서와 채팅하고, 해당 문서에서 매력적인 콘텐츠를 생성하고, 데이터에서 Azure OpenAI Service 모델에 액세스할 수 있습니다. Azure AI 문서 인텔리전스와 Azure OpenAI를 결합하면 자연어를 사용하여 문서와 원활하게 상호 작용하고, 쉽게 답변을 찾고, 귀중한 인사이트를 얻고, 기존 문서에서 새롭고 매력적인 콘텐츠를 생성하는 엔터프라이즈 애플리케이션을 빌드할 수 있습니다. 기술 커뮤니티 블로그에서 자세한 내용을 확인하세요.

문서 인텔리전스는 검색 증강 생성과 어떤 관계가 있나요?

의미 체계 청크는 효율적인 스토리지 및 검색을 보장하기 위한 RAG(검색 증강 생성)의 핵심 단계입니다. 문서 인텔리전스 레이아웃 모델은 고급 콘텐츠 추출 및 문서 구조 분석 기능을 위한 포괄적인 솔루션을 제공합니다.

레이아웃 모델을 사용하면 텍스트 및 구조 요소를 쉽게 추출하여 텍스트의 큰 본문을 임의의 분할이 아닌 의미 체계 콘텐츠에 따라 더 작고 의미 있는 청크로 나눌 수 있습니다. 그런 다음, 제공된 구성 요소를 기반으로 의미 체계 청크 전략을 정의할 수 있도록 추출된 정보를 Markdown 형식으로 편리하게 출력할 수 있습니다. 문서 인텔리전스 RAG의 개요에서 자세한 내용을 확인하세요.

특별한 고려가 필요한 문서 인텔리전스 사용 사례는 무엇인가요?

금융 데이터, 보호된 건강 데이터, 개인 데이터 또는 매우 중요한 데이터를 포함하는 문서 처리 프로젝트를 신중하게 고려하세요.

모든 국가/지역 및 산업별 요구 사항을 준수해야 합니다.

문서 인텔리전스는 어떤 언어를 지원하나요?

문서 인텔리전스의 딥 러닝 기반 유니버설 모델은 혼합 언어가 포함된 텍스트 줄을 포함하여 이미지와 문서에서 다국어 텍스트를 추출할 수 있는 다양한 언어를 지원합니다.

언어 지원은 문서 인텔리전스 서비스 기능에 따라 다릅니다. 문서 인텔리전스에서 지원하는 필기 및 인쇄 텍스트의 전체 목록은 언어 지원을 참조하세요.

내 Azure 지역에서 문서 인텔리전스를 사용할 수 있나요?

문서 인텔리전스는 일반적으로 60개 이상의 Azure 글로벌 인프라 지역에서 사용할 수 있습니다.

사용자와 사용자의 고객에게 가장 적합한 지역을 선택하세요.

문서 인텔리전스는 다른 Microsoft 서비스와 통합되나요?

"예, 문서 인텔리전스는 다음 서비스와 통합됩니다."

문서 인텔리전스는 광학 인식과 어떤 관련이 있나요?

문서 인텔리전스는 Azure AI 서비스의 OCR(광학 인식), 텍스트 분석 및 사용자 지정 텍스트 분류를 통합하는 클라우드 기반 서비스입니다.

문서 인텔리전스는 OCR을 사용하여 AI에서 지원하는 서체 및 필기 텍스트 문서에서 정보를 검색하고 추출하여 텍스트 추출에 더 많은 구조와 정보를 제공합니다.

사용자 지정 모델을 사용할 수 있는 기간은 얼마인가요?

모델에는 모델을 학습시키는 데 사용하는 API 버전과 동일한 수명 주기를 갖습니다. API의 GA(일반 공급) 버전으로 학습한 사용자 지정 모델은 API 버전과 동일한 수명 주기를 갖습니다. API 버전이 더 이상 사용되지 않으면 모델은 더 이상 유추에 사용할 수 없습니다. API의 미리 보기 버전으로 학습한 모델도 미리 보기 API와 동일한 수명 주기를 갖습니다.

업데이트된 미리 보기 API 버전 또는 최신 GA API 버전이 출시된 후 3개월 이내에 미리 보기 API가 더 이상 사용되지 않을 것으로 예상됩니다.

정확도 점수란 무엇이며 어떻게 계산하나요?

build(v3.0 이상 버전) 또는 train(v2.1) 사용자 지정 모델 작업의 출력에는 예상 정확도 점수가 포함됩니다. 이 점수는 시각적으로 유사한 문서에서 레이블이 지정된 값을 정확하게 예측하는 모델의 기능을 나타냅니다.

정확도는 0%(낮음)에서 100%(높음)까지 백분율 값 범위 내에서 측정됩니다.

자세한 내용은 정확도 및 신뢰도 점수를 참조하세요.

정확도 점수를 향상하려면 어떻게 해야 하나요?

문서의 시각적 구조의 차이는 모델의 정확도에 영향을 줄 수 있습니다. 다음 팁을 참조하세요.

  • 학습 데이터 세트에 문서의 모든 변형을 포함합니다. 변형에는 여러 형식이 포함됩니다(예: 디지털 PDF와 스캔된 PDF).

  • 시각적으로 고유한 문서 형식을 구분하고 다른 모델을 학습시킵니다.

  • 관련 없는 레이블이 없는지 확인합니다.

  • 서명 및 지역 레이블을 지정할 때는 주변 텍스트를 포함하지 마세요.

자세한 내용은 정확도 및 신뢰도 점수를 참조하세요.

신뢰도 점수란 무엇이며 어떻게 계산되나요?

신뢰도 점수는 추출된 결과가 올바르게 검색되는 통계적 확실성의 정도를 측정하여 확률을 나타냅니다.

신뢰도 값 범위는 0%(낮음)에서 100%(높음)까지의 백분율입니다. 80% 이상의 점수를 목표로 하는 것이 가장 좋습니다. 금융 또는 의료 기록과 같은 매우 민감한 사례에는 100%에 가까운 점수를 권장합니다. 사람의 검토를 요구할 수도 있습니다.

자세한 내용은 정확도 및 신뢰도 점수를 참조하세요.

신뢰도 점수를 높이려면 어떻게 해야 하나요?

분석 작업을 마친 후 JSON 출력을 검토합니다. pageResults 노드 아래에서 각 키/값 결과에 대한 confidence 값을 검사합니다. readResults 노드에서 텍스트 읽기 작업에 해당하는 신뢰도 점수도 확인해야 합니다. 읽기 결과의 신뢰도는 키/값 추출 결과의 신뢰도에 영향을 주지 않으므로 둘 다 확인해야 합니다. 다음 팁을 참조하세요.

  • readResults 개체의 신뢰도 점수가 낮으면 입력 문서의 품질을 높입니다.

  • pageResults 개체의 신뢰도 점수가 낮으면 분석 중인 문서가 동일한 형식인지 확인합니다.

  • 워크플로에 사람의 검토를 통합하는 것이 좋습니다.

  • 각 필드에 서로 다른 값이 있는 양식을 사용합니다.

  • 사용자 지정 모델의 경우 더 큰 학습 문서 세트를 사용합니다. 더 많은 문서에 태그를 지정하면 모델이 필드를 보다 정확하게 인식할 수 있습니다.

자세한 내용은 정확도 및 신뢰도 점수를 참조하세요.

경계 상자란?

경계 상자(v3.0 이상 버전의 polygon)는 문서 또는 양식의 텍스트 요소를 둘러싸는 추상 사각형입니다. 개체 감지를 위한 참조 지점으로 사용됩니다.

경계 상자는 4개의 숫자 쌍 배열로 표시되는 x 및 y 좌표 평면을 사용하여 위치를 지정합니다. 각 쌍은 상자의 모서리를 왼쪽 위, 오른쪽 위, 오른쪽 아래, 왼쪽 아래 순서로 나타냅니다.

이미지의 경우 좌표는 픽셀 단위입니다. PDF의 경우 좌표는 인치 단위입니다.

문서 인텔리전스를 통해 문서를 분류할 수 있나요?

문서 인텔리전스는 단일 파일 또는 다중 파일 문서를 분석하여 입력 파일에 학습된 문서 형식이 포함되어 있는지 여부를 식별할 수 있는 사용자 지정 분류 모델을 제공합니다. 이 서비스는 다음 시나리오를 지원합니다.

  • 대출 신청 양식과 같은 하나의 문서 형식을 포함하는 단일 파일.

  • 여러 문서를 포함하는 단일 파일. 예를 들어 대출 신청 양식, 급여 명세서 및 은행 명세서를 포함하는 대출 신청 패키지가 있습니다.

  • 동일한 문서의 여러 인스턴스를 포함하는 단일 파일. 예를 들어 스캔한 청구서의 컬렉션이 있습니다.

자세한 내용은 사용자 지정 분류 모델의 개요를 참조하세요.

문서 인텔리전스 스튜디오

문서 인텔리전스 스튜디오에 액세스하려면 어떤 권한이 필요하나요?

문서 인텔리전스 스튜디오에 액세스하려면 활성 Azure 계정과 최소한 읽기 권한자 역할이 있는 구독이 필요합니다.

문서 분석 및 미리 빌드된 모델의 경우 사용자 시나리오의 역할 요구 사항은 다음과 같습니다.

  • Basic

  • 고급

    • 기여자: 리소스 그룹 또는 문서 인텔리전스 리소스를 만들려면 이 역할이 필요합니다. 기여자 역할은 Cognitive Services에 대한 키를 나열하는 것을 허용하지 않으며 만들어진 리소스 또는 스토리지를 사용할 수 있는 액세스 권한을 제공하지 않으며 사용자가 리소스 자체를 읽고 쓰는 것만 허용합니다. 문서 인텔리전스 스튜디오를 사용하려면 Cognitive Services 사용자 역할이 필요합니다.

사용자 지정 모델 프로젝트의 경우 사용자 시나리오의 역할 요구 사항은 다음과 같습니다.

  • Basic

    • Cognitive Services 사용자: 데이터를 읽고 쓰려면 문서 인텔리전스 또는 Cognitive Services 다중 서비스 리소스에 대해 이 역할이 필요하며 API를 호출하는 데 필요합니다. 이 역할은 사용자 지정 모델을 학습하거나 학습된 모델을 사용하여 분석하는 데 필요한 최소한의 역할이기도 합니다.

    • Storage Blob 데이터 기여자: 프로젝트를 만들고 데이터에 레이블을 지정하려면 스토리지 계정에 이 역할이 필요합니다.

  • 고급

    • Storage 계정 기여자: CORS(원본 간 리소스 공유) 설정을 설정하려면 스토리지 계정에 이 역할이 필요합니다. 동일한 스토리지 계정을 다시 사용하는 경우 일회성 활동입니다.

      기여자 역할은 Blob의 데이터에 액세스할 수 없습니다. 문서 인텔리전스 스튜디오를 사용하려면 여전히 Storage Blob 데이터 기여자 역할이 필요합니다.

    • 기여자: 리소스 그룹과 리소스를 만들려면 이 역할이 필요합니다. 기여자 역할은 만들어진 리소스나 스토리지를 사용할 수 있는 액세스 권한을 부여하지 않으며 사용자가 리소스 자체를 읽고 쓸 수 있는 권한만 허용합니다. 문서 인텔리전스 스튜디오를 사용하려면 여전히 기본 역할이 필요합니다.

자세한 내용은 Microsoft Entra 기본 제공 역할문서 인텔리전스 스튜디오 빠른 시작의 Azure 역할 할당에 대한 섹션을 참조하세요.

문서에 여러 페이지가 있습니다. 문서 인텔리전스 스튜디오에서 두 페이지만 분석되는 이유는 무엇인가요?

무료(F0) 계층 리소스의 경우 문서 인텔리전스 스튜디오, REST API 또는 SDK를 사용하는지에 관계없이 처음 두 페이지만 분석됩니다.

문서 인텔리전스 스튜디오에서 설정(기어) 단추를 선택하고, 리소스 탭을 선택하고, 문서 분석에 사용 중인 가격 계층을 확인합니다. 문서의 모든 페이지를 분석하려면 유료(S0) 리소스로 변경합니다.

문서 인텔리전스 스튜디오에서 디렉터리나 구독을 어떻게 변경하나요?

문서 인텔리전스 스튜디오에서 디렉터리를 변경하려면 설정(기어) 단추를 선택합니다. 디렉터리 아래의 목록에서 디렉터리를 선택한 다음 디렉터리 전환을 선택합니다. 디렉터리를 전환한 후 다시 로그인하라는 메시지가 표시됩니다.

구독 또는 리소스를 변경하려면 설정 아래의 리소스 탭으로 이동합니다.

내 스토리지 계정 리소스가 방화벽 또는 가상 네트워크로 구성된 경우 프로젝트 공유, 자동 레이블 지정 또는 OCR 업그레이드 작업에서 스토리지 오류가 발생하는 이유는 무엇인가요?

Azure 리소스를 설정하려면 문서 인텔리전스의 관리 ID를 참조하세요.

내 문서 인텔리전스 리소스가 방화벽 또는 가상 네트워크로 구성된 경우 자동 레이블 지정 또는 OCR 업그레이드 작업에서 “가상 네트워크/방화벽 규칙으로 인해 액세스가 거부됨”이 표시되는 이유는 무엇인가요?

전용 IP 주소 20.3.165.95를 문서 인텔리전스 리소스의 방화벽 허용 목록에 추가해야 합니다.

문서 인텔리전스 스튜디오의 레이블 지정 환경을 재사용하거나 사용자 지정하여 내 애플리케이션에 빌드할 수 있나요?

예. 문서 인텔리전스 스튜디오의 레이블 지정 환경은 도구 키트 리포지토리에 오픈 소스로 제공됩니다.

사용자 지정 프로젝트를 열 때 “Form Recognizer를 찾을 수 없음” 오류가 표시되는 이유는 무엇인가요?

이 사용자 지정 프로젝트에 바인딩된 문서 인텔리전스 리소스가 삭제되었거나 다른 리소스 그룹으로 이동되었습니다. 이 문제를 해결하는 방법에는 두 가지가 있습니다.

  • 동일한 이름의 동일한 구독 및 동일한 리소스 그룹에서 문서 인텔리전스 리소스를 다시 만듭니다.

  • 마이그레이션된 문서 인텔리전스 리소스를 사용하여 사용자 지정 프로젝트를 다시 만들고 동일한 스토리지 계정을 지정합니다.

문서 인텔리전스 소버린 클라우드 지역에 대한 별도의 URL 엔드포인트가 있나요?

"예. 문서 인텔리전스 스튜디오에는 소버린 클라우드 지역에 대한 별도의 URL 엔드포인트가 있습니다.

앱 개발

문서 인텔리전스의 개발 옵션은 무엇인가요?

문서 인텔리전스는 다음 플랫폼 내에서 최신 개발 옵션을 제공합니다.

최신 프로그래밍 언어 SDK를 지원하는 API 버전은 어디서 찾을 수 있나요?

다음 표는 최신 SDK 버전의 링크를 제공하고 지원되는 문서 인텔리전스 SDK 버전과 API 버전 간의 관계를 보여 줍니다.

지원되는 언어 Azure SDK 참조 지원되는 API 버전
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0
v2.1
v2.0

자세한 내용은 v4.0용 지원되는 클라이언트v3.1용 지원되는 클라이언트를 참조하세요.

문서 인텔리전스 v3.0과 v2.1의 차이점은 무엇이며 최신 버전으로 마이그레이션하려면 어떻게 해야 하나요?

개선된 유용성을 위해 문서 인텔리전스 v3.0은 완전히 재설계된 클라이언트 라이브러리를 도입합니다. 최신 문서 인텔리전스 API 기능을 성공적으로 사용하려면 최신 SDK가 필요하며 새 클라이언트를 사용하도록 애플리케이션 코드를 업데이트해야 합니다.

이 표에서는 최신 버전의 문서 인텔리전스로 마이그레이션하기 위한 자세한 지침에 대한 링크를 제공합니다.

언어/API 마이그레이션 가이드
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

문서 인텔리전스는 어떤 파일 형식을 지원하나요? 입력 문서에 대한 크기 제한이 있나요?

최상의 결과를 얻으려면 입력 요구 사항을 참조하세요.

문서에서 분석할 페이지 범위를 지정하려면 어떻게 해야 하나요?

pages 매개 변수(v2.1, v3.0 이상 버전의 REST API에서 지원됨)를 사용하여 여러 페이지 PDF 및 TIFF 문서의 페이지를 지정합니다. 허용되는 입력에는 다음 범위가 포함됩니다.

  • 단일 페이지. 예를 들어 1, 2를 지정하면 1페이지와 2페이지가 처리됩니다.
  • 유한한 범위. 예를 들어 2-5를 지정하면 2~5페이지가 처리됩니다.
  • 열린 범위. 예를 들어 5-를 지정하면 5페이지부터 모든 페이지가 처리됩니다. 예를 들어 -10을 지정하면 1~10페이지가 처리됩니다.

이러한 매개 변수를 함께 혼합할 수 있으며 범위가 겹칠 수 있습니다. 예를 들어 -5, 1, 3, 5-10을 지정하면 1~10페이지가 처리됩니다.

서비스는 문서의 한 페이지 이상을 처리할 수 있는 경우 요청을 수락합니다. 예를 들어 5페이지 문서에서 5-100을 사용하는 것은 5페이지가 처리됨을 의미하는 유효한 입력입니다.

페이지 범위를 제공하지 않으면 전체 문서가 처리됩니다.

문서 인텔리전스 스튜디오와 FOTT 샘플 레이블 지정 도구를 모두 사용할 수 있습니다. 어느 것을 사용해야 합니까?

대부분의 경우 문서 인텔리전스 리소스 및 스토리지 서비스를 구성하는 시간을 줄일 수 있으므로 문서 인텔리전스 스튜디오를 권장합니다.

다음 시나리오에는 FOTT(양식 OCR 테스트 도구)를 사용하는 것이 좋습니다.

서비스 제한 및 가격 책정

문서 인텔리전스 REST API 버전 2024-02-29-preview를 내 지역에서 사용할 수 있나요?

REST API 버전 2024-02-29-preview 버전은 다음 지역에서 사용할 수 있습니다.

  • 미국 동부
  • 미국 서부2
  • 서유럽

Azure에서는 문서 인텔리전스 사용 가격을 어떻게 계산하나요?

문서 인텔리전스 청구는 모델 형식 및 분석된 페이지 수를 기준으로 매월 계산됩니다. 다음은 몇 가지 세부 정보입니다.

  • 분석을 위해 문서를 제출할 때 요청에서 pages 매개 변수를 사용하여 페이지 범위를 지정하지 않으면 서비스에서 모든 페이지를 분석합니다. 서비스는 읽기, OCR 또는 레이아웃 모델을 통해 Microsoft Excel 및 PowerPoint 문서를 분석할 때 각 Excel 워크시트와 PowerPoint 슬라이드를 하나의 페이지로 계산합니다.

  • 서비스는 PDF 및 TIFF 파일을 분석할 때 PDF 파일의 각 페이지 또는 TIFF 파일의 각 이미지를 최대 문자 제한 없이 한 페이지로 계산합니다.

  • 서비스는 읽기 및 레이아웃 모델이 지원하는 Microsoft Word 및 HTML 파일을 분석할 때 각각 3,000자 블록으로 페이지 수를 계산합니다. 예를 들어 문서에 7,000자가 포함된 경우 각각 3,000자의 두 페이지와 1,000자의 한 페이지를 합하여 총 3페이지가 됩니다.

  • 읽기 또는 레이아웃 모델을 사용하여 Microsoft Word, Excel, PowerPoint, HTML 파일을 분석하는 경우 포함되거나 연결된 이미지는 지원되지 않습니다. 따라서 서비스는 이를 추가된 이미지로 계산하지 않습니다.

  • 문서 인텔리전스를 사용하면 사용자 지정 모델을 항상 무료로 학습할 수 있습니다. 서비스에서 모델을 사용하여 문서를 분석하는 경우에만 요금이 청구됩니다.

  • 컨테이너 가격 책정은 클라우드 서비스 가격 책정과 동일합니다.

  • 문서 인텔리전스는 모든 문서 인텔리전스 기능을 테스트할 수 있는 무료 계층(F0)을 제공합니다.

  • 문서 인텔리전스에는 대규모 워크로드에 대한 약정 기반 가격 책정 모델이 있습니다.

Azure AI 문서 인텔리전스 가격 책정 옵션에 대해 자세히 알아봅니다.

문서 인텔리전스 사용량을 확인하고 가격을 예상하려면 어떻게 해야 하나요?

Azure Portal의 메트릭 대시보드에서 사용 현황 메트릭을 찾을 수 있습니다. 대시보드에는 Azure AI 문서 인텔리전스에서 처리한 페이지 수가 표시됩니다. Azure 가격 계산기를 사용하여 리소스에 사용된 예상 비용을 확인할 수 있습니다. 자세한 지침은 사용량 확인 및 예상 비용을 참조하세요.

제한을 완화하는 모범 사례는 무엇인가요?

문서 인텔리전스는 자동 크기 조정을 사용하여 필요한 계산 리소스를 주문형으로 제공하는 동시에 고객 비용을 낮게 유지합니다. 자동 스케일링 중에 제한을 완화하려면 다음 방법을 사용하는 것이 좋습니다.

  • 애플리케이션에서 다시 시도 논리를 구현합니다.

  • POST 요청 수에 제한이 있는 경우 요청 사이에 지연을 추가하는 것이 좋습니다.

  • 워크로드를 점진적으로 늘립니다. 급격한 변화를 피합니다.

  • TPS(초당 트랜잭션 수) 제한을 늘리기 위한 지원 요청을 만듭니다.

문서 인텔리전스 서비스 할당량 및 한도에 대해 자세히 알아봅니다.

문서를 분석하는 데 얼마나 걸리나요?

문서를 분석하는 데 걸리는 시간은 크기(예: 페이지 수) 및 각 페이지의 관련 콘텐츠에 따라 다릅니다.

문서 인텔리전스는 유사한 문서의 대기 시간이 비슷하지만 항상 동일하지는 않은 다중 테넌트 서비스입니다. 대기 시간은 API 서버가 들어오는 요청을 처리하고 클라이언트에 나가는 응답을 전달하는 데 걸리는 시간의 양입니다. 대기 시간 및 성능의 가변성은 이미지 및 대량의 문서를 대규모로 처리하는 마이크로 서비스 기반의 상태 비저장 비동기 서비스의 고유한 특성입니다.

하드웨어 및 용량과 스케일링 기능을 지속적으로 스케일 업하고 있지만, 아직은 런타임에 대기 시간 문제가 발생할 수 있습니다.

사용자 지정 모델

최상의 학습 데이터를 모으려면 어떻게 해야 하나요?

문서 인텔리전스 사용자 지정 모델을 사용하는 경우 자체 학습 데이터를 제공합니다. 다음은 모델을 효과적으로 학습시키는 데 도움이 되는 몇 가지 팁입니다.

  • 되도록이면 이미지 기반 PDF 대신 텍스트 기반을 사용합니다. 이미지 기반 PDF를 식별하는 한 가지 방법은 문서에서 특정 텍스트를 선택하는 것입니다. 텍스트의 전체 이미지만 선택할 수 있는 경우 문서는 텍스트 기반이 아닌 이미지 기반입니다.

  • 각 형식(JPEG/JPG, PNG, BMP, PDF 또는 TIFF)에 대한 하위 폴더를 사용하여 학습 문서를 구성합니다.

  • 사용 가능한 필드가 모두 완료된 양식을 사용합니다.

  • 각 필드의 값이 서로 다른 양식을 사용합니다.

  • 이미지 품질이 낮은 경우 더 큰 데이터 세트(학습 문서가 5개 이상)를 사용합니다.

학습 데이터 세트 만들기에 대해 자세히 알아보세요.

매우 정확한 사용자 지정 모델을 학습시키는 모범 사례는 무엇인가요?

모델의 정확도는 학습 자료의 질에 따라 달라집니다. 다음 팁을 참조하세요.

  • 단일 모델을 사용해야 하는지 아니면 단일 모델로 구성된 여러 모델을 사용해야 하는지 확인합니다.

  • 단일 모델로 여러 형식을 분석하면 모델 정확도가 떨어질 수 있습니다. 각 폴더가 고유한 템플릿인 폴더로 데이터 세트를 분할하는 계획을 세웁니다. 폴더당 하나의 모델을 학습시키고 결과 모델을 단일 엔드포인트로 구성합니다.

  • 사용자 지정 양식은 일관된 시각적 템플릿을 사용합니다. 양식에 서식 및 페이지 나누기 변형이 있는 경우 데이터 세트를 분할하여 여러 모델을 학습시키는 것이 좋습니다.

  • 형식, 문서 형식 및 구조를 고려하여 균형 잡힌 데이터 세트가 있는지 확인합니다.

구성된 모델에 대해 자세히 알아보세요.

사용자 지정 모델을 다시 학습시킬 수 있나요?

문서 인텔리전스에는 명시적인 재학습 작업이 없습니다. 각 학습 작업은 새 모델을 생성합니다.

모델을 다시 학습시켜야 경우 학습 데이터 세트에 더 많은 샘플을 추가하고 새 모델을 학습시킵니다.

단일 사용자 지정 모델로 작성할 수 있는 사용자 지정 모델은 몇 개인가요?

모델 작성 작업을 통해 최대 200개의 모델을 단일 모델 ID에 할당할 수 있습니다. 구성된 모델 ID를 사용하여 Analyze Document 요청을 하면 문서 인텔리전스는 제출된 양식을 분류하고 최상의 모델을 선택한 후 결과를 반환합니다. 현재 모델 만들기는 레이블을 사용하여 학습된 사용자 지정 모델에만 사용할 수 있습니다.

구성된 모델을 사용하여 문서를 분석하는 것은 단일 모델을 사용하여 문서를 분석하는 것과 동일합니다. Analyze Document 결과는 문서를 분석하기 위해 선택한 구성 요소 모델을 나타내는 docType 속성을 반환합니다. 개별 사용자 정의 모델 또는 구성된 사용자 정의 모델을 사용하여 문서를 분석하는 경우 가격은 변경되지 않습니다.

구성된 모델에 대해 자세히 알아보세요.

내가 구성하려는 모델의 수가 구성된 모델의 상한을 초과하는 경우 대안은 무엇인가요?

다음 대안 중 하나를 사용할 수 있습니다.

초기 학습을 넘어 모델을 구체화하려면 어떻게 해야 하나요?

각 학습 작업은 새 모델을 생성합니다.

  1. 새 템플릿에 대한 데이터 세트를 만듭니다.

  2. 새 모델의 레이블을 지정하고 학습시킵니다.

  3. 새 모델이 특정 문서 형식에 대해 잘 작동하는지 확인합니다.

  4. 기존 모델을 사용하여 새 모델을 단일 엔드포인트로 작성합니다. 그런 다음 문서 인텔리전스는 분석할 각 문서에 가장 적합한 모델을 결정할 수 있습니다.

구성된 모델에 대해 자세히 알아보세요.

사용자 지정 모델을 만들고 있습니다. 서명 감지 레이블은 무엇을 반환하나요?

서명 감지는 문서에 서명하는 사람의 ID가 아니라 서명의 존재를 찾습니다.

모델이 서명 감지에 대해 unsigned를 반환하면 모델이 정의된 필드에서 서명을 찾지 못한 것입니다.

문서에서 테이블을 추출하는 모범 사례는 무엇이며 무엇을 고려해야 하나요?

문서 인텔리전스 레이아웃 모델로 시작하여 문서와 이미지에서 텍스트, 테이블, 선택 표시, 구조 정보를 추출할 수 있습니다. 또한 다음 요소를 고려할 수 있습니다.

  • 추출하려는 데이터가 테이블로 존재하고 테이블 구조가 의미 있나요?

  • 데이터가 테이블 형식이 아닌 경우 데이터가 2차원 그리드에 잘 맞나요?

  • 테이블이 여러 페이지에 걸쳐 있나요? 그렇다면 모든 페이지에 레이블을 지정할 필요가 없도록 PDF를 문서 인텔리전스로 보내기 전에 여러 페이지로 분할합니다. 분석 후 페이지를 단일 테이블로 후처리합니다.

  • 사용자 지정 모델을 만드는 경우 테이블로 레이블 지정을 참조하세요. 각 열에 대한 동적 테이블의 행 수는 가변적입니다. 각 열에 대한 고정 테이블의 행 수는 일관적입니다.

학습된 모델을 한 환경(예: 베타)에서 다른 환경(예: 프로덕션)으로 이동하려면 어떻게 해야 하나요?

복사 API를 사용하여 한 문서 인텔리전스 계정에서 지원되는 지리적 지역에 있는 다른 계정으로 사용자 지정 모델을 복사할 수 있습니다. 자세한 지침은 재해 복구를 참조하세요.

복사 작업은 모델을 학습시킨 특정 클라우드 환경 내에서 모델을 복사하는 것으로 제한됩니다. 예를 들어 퍼블릭 클라우드에서 Azure Government 클라우드로 모델을 복사하는 것은 지원되지 않습니다.

사용자 지정 학습을 실행할 때 레이아웃에 대한 요금이 청구된 이유는 무엇인가요?

데이터 세트의 레이블을 생성하려면 레이아웃이 필요합니다. 사용자 지정 학습에 사용하는 데이터 세트에 사용할 수 있는 레이블 파일이 없으면 서비스에서 이를 생성합니다.

스토리지 계정

며칠 전에는 스토리지 계정에 액세스할 수 있었습니다. 현재는 다시 연결하는 데 문제가 있는 이유는 무엇인가요?

공유 액세스 서명을 만들 때 기본 기간은 48시간입니다. 48시간이 지나면 새 토큰을 만들어야 합니다.

문서 인텔리전스에서 스토리지 계정을 사용하는 시간에 대해 더 긴 시간을 설정하는 것이 좋습니다.

내 스토리지 계정이 가상 네트워크 또는 방화벽 뒤에 있는 경우 문서 인텔리전스에 데이터에 대한 액세스 권한을 부여하려면 어떻게 해야 하나요?

가상 네트워크 또는 방화벽으로 보호되는 Azure Storage 계정이 있는 경우 문서 인텔리전스는 스토리지 계정에 직접 액세스할 수 없습니다. 하지만 프라이빗 Azure 스토리지 계정 액세스 및 인증은 Azure 리소스에 대한 관리 ID를 지원합니다. 관리 ID를 사용하는 경우 문서 인텔리전스 서비스는 할당된 자격 증명을 사용하여 스토리지 계정에 액세스할 수 있습니다.

FOTT를 사용하여 프라이빗 스토리지 계정 데이터를 분석하려는 경우 가상 네트워크 또는 방화벽 뒤에 도구를 배포해야 합니다.

문서 인텔리전스 리소스에 대한 관리 ID를 만들기 및 사용하는 방법을 알아봅니다.

컨테이너

문서 인텔리전스 컨테이너를 사용하려면 인터넷 연결이 필요하나요?

예. 문서 인텔리전스 컨테이너가 Azure에 청구 정보를 보내려면 인터넷 연결이 필요합니다. Azure 컨테이너 보안에 대해 자세히 알아보세요.

연결이 끊긴 컨테이너와 연결된 컨테이너의 차이점은 무엇인가요?

연결된 컨테이너는 Azure 계정의 문서 인텔리전스 리소스를 사용하여 Azure에 청구 정보를 보냅니다. 연결된 컨테이너를 사용하는 경우 Azure로 청구 정보를 보내려면 인터넷 연결이 필요합니다.

연결이 끊긴 컨테이너를 사용하면 인터넷에서 연결이 끊긴 API를 사용할 수 있습니다. 청구 정보는 인터넷을 통해 전송되지 않습니다. 대신 구매한 약정 계층에 따라 요금이 청구됩니다. 현재 문서 인텔리전스 사용자 지정 및 청구서 모델에 연결되지 않은 컨테이너 사용이 가능합니다.

연결된 컨테이너와 연결되지 않은 컨테이너에서 제공되는 모델 기능은 동일하며 문서 인텔리전스 v2.1에서 지원됩니다.

연결된 컨테이너는 클라우드에 어떤 데이터를 보내나요?

문서 인텔리전스 연결된 컨테이너는 Azure 계정의 문서 인텔리전스 리소스를 사용하여 Azure에 청구 정보를 보냅니다. 연결된 컨테이너는 고객 데이터(예: 분석 중인 이미지 또는 텍스트)를 Microsoft에 보내지 않습니다.

연결된 컨테이너가 청구를 위해 Microsoft에 보내는 정보의 예는 Azure AI 컨테이너 FAQ를 참조하세요.

"컨테이너가 유효한 상태가 아닙니다. 'OutOfQuota' API 키가 할당량을 초과했기 때문에 구독 유효성 검사에 실패했습니다."라는 오류가 표시되는 이유는 무엇인가요?

문서 인텔리전스 연결된 컨테이너는 Azure 계정의 문서 인텔리전스 리소스를 사용하여 Azure에 청구 정보를 보냅니다. 컨테이너가 청구 엔드포인트와 통신할 수 없는 경우 이 메시지가 표시될 수 있습니다.

문서 인텔리전스 샘플 레이블 지정 도구(FOTT) 컨테이너에 로컬 스토리지를 사용할 수 있나요?

FOTT에는 로컬 스토리지를 사용하는 버전이 있습니다. 이 버전을 Windows 머신에 설치해야 합니다. 이 위치에서 설치할 수 있습니다.

레이블 지정 파일이 하위 디렉터리에 있는 경우 프로젝트 페이지에서 레이블 폴더 URI를 /shared 또는 /shared/sub-dir로 지정합니다. 다른 모든 문서 인텔리전스 샘플 레이블 지정 도구 동작은 호스트된 서비스와 동일합니다.

스케일 업의 모범 사례는 무엇인가요?

비동기 호출의 경우 공유 스토리지를 사용하여 여러 컨테이너를 실행할 수 있습니다. POST 분석 호출을 처리하는 컨테이너는 출력을 스토리지에 저장합니다. 그러면 다른 컨테이너가 스토리지에서 결과를 가져오고 GET 호출을 처리할 수 있습니다. 요청 ID는 컨테이너에 연결되지 않습니다.

동기 호출의 경우 여러 컨테이너를 실행할 수 있지만 하나의 컨테이너만 요청을 처리합니다. 이는 차단 호출이므로 풀의 모든 컨테이너가 요청을 처리하고 응답을 보낼 수 있습니다. 여기서는 한 번에 하나의 컨테이너만 요청에 연결되며 폴링이 필요하지 않습니다.

공유 스토리지를 사용하여 컨테이너를 설정하려면 어떻게 해야 하나요?

컨테이너는 시작하는 동안 처리 파일을 저장할 공유 스토리지를 지정하기 위해 Mounts:Shared 속성을 사용합니다. 이 속성의 사용을 보려면 컨테이너 설명서를 참조하세요.

보안 및 개인 정보

Azure AI 서비스에 대한 요청을 인증하기 위한 방법과 요구 사항은 무엇인가요?

Azure 서비스에 대한 각 요청에 인증 헤더가 포함되어야 합니다. 다음과 같은 여러 방법을 사용하여 요청을 인증할 수 있습니다.

문서 인텔리전스는 내 데이터를 저장하나요?

모든 기능에 대해 문서 인텔리전스는 요청과 동일한 지역에 있는 Azure Storage에 데이터와 결과를 일시적으로 저장합니다. 그러면 분석 요청을 제출한 시간으로부터 24시간 이내에 데이터가 삭제됩니다.

문서 인텔리전스의 데이터, 개인 정보 보호 및 보안에 대해 자세히 알아봅니다.

학습된 사용자 지정 모델은 문서 인텔리전스에 어떻게 저장되고 사용되나요?

분석 및 레이블 지정 후의 중간 출력은 학습 데이터를 저장하는 동일한 Azure Storage 위치에 저장됩니다. 학습된 사용자 지정 모델은 동일한 지역의 Azure Storage에 저장되고 Azure 구독 및 API 자격 증명과 함께 논리적으로 격리됩니다.

추가 도움말 및 지원

Azure AI 문서 인텔리전스 질문에 대한 추가 솔루션은 어디에서 찾을 수 있나요?

Microsoft Q&A는 기술 관련 질문과 답변을 위한 기본 공간입니다. 문서 인텔리전스와 관련된 쿼리를 필터링할 수 있습니다.

문서에 레이블을 지정할 때 서비스에서 특정 텍스트를 인식하지 못하거나 잘못 인식하는 경우 어떻게 해야 하나요?

Microsoft는 문서 인텔리전스 OCR 모델을 지속적으로 업데이트하고 개선합니다. 문서 인텔리전스 팀에 이메일을 보내실 수 있습니다. 가능하다면 이슈가 강조 표시된 샘플 문서를 공유해 주세요.