개수 테이블 가져오기

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이전에 만든 개수 테이블을 가져옵니다.

범주: 개수가 있는 Learning

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 테이블 가져오기 모듈을 사용하는 방법을 설명합니다.

Import Count Table 모듈의 목적은 이전 버전의 Machine Learning 사용하여 개수 기반 통계 테이블을 만든 고객이 실험을 업그레이드할 수 있도록 하는 것입니다. 이 모듈은 기존 개수 테이블을 새 데이터와 병합합니다.

개수 테이블 및 해당 테이블이 기능을 만드는 데 사용되는 방법에 대한 일반적인 내용은 Counts를 사용한 Learning 참조하세요.

중요

이 모듈은 사용되지 않는 빌드 개수 테이블 및 사용되지 않는 Count Featurizer 모듈을 사용하는 실험과의 이전 버전과의 호환성을 위해서만 제공됩니다. 새 기능을 활용하려면 최신 모듈을 사용하도록 실험을 업그레이드하는 것이 좋습니다.

모든 새 실험의 경우 다음 모듈을 사용하는 것이 좋습니다.

Import Count 테이블을 구성하는 방법

  1. Machine Learning Studio(클래식)에서 사용되지 않는 빌드 개수 테이블 모듈을 사용하여 만든 개수 테이블이 포함된 실험을 엽니다.

  2. Import Count Table 모듈을 실험에 추가합니다.

  3. 빌드 개수 테이블(사용되지 않음) 모듈의 두 출력을 가져오기 개수 테이블의 일치하는 입력 포트로 커넥트.

    가져온 개수 테이블과 병합하려는 개수의 다른 데이터 세트가 있는 경우 가져오기 개수 테이블 모듈에 대한 가장 오른쪽 입력에 연결합니다.

  4. Count 형식 옵션을 사용하여 개수 테이블이 저장되는 위치와 방법을 지정합니다.

    • 데이터 세트: 개수를 작성하는 데 사용되는 데이터는 Machine Learning Studio(클래식)의 데이터 세트로 저장됩니다.

    • Blob: 개수를 빌드하는 데 사용되는 데이터는 Windows Azure Storage에 블록 Blob으로 저장됩니다.

    • MapReduce: 개수를 빌드하는 데 사용되는 데이터는 Windows Azure Storage에 Blob으로 저장됩니다.

      이 옵션은 일반적으로 매우 큰 데이터 세트에 선호됩니다. 개수에 액세스하려면 HDInsight 클러스터를 활성화해야 합니다. 계산을 수행하기 위해 MapReduce 작업이 시작됩니다. 이러한 두 활동 모두 스토리지 및 컴퓨팅 비용이 발생할 수 있습니다.

      자세한 내용은 Azure의 HDInsight를 참조하세요.

    데이터 스토리지 모드를 지정한 후 이전에 실험에서 데이터 가져오기 모듈을 사용하여 데이터에 액세스한 경우에도 데이터에 대한 추가 연결 정보를 제공해야 할 수 있습니다. 즉, Count Featurizer(사용되지 않음) 모듈은 데이터를 읽고 필요한 테이블을 빌드하기 위해 데이터 스토리지에 개별적으로 액세스하기 때문입니다.

  5. 개수 테이블 유형 옵션을 사용하여 개수를 저장하는 데 사용되는 테이블의 형식 및 스토리지 모드를 지정합니다.

    • 사전: 사전 개수 테이블을 사용합니다.

      선택한 열의 모든 열 값은 문자열로 취급되고 크기가 최대 31비트인 비트 배열을 사용하여 해시됩니다. 따라서 모든 열 값은 음수가 아닌 32비트 정수도 표시됩니다.

    • CMSketch: 개수 최소 스케치 테이블에 저장된 테이블을 사용합니다.

      이 형식을 사용하면 범위가 더 작은 여러 개의 독립적인 해시 함수를 사용하여 메모리 효율성을 높이고 해시 충돌 가능성을 줄입니다.

    일반적으로 더 작은 데이터 집합(1GB)<에 대해 사전 옵션을 사용하고 더 큰 데이터 세트에 CMSketch 옵션을 사용해야 합니다.

  6. 실험을 실행합니다.

  7. 완료되면 테이블 가져오기 모듈의 출력을 마우스 오른쪽 단추 로 클릭하고 변환으로 저장을 선택하고 변환의 이름을 입력합니다. 이렇게 하면 병합된 개수 테이블과 적용했을 수 있는 모든 기능화 매개 변수가 새 데이터 세트에 적용할 수 있는 형식으로 저장됩니다.

Azure AI 갤러리에서 이러한 샘플 실험을 사용하여 개수 기반 기능화의 예를 살펴봅니다.

참고

이러한 갤러리 실험은 모두 Counts 모듈이 있는 Learning 이전 버전과 더 이상 사용되지 않는 버전을 사용하여 만들어졌습니다. Studio(클래식)에서 실험을 열면 최신 모듈을 사용하도록 실험이 자동으로 업그레이드됩니다.

예상 입력

Name 유형 설명
개수 메타데이터 데이터 테이블 개수의 메타데이터
개수 테이블 데이터 테이블 개수 테이블
계산된 데이터 집합 데이터 테이블 계산에 사용되는 데이터 집합

모듈 매개 변수

Name Type 범위 Optional 기본값 설명
계산 유형 CountingType 필수 계산 유형

출력

Name 유형 설명
계산 변환 ITransform 인터페이스 계산 변환

예외

예외 설명
오류 0003 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다.
오류 0018 입력 데이트 세트가 올바르지 않으면 예외가 발생합니다.

Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.

API 예외 목록은 MACHINE LEARNING REST API 오류 코드를 참조하세요.

참고 항목

개수로 학습