필터 적용

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

데이터 집합의 지정된 열에 필터 적용

범주: 데이터 변환/필터

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 필터 적용 모듈을 사용하여 이전에 정의된 필터를 적용하여 값 열을 변환하는 방법을 설명합니다. 필터는 노이즈를 줄이거나 패턴을 강조 표시하기 위해 디지털 신호 처리에 사용됩니다. 따라서 변환하는 값은 항상 숫자이며 일반적으로 일종의 오디오 또는 시각적 신호를 나타냅니다.

다른 유형의 필터를 찾고 있나요? Studio(클래식)는 데이터 샘플링, 데이터 하위 집합 가져오기, 잘못된 값 제거 또는 테스트 및 학습 집합 만들기를 위한 모듈을 제공합니다. 데이터 분할, 누락된 데이터 정리, 파티션 및 샘플, SQL 변환 적용, 클립 값. 원본에서 읽을 때 데이터를 필터링해야 하는 경우 데이터 가져오기를 참조하세요. 옵션은 원본 형식에 따라 달라집니다.

데이터 원본에 가장 적합한 필터 유형을 결정한 후 매개 변수를 지정하고 필터 적용 을 사용하여 데이터 세트를 변환합니다. 필터 디자인은 필터 적용 프로세스와 별개이므로 필터를 다시 사용할 수 있습니다. 예를 들어, 예측에 사용되는 데이터로 자주 작업하는 경우 여러 모델을 학습하고 비교하기 위해 여러 유형의 이동 평균 필터를 디자인해야 합니다. 필터를 저장하여 다른 실험 또는 다른 데이터 세트에 적용할 수도 있습니다.

필터 적용을 구성하는 방법

  1. 필터 적용 모듈을 실험에 추가합니다. 데이터 변환 아래의 필터 범주에서 IIR 필터 모듈을 찾을 수 있습니다 .

  2. 오른쪽 입력에 숫자 값이 포함된 데이터 세트를 하나의 입력에 연결합니다.

  3. 왼쪽 입력에 기존 필터를 연결합니다. 저장된 필터를 다시 사용하거나 임계값 필터, 이동 평균필터, 중간 필터, IIR 필터, FIR 필터, 사용자 정의 필터 중 하나를 사용하여 필터를 구성할 수 있습니다.

  4. 필터 적용속성 창에서 열 선택기 시작을 클릭하고 필터를 적용할 열을 선택합니다.

  5. 실험을 실행하거나 필터 적용 을 마우스 오른쪽 단추로 클릭하고 선택한 실행을 클릭합니다.

결과

출력에는 지정된 미리 정의된 수학 변환을 적용하여 변환된 선택한 열의 데이터만 포함됩니다.

데이터 세트에 다른 열이 표시되도록 하려면 열 추가 모듈을 사용하여 원본 및 필터링된 데이터 세트를 병합할 수 있습니다.

참고

원래 열의 값은 삭제되거나 덮어쓰여지지 않았으며 실험에서 참조할 수 있습니다. 그러나 필터의 출력은 일반적으로 모델링에 더 유용합니다.

기계 학습에서 필터를 사용하는 방법에 대한 예제는 Azure AI 갤러리를 참조하세요.

  • 필터: 엔지니어링된 파형 데이터 세트를 사용하여 모든 필터 형식을 보여 줍니다.

기술 정보

이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.

  • 필터 적용 모듈은 지정된 유형의 필터를 선택한 열에 바인딩합니다. 서로 다른 유형의 필터를 다른 열에 적용해야 하는 경우 데이터 세트의 열 선택을 사용하여 열을 격리하고 별도의 워크플로에서 다른 필터 형식을 적용해야 합니다. 자세한 내용은 데이터 세트의 열 선택을 참조하세요.

  • 필터는 필터의 영향을 받지 않는 데이터 열을 통과하지 않습니다. 즉, 필터 적용의 출력에는 변환된 숫자 값만 포함됩니다. 그러나 열 추가 모듈을 사용하여 변환된 값을 원본 데이터 세트와 조인할 수 있습니다.

필터 기간

필터 기간은 다음과 같이 필터 형식에 따라 부분적으로 결정됩니다.

  • FIR(유한 임펄스 응답), 단순 이동 평균 및 삼각 이동 평균 필터의 경우 필터 기간은 유한입니다.

  • IIR(무한 임펄스 응답), 지수 이동 평균 및 누적 이동 평균 필터의 경우 필터 기간은 무한입니다.

  • 임계값 필터의 경우 필터 기간은 항상 1입니다.

  • 중앙값 필터의 경우에는 필터 기간과 관계없이 입력 신호에 NaN 및 누락 값이 있어도 출력에서 새 NaN이 생성되지는 않습니다.

누락된 값

이 섹션에서는 필터 형식별로 누락된 값이 발견될 때의 동작에 대해 설명합니다. 일반적으로 필터가 입력 데이터 세트에서 NaN 또는 누락된 값을 발견하면 필터 기간에 따라 일부 다음 샘플 수에 대해 출력 데이터 세트가 NaN으로 손상됩니다. 그러면 다음과 같은 결과가 발생합니다.

  • FIR, 단순 이동 평균 또는 삼각형 이동 평균 필터의 기간은 유한합니다. 결과적으로 누락된 값 뒤에 필터 순서에서 1을 뺀 여러 NaN이 잇습니다.

  • IIR, 지수 이동 평균 또는 누적 이동 평균 필터에는 무한 기간이 있습니다. 따라서 첫 번째 누락된 값이 발견되면 NaN은 무기한 전파됩니다.

  • 임계값 필터에서 임계값 필터의 기간은 1입니다. 따라서 누락된 값과 NaN이 전파되지 않습니다.

  • 중앙값 필터의 경우에는 필터 기간과 관계없이 입력 데이터 집합에서 NaN 및 누락 값이 발견되어도 출력에서 새 NaN이 생성되지는 않습니다.

예상 입력

Name 유형 Description
Assert IFilter 인터페이스 필터 구현입니다.
데이터 세트 데이터 테이블 입력 데이터 세트

Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.

API 예외 목록은 MACHINE LEARNING REST API 오류 코드를 참조하세요.

모듈 매개 변수

Name 범위 Type 기본값 설명
열 집합 모두 ColumnSelection NumericAll 필터링할 열을 선택합니다.

출력

Name 유형 설명
결과 데이터 집합 데이터 테이블 출력 데이터 세트

참고 항목

Filter
전체 모듈 목록