ARFF로 변환

데이터 입력을 Weka 도구 집합에서 사용하는 특성 관계 파일 형식으로 변환

범주: 데이터 형식 변환

참고

적용 대상: Machine Learning Studio (클래식)

이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.

모듈 개요

이 문서에서는 Azure Machine Learning Studio (클래식)에서 ARFF로 변환 모듈을 사용 하 여 데이터 집합 및 Azure Machine Learning를 weka 도구 집합에 사용 되는 특성 관계 파일 형식으로 변환 하는 방법을 설명 합니다. 이 형식을 ARFF 라고 합니다.

Weka에 대 한 ARFF 데이터 사양은 데이터 전처리, 분류 및 기능 선택을 포함 하 여 여러 machine learning 작업을 지원 합니다. 이 형식에서 데이터는 엔터티 및 해당 특성에 의해 구성 되며 단일 텍스트 파일에 포함 됩니다. 기술 참고 사항 섹션에서 weka 파일 형식에 대 한 세부 정보를 찾을 수 있습니다.

일반적으로 Weka 파일 형식으로의 변환은 Azure Machine Learning와 Weka을 모두 사용 하 고 두 항목 간에 학습 데이터를 앞뒤로 이동 하려는 경우에만 필요 합니다.

Weka 도구 집합에 대 한 자세한 내용은이 위키백과 문서: weka (machine learning) 를 참조 하세요.

경고

Azure 저장소의 기존 ARFF 파일을 덮어쓸 수 없습니다.

ARFF로 Convert를 사용 하는 방법

  1. ARFF로 변환 모듈을 실험에 추가 합니다. 이 모듈은 Azure Machine Learning Studio (클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.

  2. 데이터 집합을 출력 하는 모듈에 연결 합니다.

  3. 실험을 실행 하거나 ARFF로 변환 모듈을 클릭 하 고 선택한 실행 을 클릭 합니다.

결과

  • 로컬 폴더에 데이터의 복사본을 만들려면 ARFF로 변환의 출력을 두 번 클릭 하 고 다운로드 옵션을 선택 합니다.

    폴더를 지정 하지 않으면 기본 파일 이름이 적용 되 고 로컬 다운로드 라이브러리에 파일이 저장 됩니다.

참고

이 모듈에서는 Python 또는 R 코드로의 내보내기를 지원 하지 않습니다.

예제

Azure AI Gallery에는이 형식과 관련 된 예제가 없습니다. 그러나 이러한 실험은 다른 형식의 형식 변환을 보여 줍니다.

기술 참고 사항

이 섹션에는 구현 세부 정보, 팁 및 질문과 대답 (faq)이 포함 되어 있습니다.

ARFF 형식의 예

이 섹션에서는 ARFF로 변환 될 때 일반적인 데이터 집합이 어떻게 표시 되는지 보여 주는 예제를 제공 합니다.

일반적으로 ARFF 데이터 파일은 데이터 원본 및 스키마를 정의 하는 헤더 와 실제 엔터티와 해당 특성을 포함 하는 데이터 섹션의 두 섹션으로 구성 됩니다.

ARFF 헤더

ARFF 파일의 헤더는 특성의 목록 (열) 및 해당 데이터 형식을 정의 합니다. 헤더는 데이터 원본 또는 기타 참고 사항을 설명하는 여러 주석 줄을 포함할 수도 있습니다.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

변환 하는 데이터 집합에 열 이름이 없는 경우 ARFF로 변환을 사용 하기 전에 메타 데이터 편집 모듈을 사용 하 여 열 이름을 추가 합니다.

ARFF 데이터

데이터 섹션은 쉼표로 구분 된 값으로 구성 되며 열 머리글이 없는 CSV 파일과 매우 유사 하 게 보입니다.

@DATA 5.1,3.5,1.4,0.2,0

이 파일 형식에 대 한 자세한 내용은 Weka Wiki 페이지: Arff (개발자 버전)를 참조 하세요.

현재 ARFF 버전

Azure Machine Learning Studio (클래식) ARFF 3.0 형식을 사용 하 여 ARFF 파일을 저장 합니다.

예상 입력

속성 유형 설명
데이터 세트 데이터 테이블 입력 데이터 세트

출력

속성 유형 설명
결과 데이터 집합 Arff 출력 데이터 세트

참고 항목

데이터 형식 변환
전체 모듈 목록