ARFF로 변환
데이터 입력을 Weka 도구 집합에서 사용하는 특성 관계 파일 형식으로 변환
범주: 데이터 형식 변환
참고
적용 대상: Machine Learning Studio (클래식)
이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.
모듈 개요
이 문서에서는 Azure Machine Learning Studio (클래식)에서 ARFF로 변환 모듈을 사용 하 여 데이터 집합 및 Azure Machine Learning를 weka 도구 집합에 사용 되는 특성 관계 파일 형식으로 변환 하는 방법을 설명 합니다. 이 형식을 ARFF 라고 합니다.
Weka에 대 한 ARFF 데이터 사양은 데이터 전처리, 분류 및 기능 선택을 포함 하 여 여러 machine learning 작업을 지원 합니다. 이 형식에서 데이터는 엔터티 및 해당 특성에 의해 구성 되며 단일 텍스트 파일에 포함 됩니다. 기술 참고 사항 섹션에서 weka 파일 형식에 대 한 세부 정보를 찾을 수 있습니다.
일반적으로 Weka 파일 형식으로의 변환은 Azure Machine Learning와 Weka을 모두 사용 하 고 두 항목 간에 학습 데이터를 앞뒤로 이동 하려는 경우에만 필요 합니다.
Weka 도구 집합에 대 한 자세한 내용은이 위키백과 문서: weka (machine learning) 를 참조 하세요.
경고
Azure 저장소의 기존 ARFF 파일을 덮어쓸 수 없습니다.
ARFF로 Convert를 사용 하는 방법
ARFF로 변환 모듈을 실험에 추가 합니다. 이 모듈은 Azure Machine Learning Studio (클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.
데이터 집합을 출력 하는 모듈에 연결 합니다.
실험을 실행 하거나 ARFF로 변환 모듈을 클릭 하 고 선택한 실행 을 클릭 합니다.
결과
로컬 폴더에 데이터의 복사본을 만들려면 ARFF로 변환의 출력을 두 번 클릭 하 고 다운로드 옵션을 선택 합니다.
폴더를 지정 하지 않으면 기본 파일 이름이 적용 되 고 로컬 다운로드 라이브러리에 파일이 저장 됩니다.
참고
이 모듈에서는 Python 또는 R 코드로의 내보내기를 지원 하지 않습니다.
예제
Azure AI Gallery에는이 형식과 관련 된 예제가 없습니다. 그러나 이러한 실험은 다른 형식의 형식 변환을 보여 줍니다.
색 기반 이미지 압축: 재현 가능성 및 다른 분석 플랫폼에서 사용할 수 있도록 분석의 각 부분에 사용 되는 데이터 집합을 파일로 내보냅니다.
이진 분류에 대 한 교차 유효성 검사 샘플: Excel과 같은 도구를 사용 하 여 여러 모델의 결과를 비교할 수 있도록 교차 유효성 검사 결과를 파일로 내보냅니다.
기술 참고 사항
이 섹션에는 구현 세부 정보, 팁 및 질문과 대답 (faq)이 포함 되어 있습니다.
ARFF 형식의 예
이 섹션에서는 ARFF로 변환 될 때 일반적인 데이터 집합이 어떻게 표시 되는지 보여 주는 예제를 제공 합니다.
일반적으로 ARFF 데이터 파일은 데이터 원본 및 스키마를 정의 하는 헤더 와 실제 엔터티와 해당 특성을 포함 하는 데이터 섹션의 두 섹션으로 구성 됩니다.
ARFF 헤더
ARFF 파일의 헤더는 특성의 목록 (열) 및 해당 데이터 형식을 정의 합니다. 헤더는 데이터 원본 또는 기타 참고 사항을 설명하는 여러 주석 줄을 포함할 수도 있습니다.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
팁
변환 하는 데이터 집합에 열 이름이 없는 경우 ARFF로 변환을 사용 하기 전에 메타 데이터 편집 모듈을 사용 하 여 열 이름을 추가 합니다.
ARFF 데이터
데이터 섹션은 쉼표로 구분 된 값으로 구성 되며 열 머리글이 없는 CSV 파일과 매우 유사 하 게 보입니다.
@DATA 5.1,3.5,1.4,0.2,0
이 파일 형식에 대 한 자세한 내용은 Weka Wiki 페이지: Arff (개발자 버전)를 참조 하세요.
현재 ARFF 버전
Azure Machine Learning Studio (클래식) ARFF 3.0 형식을 사용 하 여 ARFF 파일을 저장 합니다.
예상 입력
속성 | 유형 | 설명 |
---|---|---|
데이터 세트 | 데이터 테이블 | 입력 데이터 세트 |
출력
속성 | 유형 | 설명 |
---|---|---|
결과 데이터 집합 | Arff | 출력 데이터 세트 |