TSV로 변환

데이터 입력을 탭으로 구분된 형식으로 변환합니다.

범주: 데이터 형식 변환

참고

적용 대상: Machine Learning Studio (클래식)

이 콘텐츠는 Studio (클래식)에만 해당 됩니다. Azure Machine Learning 디자이너에는 비슷한 끌어서 놓기 모듈이 추가 되었습니다. 이 문서에서는 두 가지 버전을 비교 하는방법에 대해 자세히 알아보세요.

모듈 개요

이 문서에서는 Azure Machine Learning Studio (클래식)에서 TSV로 변환 모듈을 사용 하 여 모든 Azure Machine Learning Studio (클래식) 모듈에서 사용 하는 내부 형식에서 탭으로 구분 된 형식의 플랫 파일로 데이터 집합을 변환 하는 방법을 설명 합니다.

탭으로 구분된 값(TSV) 파일은 다음을 비롯한 여러 외부 도구와 호환됩니다.

  • R 및 Python

  • Excel 및 PowerPivot

  • 모든 관계형 데이터베이스

예를 들어 다른 도구에서 다시 사용 하기 위해 저장 하려는 중간 데이터 집합이 실험에 있거나 코드에서 호출 하려는 경우이를 TSV 형식으로 변환한 다음 변환 된 데이터 집합을 마우스 오른쪽 단추로 클릭 하 여 데이터 집합에 액세스 하는 데 필요한 Python 코드를 가져옵니다.

TSV로 Convert를 사용 하는 방법

데이터 집합을 탭으로 구분 된 형식으로 다운로드 해야 할 때마다 TSV로 변환 모듈을 사용 합니다.

  1. TSV에 변환을 실험에 추가 합니다. 이 모듈은 Azure Machine Learning Studio (클래식)의 데이터 형식 변환 범주에서 찾을 수 있습니다.

  2. 모듈을 다른 datset 또는 테이블 형식 데이터 집합을 출력 하는 모듈에 연결 합니다.

  3. 실험을 실행 하거나 단순히 TSV로 변환 모듈을 마우스 오른쪽 단추로 클릭 하 고 선택 된 실행 을 선택 합니다.

결과

변환이 완료 되 면 데이터 집합을 열거나, R 또는 Python 코드에서 호출 하거나, Jupyter 노트북에서 사용 하거나, 로컬 파일에 저장할 수 있습니다.

데이터 집합을 다운로드 하려면 모듈 출력을 두 번 클릭 하 고 datset을 열지 또는 저장할지를 지정 합니다.

  • 열기 를 선택 하는 경우 컴퓨터에서 기본적으로 사용 하는 모든 도구를 사용 하 여 데이터 집합이 로드 되어 열립니다. TSV 파일. 일반적으로 Microsoft Excel입니다.

  • 데이터 집합 다운로드 를 선택 하는 경우 기본적으로 파일은 모듈 이름에 작업 영역 ID를 나타내는 GUID를 추가 하 여 저장 됩니다. 그러나 다운로드 중에 다른 이름 으로 저장 옵션을 선택 하 고 파일 이름 또는 위치를 변경할 수 있습니다.

예제

이 형식에 대 한 구체적인 예제는 없지만 Azure AI Gallery에서 이러한 샘플 실험을 살펴보면 형식 변환을 사용 하는 방법의 예를 확인할 수 있습니다.

  • 이진 분류에 대 한 교차 유효성 검사 샘플: Excel과 같은 도구를 사용 하 여 여러 모델의 결과를 비교할 수 있도록 교차 유효성 검사 결과를 쉼표로 구분 된 값 (CSV) 형식으로 내보냅니다.

  • 색 기반 이미지 압축 양자화: csv 형식을 지 원하는 모든 도구에서 비슷한 모델을 쉽게 실행할 수 있도록 각 분석 부분에 사용 되는 데이터 집합을 csv 파일로 내보냅니다.

기술 정보

이 섹션에는 구현 세부 정보, 팁 및 질문과 대답 (faq)이 포함 되어 있습니다.

TSV 형식 요구 사항

탭으로 구분된 값(TSV)은 테이블 구조로 데이터를 저장하는 데 사용되는 텍스트 형식입니다. CSV 형식과 매우 비슷하지만 쉼표가 아닌 탭이 구분 기호입니다.

데이터에 쉼표가 포함된 경우 TSV 형식은 CSV 형식의 대체로 유용하게 사용됩니다. 쉼표는 텍스트 데이터에서 매우 흔히 사용되며 유럽어 숫자 형식에도 사용됩니다.

탭으로 구분된 형식의 한 가지 문제점은 구조화되지 않은 텍스트에서 탭 정지가 공백으로 간주되는 경우가 많다는 것입니다. 그러나 TSV에 대한 IANA 표준에서는 TSV 파일의 명확하고 정확한 구문 분석을 위해 필드 내에서 탭을 허용하지 않습니다.

Azure Machine Learning Studio (클래식)의 TSV 파일에 대 한 다음 요구 사항을 확인 하세요.

  • 데이터 집합에 열 이름이 포함된 경우 TSV로 변환 모듈에서는 단일 머리글 행의 출력을 지원합니다.

  • TSV 공급자는 UTF-8 문자 인코딩만 지원합니다.

  • TSV 파일을 읽거나 TSV 파일에 쓸 때는 CSV 등의 다른 형식에 비해 성능이 낮아질 수 있습니다.

예상 입력

속성 유형 설명
데이터 세트 데이터 테이블 입력 데이터 세트

출력

속성 유형 설명
결과 데이터 집합 GenericTsv 출력 데이터 세트

참고 항목

데이터 형식 변환
전체 모듈 목록