문제 해결 가이드
Microsoft Genomics 서비스 MSGEN을 사용할 때 발생할 수 있는 일반적인 문제를 위한 몇 가지 문제 해결 팁입니다.
문제 해결과 관련이 없는 FAQ의 경우 일반적인 질문을 참조하세요.
1단계: 워크플로와 연결된 오류 코드 찾기
다음을 통해 워크플로와 연결된 오류 메시지를 찾을 수 있습니다.
- 명령줄 사용 및
msgen status
에 입력 - standardoutput.txt의 콘텐츠 검사
1. msgen status
명령줄 사용
msgen status -u URL -k KEY -w ID
다음과 같은 세 가지 필수 인수가 있습니다.
URL - API에 대한 기본 URI
KEY - Genomics 계정에 대한 액세스 키
- URL과 KEY를 찾으려면 Azure Portal로 이동하여 Microsoft Genomics 계정 페이지를 엽니다. 관리 제목 아래에서 액세스 키를 선택하세요. 거기에서 API URL과 액세스 키를 모두 찾을 수 있습니다.
ID - 워크플로 ID
워크플로 ID를 찾으려면
msgen list
명령을 입력합니다. 구성 파일이 URL 및 액세스 키를 포함하며, 사용자의 msgen exe와 동일한 위치에 있다고 가정하면 명령이 다음과 같이 표시됩니다.msgen list -f "config.txt"
이 명령의 출력은 다음과 같이 표시됩니다.
Microsoft Genomics command-line client v0.7.4 Copyright (c) 2018 Microsoft. All rights reserved. Workflow List ------------- Total Count : 1 Workflow ID : 10001 Status : Completed successfully Message : Process : snapgatk-20180730_1 Description : Created Date : Mon, 27 Aug 2018 20:27:24 GMT End Date : Mon, 27 Aug 2018 20:55:12 GMT Wall Clock Time : 0h 27m 48s Bases Processed : 1,348,613,600 (1 GBase)
참고 항목
또는 URL과 KEY를 직접 입력하는 대신 구성 파일의 경로를 포함할 수 있습니다. 이러한 인수를 구성 파일뿐만 아니라 명령줄에 포함하면 명령줄 인수가 우선적으로 적용됩니다.
msgen 실행 파일과 동일한 경로에 있는 config.txt 파일 및 워크플로 ID 1001의 경우 명령은 다음과 같이 표시됩니다.
msgen status -w 1001 -f "config.txt"
2. standardoutput.txt의 콘텐츠 검사
질문의 워크플로에 대한 출력 컨테이너를 찾습니다. MSGEN은 모든 워크플로를 실행한 후 [workflowfilename].logs.zip
폴더를 만듭니다. 폴더의 압축을 풀어 해당 콘텐츠를 확인합니다.
- outputFileList.txt - 워크플로 중에 생성된 출력 파일의 목록입니다.
- standarderror.txt - 이 파일은 비어 있습니다.
- standardoutput.txt - 워크플로를 실행하는 동안 발생한 오류를 포함한 모든 최상위 상태 메시지를 기록합니다.
- GATK 로그 파일 -
logs
폴더에 있는 다른 모든 파일입니다.
문제 해결을 위해 standardoutput.txt의 콘텐츠를 검사하고 나타나는 오류 메시지를 기록합니다.
2단계: 일반적인 오류에 대한 권장되는 단계를 시도합니다.
이 섹션에서는 Microsoft Genomics 서비스(msgen)에서 출력되는 일반적인 오류와 이를 해결하는 데 사용할 수 있는 전략에 대해 간략히 설명합니다.
Microsoft Genomics 서비스(msgen)는 다음 두 종류의 오류를 throw할 수 있습니다.
- 내부 서비스 오류: 매개 변수 또는 입력 파일 수정으로는 해결할 수 없는 서비스 내부의 오류입니다. 경우에 따라 워크플로를 다시 전송하면 이러한 오류를 해결할 수도 있습니다.
- 입력 오류: 올바른 인수 사용 및 파일 형식 수정으로 해결할 수 있는 오류입니다.
1. 내부 서비스 오류
내부 서비스 오류는 사용자 조치가 불가능합니다. 워크플로를 다시 제출할 수 있지만 작동하지 않는 경우 Microsoft Genomics 지원에 문의하세요.
오류 메시지 | 권장되는 문제 해결 단계 |
---|---|
내부 오류가 발생함. 워크플로를 다시 제출해 보세요. 이 오류가 다시 표시되면 Microsoft Genomics 지원에 문의하세요. | 워크플로를 다시 제출합니다. 문제가 계속되면 지원 티켓을 만들어 Microsoft Genomics 지원에 문의하세요. |
2. 입력 오류
이러한 오류는 사용자가 조치할 수 있습니다. 파일 형식 및 오류 코드에 따라 Microsoft Genomics 서비스는 고유한 오류 코드를 출력합니다. 아래에 나열된 권장된 문제 해결 단계를 따릅니다.
파일 형식 | 오류 코드 | 오류 메시지 | 권장되는 문제 해결 단계 |
---|---|---|---|
모두 | 701 | 읽기 [readId]에 [numberOfBases] 자료가 있지만 한도는 [maxReadLength]입니다. | 이 오류에 대한 가장 일반적인 이유는 파일 손상으로 인한 두 개의 읽기 연결입니다. 입력 파일을 확인합니다. |
BAM | 200 | ‘[yourFileName]’ 파일을 읽을 수 없습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 다시 제출합니다. |
BAM | 201 | [File_name] BAM 파일을 읽을 수 없습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 202 | [File_name] BAM 파일을 읽을 수 없습니다. 파일이 너무 작고 헤더가 누락되었습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 203 | [File_name] BAM 파일을 읽을 수 없습니다. 파일의 헤더가 손상되었습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 204 | [File_name] BAM 파일을 읽을 수 없습니다. 파일의 헤더가 손상되었습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 205 | [File_name] BAM 파일을 읽을 수 없습니다. 파일의 헤더가 손상되었습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 206 | [File_name] BAM 파일을 읽을 수 없습니다. 파일의 헤더가 손상되었습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 207 | [File_name] BAM 파일을 읽을 수 없습니다. 파일이 [offset] 오프셋 근처에서 잘립니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
BAM | 208 | BAM 파일이 잘못되었습니다. [Read_Id] ReadID에 [File_name] 파일의 시퀀스가 없습니다. | BAM 파일의 형식을 확인합니다. 올바른 형식의 파일을 사용하여 워크플로를 제출합니다. |
FASTQ | 300 | FASTQ 파일을 읽을 수 없습니다. [File_name]이(가) 줄 바꿈 문자로 끝나지 않았습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 301 | [File_name] FASTQ 파일을 읽을 수 없습니다. FASTQ 레코드가 [_offset] 오프셋의 버퍼 크기보다 큽니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 302 | FASTQ 구문 오류입니다. [File_name] 파일에 빈 줄에 있습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 303 | FASTQ 구문 오류입니다. [File_name] 파일의 [_offset] 오프셋, [line_type] 줄 형식, [_char] 문자에서 시작 문자가 잘못되었습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 304 | [_ReadID] ReadID에서 FASTQ 구문 오류가 있습니다. 일괄 처리의 첫 번째 읽기에 [File_name] 파일의 /1에서 끝나는 readID가 없습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 305 | [_readID] readID에서 FASTQ 구문 오류가 있습니다. 일괄 처리의 두 번째 읽기에 [File_name] 파일의 /2에서 끝나는 readID가 없습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 306 | [_ReadID] ReadID에서 FASTQ 구문 오류가 있습니다. 쌍의 첫 번째 읽기에 [File_name] 파일의 /1에서 끝나는 ID가 없습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 307 | [_ReadID] ReadID에서 FASTQ 구문 오류가 있습니다. ReadID가 /1 또는 /2로 끝나지 않습니다. [File_name] 파일을 쌍으로 연결된 FASTQ 파일로 사용할 수 없습니다. | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
FASTQ | 308 | FASTQ 읽기 오류입니다. 두 읽기가 서로 다르게 응답됩니다. 올바른 FASTQ 파일을 선택하지 못했습니까? | FASTQ 파일의 형식을 수정하고 워크플로를 다시 제출합니다. |
3단계: Microsoft Genomics 지원에 문의
작업이 계속 실패하거나 다른 질문이 있는 경우 Azure Portal의 Microsoft Genomics 지원에 문의하세요. 지원 요청을 제출하는 방법에 대한 추가 정보는 여기에서 찾을 수 있습니다.
다음 단계
이 문서에서는 Microsoft Genomics 서비스와 관련된 일반적인 문제를 해결하는 방법을 알아보았습니다. 자세한 내용 및 일반적인 FAQ는 일반적인 질문을 참조하세요.