Enviar um fluxo de trabalho usando uma entrada de arquivo do BAM

Este artigo demonstra como enviar um fluxo de trabalho para o serviço do Microsoft Genomics se o arquivo de entrada for um único arquivo BAM. Este tópico pressupõe que você já instalou e executou o cliente msgen e está familiarizado sobre como usar o Armazenamento do Azure. Se você enviou com êxito um fluxo de trabalho usando os dados de exemplo fornecidos, está pronto para continuar com este artigo.

Configurar: carregar seu arquivo BAM no armazenamento do Azure

Vamos assumir que você tenha um arquivo BAM, reads.bam, e já o carregou na sua conta de armazenamento myaccount no Azure como https://myaccount.blob.core.windows.net/inputs/reads.bam. Você tem a URL da API e sua chave de acesso. Você deseja ter saídas em https://myaccount.blob.core.windows.net/outputs.

Enviar o trabalho para o cliente msgen

Aqui está o conjunto mínimo de argumentos que você precisará fornecer para o cliente msgen; quebras de linha foram adicionadas para maior clareza:

Para Windows:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Para Unix

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Se você preferir usar um arquivo de configuração, é isto que ele deve conter:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Envie o arquivo config.txt com esta invocação: msgen submit -f config.txt

Próximas etapas

Neste artigo, você carregou um arquivo BAM no Armazenamento do Azure e enviou um fluxo de trabalho para o serviço do Microsoft Genomics por meio do cliente Python msgen. Para obter informações adicionais sobre o envio de fluxo de trabalho e outros comandos que você pode usar com o serviço do Microsoft Genomics, consulte nossas Perguntas frequentes.