Envío de un flujo de trabajo con una entrada de archivo BAM

En este artículo se muestra cómo enviar un flujo de trabajo al servicio de Microsoft Genomics, si el archivo de entrada es un archivo simple BAM. En este tema se da por supuesto que ya ha instalado y ejecutado el cliente msgen y está familiarizado con el uso de Azure Storage. Si ha enviado correctamente un flujo de trabajo usando los datos de ejemplo proporcionados, puede continuar con este artículo.

Configuración: Carga del archivo BAM en Azure Storage

Supongamos que tiene un único archivo BAM, reads.bam, y lo ha cargado en la cuenta de almacenamiento myaccount en Azure como https://myaccount.blob.core.windows.net/inputs/reads.bam. Tiene la dirección URL de la API y la clave de acceso. Desea los resultados en https://myaccount.blob.core.windows.net/outputs.

Envío del trabajo al cliente msgen

Este es el conjunto mínimo de argumentos que debe proporcionar al cliente msgen; los saltos de línea se han agregado para mayor claridad:

Para Windows:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Para Unix:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Si prefiere usar un archivo de configuración, esto es lo que podría contener:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Envíe el archivo config.txt con esta invocación: msgen submit -f config.txt

Pasos siguientes

En este artículo, se va a cargar un archivo BAM en Azure Storage y se va a enviar un flujo de trabajo al servicio Microsoft Genomics mediante el cliente de Python msgen. Para obtener información adicional sobre el envío del flujo de trabajo y otros comandos que puede usar con el servicio Microsoft Genomics, vea nuestras preguntas más frecuentes.