Soumettre un workflow à l’aide d’une entrée de fichier BAM

Cet article montre comment soumettre un workflow dans le service Microsoft Genomics si votre fichier d’entrée est un fichier BAM unique. Cette rubrique suppose que vous avez déjà installé et exécuté le client msgen, et que vous savez comment utiliser Stockage Azure. Si vous avez correctement soumis un workflow à l’aide de l’exemple de données fourni, vous êtes prêt à appliquer la procédure décrite dans cet article.

Configurer : Télécharger votre fichier BAM vers Stockage Azure

Supposons que vous disposiez d’un fichier BAM unique, reads.bam, et que vous l’ayez chargé dans votre compte de stockage myaccount dans Azure, sous https://myaccount.blob.core.windows.net/inputs/reads.bam. Vous disposez de l’URL d’API et de votre clé d’accès. Vos sorties doivent être hébergées sous https://myaccount.blob.core.windows.net/outputs.

Envoyer votre tâche au client msgen

Voici le jeu minimal d’arguments qu’il vous faudra fournir au client msgen ; des sauts de ligne ont été ajoutés pour plus de clarté :

Pour Windows :

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Pour Unix :

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

Si vous préférez utiliser un fichier de configuration, voici à quoi il doit ressembler :

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

Envoyez le fichier config.txt avec cet appel : msgen submit -f config.txt

Étapes suivantes

Dans cet article, vous avez chargé un fichier BAM dans Stockage Azure et envoyé un workflow au service Microsoft Genomics via le client Python msgen. Pour plus d’informations sur la soumission du workflow et les autres commandes pouvant être utilisées avec le service Microsoft Genomics, consultez notre FAQ.