قم بإرسال سير عمل باستخدام مدخلات ملف FASTQ في Microsoft Genomics

توضح هذه المقالة كيفية إرسال سير عمل إلى خدمة Microsoft Genomics إذا كانت ملفات الإدخال هي زوج واحد من ملفات FASTQ. يفترض هذا الموضوع أنك قمت بالفعل بتثبيت وتشغيل عميل msgen وأنك على دراية بكيفية استخدام Azure Storage. إذا قمت بإرسال سير عمل بنجاح باستخدام البيانات النموذجية المتوفرة، فأنت جاهز لمتابعة هذه المقالة.

الإعداد: قم بتحميل ملفات FASTQ إلى مساحة تخزين Azure

لنفترض أن لديك ملفين، reads_1.fq.gz and reads_2.fq.gz، وقمت بتحميلهما إلى حساب موقع التخزين الخاص بك myaccount في Azure كـ https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz وhttps://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz. لديك عنوان API ومفتاح الوصول الخاص بك. تريد أن يكون لديك مخرجات في https://myaccount.blob.core.windows.net/outputs.

أرسل عملك إلى عميل msgen

هذا هو الحد الأدنى من مجموعة الوسيطات التي ستحتاج إلى توفيرها لعميل msgen؛ تمت إضافة فواصل الأسطر للتوضيح:

للنافذة:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads_1.fq.gz ^
  --input-blob-name-2 reads_2.fq.gz ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

بالنسبة إلى Unix:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads_1.fq.gz \
  --input-blob-name-2 reads_2.fq.gz \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

إذا كنت تفضل استخدام ملف التكوين، فإليك ما سيحتويه:

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads_1.fq.gz
input_blob_name_2:                reads_2.fq.gz
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

أرسل الملف config.txt مع هذا الاحتجاج: msgen submit -f config.txt

الخطوات التالية

في هذه المقالة، قمت بتحميل زوج من ملفات FASTQ إلى Azure Storage وأرسلت سير عمل إلى خدمة Microsoft Genomics من خلال عميل Python msgen. لمعرفة المزيد حول إرسال سير العمل والأوامر الأخرى التي يمكنك استخدامها مع خدمة Microsoft Genomics، راجع الأسئلة المتداولة.