Microsoft Genomics: часто задаваемые вопросы

В этой статье перечислены самые популярные вопросы, связанные с Microsoft Genomics. Дополнительные сведения о службе Microsoft Genomics см. в этой статье. Дополнительные сведения об устранении неполадок см. в этом руководстве.

Как выполнять рабочие процессы GATK4 в Microsoft Genomics?

В файле config.txt службы Microsoft Genomics укажите для параметра process_name значение gatk4. Обратите внимание, что плата будет взиматься по стандартным тарифам.

Как включить сжатие выходных данных?

Вы можете сжать выходные файлы VCF или GVCF с помощью соответствующего необязательного аргумента. Это эквивалентно выполнению -bgzip с добавлением -tabix для выходных файлов VCF или GVCF с целью создания файлов .gz (выходные данные bgzip) и .tbi (выходные данные tabix). bgzip сжимает файл VCF или GVCF. tabix создает индекс для сжатого файла. Аргумент является логическим значением, которое по умолчанию имеет значение false для выходных файлов VCF и значение true для выходных файлов GVCF. Для использования в командной строке укажите для -bz или --bgzip-output значение true (запустите bgzip и tabix) или false. Чтобы использовать этот аргумент в файле config.txt, добавьте в файл значение bgzip_output: true или bgzip_output: false.

Что такое Соглашение об уровне обслуживания для Microsoft Genomics?

Мы гарантируем, что по крайней мере 99,9 % времени служба Microsoft Genomics будет доступна для получения API-запросов рабочего процесса. См. дополнительные сведения о Соглашении об уровне обслуживания.

Как плата за использование Microsoft Genomics отражается в счете?

Плата за использование Microsoft Genomics зависит от количества гигабаз, обработанных за один рабочий процесс. Дополнительные сведения см. на странице цен.

Где можно найти список всех возможных команд и аргументов для клиента `msgen`?

Полный список доступных команд и аргументов можно получить, выполнив команду msgen help. Если дополнительные аргументы не указаны, отобразится список доступных разделов со справочными сведениями, по одному для каждой из команд submit, list, cancel и status. Чтобы получить справочные сведения по определенной команде, введите msgen help command. Например, команда msgen help submit выведет список всех параметров отправки.

Какие команды используются чаще всего для клиента `msgen`?

Самые часто используемые команды для клиента msgen представляют собой аргументы, указанные ниже:

Команда Описание поля
list Возвращает список отправленных заданий. Чтобы запросить аргументы, выполните команду msgen help list.
submit Отправляет запрос рабочего процесса к службе. Чтобы запросить аргументы, выполните команду msgen help submit.
status Возвращает состояние рабочего процесса, указанного в --workflow-id. См. также раздел msgen help status.
cancel Отправляет запрос на отмену обработки рабочего процесса, указанного в --workflow-id. См. также раздел msgen help cancel.

Где можно получить значение для `--api-url-base`?

Перейдите на портал Azure и откройте страницу учетной записи Genomics. В разделе управления выберите Ключи доступа. Вы получите URL-адрес API и ключи доступа.

Где можно получить значение для `--access-key`?

Перейдите на портал Azure и откройте страницу учетной записи Genomics. В разделе управления выберите Ключи доступа. Вы получите URL-адрес API и ключи доступа.

Зачем нужны два ключа доступа?

Два ключа доступа требуются, если их нужно обновить (повторно создать) без прерывания использования службы. Например, если вы хотите обновить первый ключ, все новые рабочие процессы должны использовать второй ключ. Поэтому дождитесь завершения всех рабочих процессов, использующих первый ключ, прежде чем обновлять первый ключ.

Сохраняются ли мои ключи учетной записи хранения?

Ключ учетной записи хранения используется для создания краткосрочных маркеров доступа службы Microsoft Genomics, считывания входных и записи выходных файлов. По умолчанию время существования маркера составляет 48 часов. Его можно изменить с помощью параметра -sas/--sas-duration команды отправки, указав количество часов как значение.

Хранит ли Microsoft Genomics данные клиентов?

Нет. Microsoft Genomics не хранит какие-либо данные клиентов.

Какие референсные геномы можно использовать?

Поддерживаются следующие референсные геномы:

Справка Значение параметра -pa/--process-args
b37 R=b37m1
hg38 R=hg38m1
hg38 (без альтернативного анализа) R=hg38m1x
hg19 R=hg19m1

Как форматировать аргументы командной строки в качестве файла конфигурации?

msgen распознает файлы конфигурации в следующем формате:

  • Все параметры предоставляются как пары "ключ-значение" (через двоеточие). Пробелы игнорируются.

  • Строки, начинающиеся с #, игнорируются.

  • Любой аргумент командной строки в полном формате можно преобразовать в ключ, удалив начальные тире и заменив тире между словами на символы подчеркивания. Ниже приведены некоторые примеры преобразований.

    Аргумент командной строки Строка в файле конфигурации
    -u/--api-url-base https://url api_url_base:https://url
    -k/--access-key KEY access_key:KEY
    -pa/--process-args R=B37m1 process_args:R-b37m1

Дальнейшие действия

Используйте следующие ресурсы, чтобы приступить к работе с Microsoft Genomics: