Lago de Dados Genómica

O Genomics Data Lake fornece vários conjuntos de dados públicos a que pode aceder gratuitamente e integrar-se nos seus fluxos de trabalho de análise de genómica e aplicações. Os conjuntos de dados incluem sequenciação de genomas, informações sobre variantes e metadados de sujeitos de experiências/exemplo nos formatos de ficheiro BAM, FASTA, VCF e CSV.

O Data Lake do Genomics está alojado nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste do Azure. A alocação de recursos de computação nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste é recomendada por questões de afinidade.

Nota

A utilização de conjuntos de dados está sujeita a termos e condições definidos pelos proprietários do conjunto de dados. Consulte a página de detalhes de cada conjunto de dados para os termos e condições aplicáveis.

Conjuntos de dados

Conjuntos de dados Description
Illumina Platinum Genomes Illumina Platinum Genomes
Human Reference Genomes Human Reference Genomes
ClinVar Annotations ClinVar Annotations
SnpEff SnpEff: caixa de ferramentas de anotação de variantes genómicas e de predição de efeitos funcionais
gnomAD gnomAD: Banco de Dados de Agregação Genoma
1000 Genomes 1000 Genomes
OpenCravat OpenCravat: Open Custom Ranked Analysis of Variants Toolkit
CODIFICAR ENCODE: Encyclopedia of DNA Elements
Pacote de recursos GATK Pacote de recursos do GATK

Passos seguintes

Ver o resto dos conjuntos de dados no catálogo Open Datasets.