Share via


Dados abertos do TCGA

O Atlas do Genoma do Câncer (TCGA), um programa de genômica do câncer de referência, caracterizou molecularmente mais de 20.000 cânceres primários comparando-os a amostras normais, abrangendo 33 tipos de câncer[1]. Os dados sobre câncer do TCGA disponibilizados publicamente são duas camadas: acesso aberto ou controlado.

  • Acesso aberto [disponível no Azure]: esse conjunto de dados contém dados clínicos e de espécimes desindentificados ou dados resumidos que não contêm nenhuma informação de identificação individual. Os tipos de dados incluídos são de expressão genética, valores beta de metilação e quantificação de proteína. O tipo de dados no nível de DNA inclui o número de cópia no nível do gene e o segmento de número de cópia mascarada.
  • Acesso controlado: esse conjunto de dados é os dados de sequência de nível individual e requer aprovação por meio do dbGap para acesso.

Observação

A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.

Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.

Fonte de dados

Este conjunto de dados é um espelho dos dados abertos do TCGA

Volumes de dados e frequência de atualização

Ete conjunto de dados contém aproximadamente 387 GB

Local de armazenamento

Este conjunto de dados está armazenado nas regiões do Leste dos EUA 2 do Azure. É recomendável alocar recursos de computação na região Leste dos EUA 2 para fins de afinidade.

Acesso de dados

Leste dos EUA 2: "https://datasettcga.blob.core.windows.net/dataset"

Token SAS: ?sp=rl&st=2022-10-07T19:43:37Z&se=2030-10-02T03:43:37Z&spr=https&sv=2021-06-08&sr=c&sig=9YgXjisOpHJNgdeMb5lOOzBhA38PWGM8g2DHjo9A5Cs%3D

Termos de uso

Os dados estão disponíveis sem restrições. Para obter mais informações e detalhes da citação, confira a página do programa TCGA

Contact

Para perguntas sobre dados e programa do TCGA: https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga/contact

Próximas etapas

Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.