Sada prostředků GATK

Sada prostředků GATK je kolekce standardních souborů pro práci s lidskými daty s využitím sady GATK.

Poznámka

Microsoft poskytuje datové sady Azure Open Datasets podle toho, jak je. Společnost Microsoft neposkytuje žádné záruky, výslovné nebo předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním právem Společnost Microsoft zřeknutí se veškeré odpovědnosti za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Zdroj dat

Tato datová sada je zrcadlem úložiště dat na https://gatk.broadinstitute.org/hc/articles/360035890811-Resource-bundle.

Objemy dat a frekvence aktualizací

 1. datasetgatkbestpractices: 542 GB
 2. datasetgatklegacybundles: 61 GB
 3. datasetgatktestdata: 2 TB
 4. datasetpublicbroadref: 477 GB
 5. datasetbroadpublic: 3 TB

Datové sady se aktualizují vždy v prvním týdnu každého měsíce.

Umístění úložiště

Tato datová sada se uchovává v těchto oblastech Azure: USA – středozápad a USA – západ 2. Kvůli přidružení se doporučuje přidělovat výpočetní prostředky v oblasti USA – středozápad nebo USA – západ 2.

Přístup k datům

 1. datasetgatkbestpractices

  USA – západ 2: 'https://datasetgatkbestpractices.blob.core.windows.net/dataset'

  USA – středozápad: 'https://datasetgatkbestpractices-secondary.blob.core.windows.net/dataset'

  Token SAS: ?sv=2020-04-08si&=prodsr&=csig&=6SaDfKtXAIfdpO%2BkvNA%2FsTNmNij%2Byh%2F%2F%2Bf98WAUqs7I%3D

 2. datasetgatklegacybundles

  USA – západ 2: 'https://datasetgatklegacybundles.blob.core.windows.net/dataset'

  USA – středozápad: 'https://datasetgatklegacybundles-secondary.blob.core.windows.net/dataset'

  Token SAS: ?sv=2020-04-08si&=prodsr&=csig&=xBfxOPBqHKUCszzwbNCBYF0k9osTQjKnZbEjXCW7gU0%3D

 3. datasetgatktestdata

  USA – západ 2: 'https://datasetgatktestdata.blob.core.windows.net/dataset'

  USA – středozápad: 'https://datasetgatktestdata-secondary.blob.core.windows.net/dataset'

  Token SAS: ?sv=2020-04-08si&=prodsr&=csig&=fzLts1Q2vKjuvR7g50vE4HteEHBxTcJbNvf%2FZCeDMO4%3D

 4. datasetpublicbroadref

  USA – západ 2: 'https://datasetpublicbroadref.blob.core.windows.net/dataset'

  USA – středozápad: 'https://datasetpublicbroadref-secondary.blob.core.windows.net/dataset'

  Token SAS: ?sv=2020-04-08si&=prodsr&=csig&=DQxmjB4D1lAfOW9AxIWbXwZx6ksbwjlNkixw597JnvQ%3D

 5. datasetbroadpublic

  USA – západ 2: 'https://datasetbroadpublic.blob.core.windows.net/dataset'

  USA – středozápad: 'https://datasetbroadpublic-secondary.blob.core.windows.net/dataset'

  Token SAS: ?sv=2020-04-08si&=prodsr&=csig&=u%2Bg2Ab7WKZEGiAkwlj6nKiEeZ5wdoJb10Az7uUwis%2Fg%3D

Podmínky použití

Navštivte oficiální stránky sady prostředků GATK.

Kontakt

Navštivte oficiální stránky sady prostředků GATK.

Další kroky

Zobrazte zbývající datové sady v katalogu Open Datasets.