KÓDOVÁNÍ: Encyklopedie prvků DNA

Konsorcium Encyclopedia of DNA Elements (ENCODE) je průběžná mezinárodní spolupráce výzkumných skupin financovaných národním institutem NHGRI (Human Genome Research Institute). Cílem funkce ENCODE je vytvořit komplexní seznam funkčních prvků v lidském genomu, včetně prvků, které působí na úrovni bílkovin a RNA, a regulačních prvků, které řídí buňky a okolnosti, ve kterých je gen aktivní.

K identifikaci funkčních prvků používají vyšetřovatelé KÓDOVÁNÍ různé testy a metody. Zjišťování a popisování genových prvků se dosahuje hlavně pomocí sekvenování nejrůznějších zdrojů RNA, srovnávací genomiky, integračních bioinformatických metod a humánní medicíny. Regulační prvky se obvykle prošetřují prostřednictvím testů přecitlivělosti DNA, analýzy metylace DNA a imunoprecipitace (IP) proteinů, které komunikují s DNA a RNA, tj. upravenými histony, přepisovými faktory, chromatinovými regulátory a proteiny vazby RNA a následným sekvencováním.

Poznámka:

Microsoft poskytuje datové sady Azure Open Datasets na bázi "tak, jak je". Společnost Microsoft neposkytuje žádné záruky, výslovné ani předpokládané záruky ani podmínky týkající se vašeho používání datových sad. V rozsahu povoleném vaším místním zákonem společnost Microsoft odmítá veškerou odpovědnost za případné škody nebo ztráty, včetně přímých, následných, zvláštních, nepřímých, náhodných nebo represivních, vyplývajících z vašeho používání datových sad.

Na tuto datovou sadu se vztahují původní podmínky, které Microsoft přijal se zdrojovými daty. Datová sada může obsahovat data pocházející z Microsoftu.

Zdroj dat

Tato datová sada je zrcadlem úložiště dat na https://www.encodeproject.org/.

Objemy dat a frekvence aktualizací

Tato datová sada zahrnuje přibližně 756 TB dat a aktualizuje se každý den.

Umístění úložiště

Tato datová sada se uchovává v těchto oblastech Azure: USA – středozápad a USA – západ 2. Pro spřažení doporučujeme umístit výpočetní prostředky do oblasti USA – západ 2 nebo USA – středozápad.

Přístup k datům

USA – západ 2: 'https://datasetencode.blob.core.windows.net/dataset'

USA – středozápad: 'https://datasetencode-secondary.blob.core.windows.net/dataset'

Token SAS: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Podmínky použití

Uživatelé externích dat mohou volně stahovat, analyzovat a publikovat výsledky na základě jakýchkoli dat ENCODE bez omezení bez ohledu na typ nebo velikost a neobsahují žádné období odkladu pro producenty dat ENCODE, a to buď jako jednotliví členové, nebo jako součást konsorcia. Výzkumníci, kteří používají nepublikovaná data ENCODE, se doporučuje kontaktovat producenty dat a diskutovat o možných publikacích. Konsorcium bude nadále zveřejňovat výsledky vlastního analytického úsilí v nezávislých publikacích.

Konsorcium ENCODE požaduje, aby výzkumní pracovníci, kteří používají datové sady ENCODE (publikované nebo nepublikované), uváděli v publikacích a prezentacích citaci konsorcia ENCODE, a to všemi způsoby uvedenými na webu https://www.encodeproject.org/help/citing-encode/.

Kontakt

Pokud máte nějaké dotazy, pochybnosti nebo komentáře, pošlete nám na adresu helpdesku encode-help@lists.stanford.edue-mail.

Další kroky

Prohlédněte si zbývající datové sady v katalogu Open Datasets.