Share via


ENCODE: Uppslagsverk av DNA-element

Encyclopedia of DNA Elements (ENCODE) Consortium är ett pågående internationellt samarbete mellan forskargrupper som finansieras av National Human Genome Research Institute (NHGRI). ENCODE:s mål är att bygga en omfattande dellista över funktionella element i det mänskliga genomet, inklusive element som agerar på protein- och RNA-nivåer, och regleringselement som styr celler och omständigheter där en gen är aktiv.

ENCODE-utredare använder olika analyser och metoder för att identifiera funktionella element. Identifieringen och annoteringar av genelement utförs i första hand genom sekvensering av olika typer av RNA-källor, jämförande genomik, integrerande bioinformatikmetoder och mänskligt läkande. Regleringselement undersöks vanligtvis genom DNA-överkänslighetsanalyser, analyser av DNA-metylering och immunprecipitation (IP) av proteiner som interagerar med DNA och RNA, det vill säga modifierade histoner, transkriptionsfaktorer, kromatinregulatorer och RNA-bindande proteiner, följt av sekvensering.

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Data source

Den här datamängden är en spegling av datalagringen i https://www.encodeproject.org/

Datavolymer och uppdateringsfrekvens

Den här datamängden innehåller cirka 756 TB data och uppdateras dagligen.

Lagringsplats

Den här datamängden lagras i Azure-regionerna USA, västra 2 och USA, västra centrala. Vi rekommenderar att du letar upp beräkningsresurser i USA, västra 2 eller USA, västra centrala för tillhörighet.

Dataåtkomst

USA, västra 2: 'https://datasetencode.blob.core.windows.net/dataset'

USA, västra centrala: "https://datasetencode-secondary.blob.core.windows.net/dataset"

SAS-token: ?sv=2019-10-10&si=prod&sr=c&sig=9qSQZo4ggrCNpybBExU8SypuUZV33igI11xw0P7rB3c%3D

Användningsvillkor

Externa dataanvändare kan fritt ladda ned, analysera och publicera resultat baserat på ENCODE-data utan begränsningar, oavsett typ eller storlek, och inkluderar ingen respitperiod för ENCODE-dataproducenter, antingen som enskilda medlemmar eller som en del av konsortiet. Forskare som använder opublicerade ENCODE-data uppmanas att kontakta dataproducenterna för att diskutera möjliga publikationer. Konsortiet kommer fortsätta att publicera resultaten av sina egna analysinsatser i oberoende publikationer.

ENCODE begär att forskare som använder ENCODE-datamängder (publicerade eller opublicerade) i publikationer och presentationer citerar ENCODE-konsortiet på alla följande sätt som rapporteras på https://www.encodeproject.org/help/citing-encode/.

Kontaktperson

Om du har frågor, problem eller kommentarer kan du skicka ett e-postmeddelande till vår supportavdelning på encode-help@lists.stanford.edu.

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.