Databricks Runtime 6.3 for Genomics (nem támogatott)
A Databricks 2020 januárjában adta ki ezt a lemezképet.
A Databricks Runtime for Genomics (Databricks Runtime Genomics) a Databricks Runtime 6.3 (nem támogatott) változata, amely genomikai és biomedikai adatokkal való munkavégzésre van optimalizálva. Ez a Databricks Genomics egyesített elemzési platformjának összetevője.
További információkért, beleértve a Genomics-fürthöz készült Databricks-futtatókörnyezet létrehozásának utasításait, tekintse meg a Genomicshoz készült Databricks-futtatókörnyezetet (elavult) ismertető cikket. A genomikai alkalmazások fejlesztéséről további információt a Genomics útmutatójában talál.
Új funkciók
A Databricks Runtime 6.3 for Genomics a Databricks Runtime 6.3-ra épül. A Databricks Runtime 6.3 újdonságairól a Databricks Runtime 6.3 (nem támogatott) kibocsátási megjegyzéseiben olvashat.
Közös genotípus-meghatározási folyamat a Delta-ból
A Databricks Runtime 6.3 for Genomics közös genotípus-beállítása mostantól bemenetként a DNASeq-folyamat által írt Delta-táblákat is képes átvenni. Ez a funkció lehetővé teszi a két folyamat együttes használatát anélkül, hogy az eredményeket gVCF-fájlokba exportálja.
Automatikus széljegyzet-elemzés a VCF-fájlok olvasásakor
A Genomicshoz készült Databricks Runtime 6.3-ban található Glow-verzió automatikusan elemzi és ANN
info mezőket a CSQ
virtuális gépek olvasásakor. INFO_CSQ
és INFO_ANN
az eredményként kapott DataFrame-ek mezői mostantól strukturált sémákkal rendelkeznek az egyszerűsített lekérdezéshez.
Fejlesztések
Továbbfejlesztett többallelikus variánselválasztó
A Glow és a Databricks Runtime for Genomics többallelikus változatválasztója mostantól összetettebb típusú többallelikus helyeket kezel. Az új viselkedés tükrözi a vt felbontásának parancssori eszközét. Emellett az elválasztót mostantól különálló transzformátorként is használhatja a hívással glow.transform('split_multiallelics'...
.
Gyorsabb lineáris és logisztikai regressziós függvények
A logistic_regression_gwas
Databricks Runtime 6.3 for Genomics függvénye körülbelül 60%-kal gyorsabb, mint a 6.2-es verzió. linear_regression_gwas
körülbelül 50%-kal gyorsabb.