Databricks Runtime 6.3 for Genomics (nem támogatott)

A Databricks 2020 januárjában adta ki ezt a lemezképet.

A Databricks Runtime for Genomics (Databricks Runtime Genomics) a Databricks Runtime 6.3 (nem támogatott) változata, amely genomikai és biomedikai adatokkal való munkavégzésre van optimalizálva. Ez a Databricks Genomics egyesített elemzési platformjának összetevője.

További információkért, beleértve a Genomics-fürthöz készült Databricks-futtatókörnyezet létrehozásának utasításait, tekintse meg a Genomicshoz készült Databricks-futtatókörnyezetet (elavult) ismertető cikket. A genomikai alkalmazások fejlesztéséről további információt a Genomics útmutatójában talál.

Új funkciók

A Databricks Runtime 6.3 for Genomics a Databricks Runtime 6.3-ra épül. A Databricks Runtime 6.3 újdonságairól a Databricks Runtime 6.3 (nem támogatott) kibocsátási megjegyzéseiben olvashat.

Közös genotípus-meghatározási folyamat a Delta-ból

A Databricks Runtime 6.3 for Genomics közös genotípus-beállítása mostantól bemenetként a DNASeq-folyamat által írt Delta-táblákat is képes átvenni. Ez a funkció lehetővé teszi a két folyamat együttes használatát anélkül, hogy az eredményeket gVCF-fájlokba exportálja.

Automatikus széljegyzet-elemzés a VCF-fájlok olvasásakor

A Genomicshoz készült Databricks Runtime 6.3-ban található Glow-verzió automatikusan elemzi és ANN info mezőket a CSQ virtuális gépek olvasásakor. INFO_CSQ és INFO_ANN az eredményként kapott DataFrame-ek mezői mostantól strukturált sémákkal rendelkeznek az egyszerűsített lekérdezéshez.

Fejlesztések

Továbbfejlesztett többallelikus variánselválasztó

A Glow és a Databricks Runtime for Genomics többallelikus változatválasztója mostantól összetettebb típusú többallelikus helyeket kezel. Az új viselkedés tükrözi a vt felbontásának parancssori eszközét. Emellett az elválasztót mostantól különálló transzformátorként is használhatja a hívással glow.transform('split_multiallelics'....

Gyorsabb lineáris és logisztikai regressziós függvények

A logistic_regression_gwas Databricks Runtime 6.3 for Genomics függvénye körülbelül 60%-kal gyorsabb, mint a 6.2-es verzió. linear_regression_gwas körülbelül 50%-kal gyorsabb.