Databricks Runtime pour la génomique Databricks Runtime for Genomics
Databricks Runtime pour la génomique (Databricks Runtime génomique) est une version de Databricks Runtime optimisée pour l’utilisation de données génomiques et biomédicales.Databricks Runtime for Genomics (Databricks Runtime Genomics) is a version of Databricks Runtime optimized for working with genomic and biomedical data. Il s’agit d’un composant de la plateforme d’analytique unifiée Azure Databricks pour la génomique.It is a component of the Azure Databricks Unified Analytics Platform for Genomics. Pour plus d’informations sur le développement d’applications génomiques, consultez le Guide génomique.For more information on developing genomics applications, see Genomics guide.
Qu’en est-il Databricks Runtime pour la génomique ?What’s in Databricks Runtime for Genomics?
- Une version optimisée de la bibliothèque open source Databricks-Regeneron briller avec toutes ses fonctionnalités , ainsi que :An optimized version of the Databricks-Regeneron open-source library Glow with all its functionalities as well as:
- Prise en charge de Spark SQL pour la lecture et l’écriture de données variantSpark SQL support for reading and writing variant data
- Fonctions pour les éléments de flux de travail courantsFunctions for common workflow elements
- Optimisations pour les modèles de requête courantsOptimizations for common query patterns
- Pipelines à clé en main mis en parallèle avec Apache Spark :Turn-key pipelines parallelized with Apache Spark:
- Intégration de la grêle 0,2Hail 0.2 integration
- Bibliothèques Open source populaires, optimisées pour les performances et la fiabilité :Popular open source libraries, optimized for performance and reliability:
- ADAMADAM
- GATKGATK
- Hadoop-BAMHadoop-bam
- Outils en ligne de commande populaires :Popular command line tools:
- samtoolssamtools
- Données de référence (grch37 ou 38, sites SNP connus)Reference data (grch37 or 38, known SNP sites)
Pour obtenir la liste complète des bibliothèques et versions incluses, consultez les notes de publication de Databricks Runtime pour génomiques .See the Databricks Runtime for Genomics release notes for a complete list of included libraries and versions.
Configuration requiseRequirements
Votre espace de travail Azure Databricks doit avoir Databricks Runtime pour la génomique activée.Your Azure Databricks workspace must have Databricks Runtime for Genomics enabled.
Créer un cluster à l’aide de Databricks Runtime pour la génomiqueCreate a cluster using Databricks Runtime for Genomics
Lorsque vous créez un cluster, sélectionnez une Databricks Runtime pour la version génomique dans la liste déroulante Databricks Runtime la version.When you create a cluster, select a Databricks Runtime for Genomics version from the Databricks Runtime Version drop-down.