Databricks Runtime 5.5 LTS (non pris en charge)

Databricks a publié cette image en juillet 2019. Elle a été déclarée Support à long terme (LTS) en août 2019. Le support a pris fin le 27 juillet 2021. Databricks Runtime 5.5 prise en charge étendue (non pris en charge) a été publié le 8 juillet 2021 et étend la prise en charge de la version 5.5 jusqu’en décembre 2021. Il utilise Ubuntu 18.04.5 LTS au lieu de la distribution Ubuntu 16.04.6 LTS déconseillée utilisée dans la version originale Databricks Runtime 5.5 LTS. Le support d’Ubuntu 16.04.6 LTS a cessé le 1er avril 2021.

Les notes de publication suivantes fournissent des informations sur Databricks Runtime 5.5, alimenté par Apache Spark.

Nouvelles fonctionnalités

Optimisation automatique de Delta Lake sur Azure Databricks

Aujourd’hui, lorsque vous écrivez des données dans un stockage cloud, vous devez compacter les fichiers pour obtenir des performances d’E/S optimales. Vous devez vous soucier de la taille appropriée des fichiers, de la fréquence de compactage des fichiers, de la taille du cluster à utiliser, etc. Pour répondre à cette classe de problèmes, nous sommes heureux d’annoncer la disponibilité générale de l’outil Auto Optimize avec Delta Lake sur Azure Databricks. Lors de chaque écriture dans les tables Delta, nous déterminons automatiquement la taille appropriée des fichiers et les comprimons afin que vous n’ayez pas à vous soucier de l’optimisation de la disposition du stockage. Pendant les écritures, si l’option auto-optimize est true, Azure Databricks détermine automatiquement si une optimisation est nécessaire et optimise les petits fichiers. Pour plus d’informations, consultez Configurer Delta Lake pour contrôler la taille du fichier de données.

Delta Lake sur Azure Databricks a amélioré les performances des requêtes d'agrégation min, max et count

Les performances des requêtes d’agrégation min, max et count pour Delta Lake sur Azure Databricks ont été considérablement améliorées en réduisant la quantité de données lues. Ces requêtes sont maintenant exécutées en utilisant les statistiques et les valeurs de partition dans les métadonnées, plutôt que d’analyser les données.

Pipelines d’inférence de modèles plus rapides grâce à l’amélioration de la source de données des fichiers binaires et de l’UDF pandas Itérateur scalaire (Préversion publique)

Les tâches de Machine Learning, notamment dans le domaine de l’image et de la vidéo, doivent souvent opérer sur un grand nombre de fichiers. Dans Databricks Runtime 5.4, nous avons déjà mis à disposition la source de données de fichiers binaires pour faciliter l’ETL (extraction, transformation et chargement) de fichiers arbitraires, tels que des images, dans des tables Spark. Dans Databricks Runtime 5.5, nous avons ajouté une option, recursiveFileLookup, pour charger des fichiers de manière récursive à partir de répertoires d’entrée imbriqués. Voir Fichier binaire.

La source de données de fichiers binaires vous permet d’exécuter des tâches d’inférence de modèle en parallèle à partir de tables Spark à l’aide d’une UDF pandas scalaire. Toutefois, vous devrez peut-être initialiser le modèle pour chaque lot d’enregistrements, ce qui entraîne une surcharge. Dans Databricks Runtime 5.5, nous avons rétroporté un nouveau type d’UDF pandas appelé « Itérateur scalaire » à partir du maître Apache Spark. Grâce à lui, vous pouvez initialiser un modèle une seule fois et l’appliquer à de nombreux lots d’entrée, ce qui peut se traduire par une accélération multipliée par 2 ou par 3 pour des modèles comme ResNet50. Voir Série vers UDF scalaire.

API Secrets dans les notebooks R

L’API Secrets vous permet d’injecter des secrets dans des notebooks sans les coder en dur. Cette API est désormais disponible dans les notebooks R, en plus de la prise en charge existante pour les notebooks Python et Scala. Vous pouvez utiliser la fonction dbutils.secrets.get pour obtenir des secrets. Les secrets sont supprimés avant l’impression dans une cellule du notebook.

Améliorations

  • Prise en charge de l’exécution d’opérations SQL Delta Lake dans Python foreachBatch : nous avons corrigé la limitation connue qui empêchait d’écrire dans les tables Delta à partir de foreachBatch d’une requête Structured Streaming définie en Python. Cela est utile dans les charges de travail de streaming Python courantes. Par exemple, l’écriture d’agrégats de streaming en mode de mise à jour à l’aide de MERGE et foreachBatch.
  • Performances des tables Delta stockées dans Azure Data Lake Gen2 : la vérification de la dernière version d’une table Delta sur ADLS Gen2 vérifie désormais uniquement la fin du journal des transactions, au lieu de répertorier toutes les versions disponibles. Cette optimisation fait de UPDATE une opération à temps constant, ce qui améliore considérablement la latence.
  • Scalabilité de l’optimisation ZORDER BY : l’ordre de plan sur les très grandes tables Delta utilise désormais des unités de travail plus petites qui sont régies par un contrôle d’admission avancé. Cette fonctionnalité améliore la stabilité de cette opération sans sacrifier l’utilisation du cluster.
  • Amélioration des performances des commandes DML sur les tables comportant un grand nombre de colonnes : nous effectuons désormais un meilleur nettoyage des colonnes lors de la recherche de données correspondantes dans les commandes UPDATE, DELETE et MERGE.
  • Prise en charge de la configuration VNet + Points de terminaison de service dans le connecteur Spark – Synapse Analytics : nous avons ajouté les chemins ADL Gen2 à une liste d’autorisation comme emplacements de données temporaires (.option("tempDir", "abfss://...")) et ajouté une nouvelle option appelée useAzureMSI, à utiliser à la place de forward_spark_azure_storage_credentials dans le cas où votre compte Synapse Analytics est configuré pour s’authentifier via Managed Identities à votre compte de stockage v2.
  • Invalidation automatique pour le cache de disque : le cache de disque détecte désormais automatiquement les fichiers qui ont été modifiés ou remplacés après avoir été mis en cache. Toutes les entrées obsolètes sont automatiquement invalidées et supprimées du cache. Consultez Optimisation des performances avec la mise en cache sur Azure Databricks.
  • Mise à niveau de la bibliothèque Python wheel de la version 0.33.3 vers la version 0.33.4.
  • Mise à niveau de la bibliothèque R nlme de la version 3.1-139 vers la version 3.1-140.

Résolution des bogues

  • Correction de l’annulation des commandes R qui n’exécutent pas de travaux Spark. Auparavant, les commandes R qui n’exécutent pas de travaux Spark pouvaient être annulées, mais l’état des notebooks était perdu. Les commandes peuvent maintenant être annulées sans perdre l’état du notebook.
  • La suppression ou le déplacement d’une table managée invalide désormais le journal Delta Lake mis en cache.
  • Correction d’un bogue entraînant l’échec de l’écriture du point de contrôle Delta Lake en raison de l’exception FileAlreadyExistsException.
  • L’interpréteur de commandes REPL Scala définit désormais l’indicateur -target:jvm-1.8 approprié pour prendre en charge l’appel des méthodes Java qui utilisent des fonctionnalités Java 8.

Apache Spark

Databricks Runtime 5.5 comprend Apache Spark 2.4.3. Cette version inclut tous les correctifs et améliorations Spark inclus dans Databricks Runtime 5.4 (non pris en charge), ainsi que les corrections de bogues supplémentaires et les améliorations apportées à Spark qui suivent :

  • [SPARK-24695] Autorise les UDF à renvoyer CalendarInterval
  • [SPARK-28056] Ajout de docstring/doctest pour l’UDF pandas SCALAR_ITER
  • [SPARK-28185] Ferme le générateur lorsque les UDF Python s’arrêtent prématurément
  • [SPARK-24703] Prise en charge de la multiplication d’intervalles
  • [SPARK-27018][CORE] Correction de la suppression incorrecte du fichier de point de contrôle dans PeriodicCheckpointer
  • [SPARK-28127][SQL] Micro-optimisation de la méthode mapChildren de TreeNode
  • [SPARK-26038] Décimal toScalaBigInt/toJavaBigInteger pour les décimales qui ne s’insèrent pas en longueur
  • [SPARK-26555][SQL] Rend la vérification du sous-type ScalaReflection thread-safe
  • [SPARK-28081][ML] Gestion des grands nombres de mots dans word2vec
  • [SPARK-21882][CORE] OutputMetrics ne compte pas correctement les octets écrits dans la fonction saveAsHadoopDataset
  • [SPARK-28030] Convertit filePath en URI dans une source de données de fichiers binaires
  • [SPARK-27803][SQL][PYTHON] Correction du nettoyage des colonnes pour l’UDF Python
  • [SPARK-27917][SQL] La forme canonique de l’objet CaseWhen est incorrecte
  • [SPARK-27798][SQL] from_avro ne doit pas produire la même valeur lorsqu’il est converti en relation locale
  • [SPARK-27873][SQL] columnNameOfCorruptRecord ne doit pas être vérifié avec les noms de colonne dans l’en-tête CSV lors de la désactivation d’enforceSchema
  • [SPARK-27907][SQL] HiveUDAF doit renvoyer la valeur Null si 0 ligne
  • [SPARK-27699][SQL] Pushdown partiel indépendant fondé sur Parquet/ORC
  • [SPARK-27868][CORE] Amélioration de la valeur par défaut et de la documentation pour le backlog du serveur de socket
  • [SPARK-27869][CORE] Suppression des informations sensibles dans les propriétés système de l’interface utilisateur
  • [SPARK-27863][SQL][BACKPORT-2.4] Les fichiers de métadonnées et les fichiers temporaires ne doivent pas être considérés comme des fichiers de données
  • [SPARK-27657][ML] Correction du format de journal de ml.util.Instrumentation.logFai…
  • [SPARK-27858][SQL] Correction de la désérialisation Avro sur les types union avec plusieurs types non Null
  • [SPARK-27711][CORE] Annule InputFileBlockHolder à la fin des tâches
  • [SPARK-27351][SQL] Mauvaise estimation de outputRows après AggregateEstimation avec seulement une colonne de valeurs null
  • [SPARK-27539][SQL] Correction de l’estimation inexacte de l’agrégat outputRows avec une colonne contenant des valeurs Null
  • [SPARK-27800][SQL] Correction d’une réponse erronée dans les cas de test BitwiseXor
  • [SPARK-27639][SQL] InMemoryTableScan affiche le nom de la table sur l’interface utilisateur si possible
  • [SPARK-27726][CORE] Corrige les performances des suppressions de ElementTrackingStore lors de l’utilisation de InMemoryStore sous des charges élevées
  • [SPARK-27771][SQL] Ajout d’une description SQL pour les fonctions de regroupement (cube, rollup, grouping et grouping_id)
  • [SPARK-27735][SS] L’analyse de la chaîne d’intervalle n’a pas l’obligation de respecter la casse dans SS
  • [SPARK-26856][PYSPARK] Prise en charge de Python pour les API from_avro et to_avro
  • [SPARK-26870][SQL] Déplacement de to_avro/from_avro dans l’objet functions pour des raisons de compatibilité Java
  • [SPARK-26812][SQL] Signale une possibilité correcte de valeur Null pour les types de données complexes dans Union
  • [SPARK-27671][SQL] Correction d’une erreur lors du cast d’une valeur Null imbriquée vers un struct
  • [SPARK-27673][SQL] Ajout de l’information since aux expressions random, regex, null
  • [SPARK-27672][SQL] Ajout de l’information since aux expressions string
  • [SPARK-25139][SPARK-18406][CORE] Évitement d’erreurs NonFatals pour tuer l’Exécuteur dans PythonRunner
  • [SPARK-27624][CORE] Correction de CalenderInterval pour afficher correctement un intervalle vide
  • [SPARK-27577][MLLIB] Correction des seuils sous-échantillonnés dans BinaryClassificationMetrics
  • [SPARK-27621][ML] Régression linéaire : valide les paramètres liés à la formation, tels que la perte, uniquement pendant la phase d’ajustement
  • [SPARK-26048][SPARK-24530] Cherry-picking de toutes les validations manquantes vers le script de la version 2.4
  • [SPARK-24935][SQL] Prise en charge de INIT -> UPDATE -> MERGE -> FINISH dans l’adaptateur UDAF de Hive

Mises à jour de maintenance

Voir Mises à jour de maintenance de Databricks Runtime 5.5.

Environnement du système

  • Système d’exploitation : Ubuntu 16.04.6 LTS
  • Java : 1.8.0_252
  • Scala : 2.11.12
  • Python : 2.7.12 pour les clusters Python 2 et 3.5.2 pour les clusters Python 3.
  • R : R version 3.6.0 (2019-04-26)
  • Clusters GPU : Les bibliothèques GPU NVIDIA suivantes sont installées :
    • Pilote Tesla 375.66
    • CUDA 9.0
    • cuDNN 7.0

Notes

Bien que Scala 2.12 soit pris en charge dans Apache Spark 2.4, il ne l’est pas dans Databricks Runtime 5.5.

Dans cette section :

Bibliothèques Python installées

Bibliothèque Version Bibliothèque Version Bibliothèque Version
ansi2html 1.1.1 argparse 1.2.1 backports-abc 0.5
boto 2.42.0 boto3 1.4.1 botocore 1.4.70
brewer2mpl 1.4.1 certifi 2016.2.28 cffi 1.7.0
chardet 2.3.0 colorama 0.3.7 configobj 5.0.6
chiffrement 1.5 cycler 0.10.0 Cython 0.24.1
decorator 4.0.10 docutils 0.14 enum34 1.1.6
et-xmlfile 1.0.1 freetype-py 1.0.2 funcsigs 1.0.2
fusepy 2.0.4 futures 3.2.0 ggplot 0.6.8
html5lib 0.999 idna 2.1 ipaddress 1.0.16
ipython 2.2.0 ipython-genutils 0.1.0 jdcal 1.2
Jinja2 2.8 jmespath 0.9.0 llvmlite 0.13.0
lxml 3.6.4 MarkupSafe 0.23 matplotlib 1.5.3
mpld3 0.2 msgpack-python 0.4.7 ndg-httpsclient 0.3.3
numba 0.28.1 numpy 1.11.1 openpyxl 2.3.2
pandas 0.19.2 pathlib2 2.1.0 patsy 0.4.1
pexpect 4.0.1 pickleshare 0.7.4 Pillow 3.3.1
pip 19.1.1 ply 3.9 prompt-toolkit 1.0.7
psycopg2 2.6.2 ptyprocess 0.5.1 py4j 0.10.3
pyarrow 0.8.0 pyasn1 0.1.9 pycparser 2.14
Pygments 2.1.3 PyGObject 3.20.0 pyOpenSSL 16.0.0
pyparsing 2.2.0 pypng 0.0.18 Python 2.7.12
python-dateutil 2.5.3 python-geohash 0.8.5 pytz 2016.6.1
requêtes 2.11.1 s3transfer 0.1.9 scikit-learn 0.18.1
scipy 0.18.1 scour 0.32 seaborn 0.7.1
setuptools 41.0.1 simplejson 3.8.2 simples3 1.0
singledispatch 3.4.0.3 six 1.10.0 statsmodels 0.6.1
tornado 5.1.1 traitlets 4.3.0 urllib3 1.19.1
virtualenv 16.1.0 wcwidth 0.1.7 wheel 0.33.4
wsgiref 0.1.2

Bibliothèques R installées

Bibliothèque Version Bibliothèque Version Bibliothèque Version
abind 1.4-5 askpass 1.1 assertthat 0.2.1
backports 1.1.3 base 3.6.0 base64enc 0.1-3
BH 1.69.0-1 bit 1.1-14 bit64 0.9-7
bitops 1.0-6 objet BLOB 1.1.1 boot 1.3-20
brew 1.0-6 callr 3.2.0 voiture 3.0-2
carData 3.0-2 caret 6.0-82 cellranger 1.1.0
chron 2.3-53 class 7.3-15 cli 1.1.0
clipr 0.5.0 clisymbols 1.2.0 cluster 2.0.8
codetools 0.2-16 colorspace 1.4-1 commonmark 1.7
compiler 3.6.0 config 0.3 crayon 1.3.4
curl 3.3 data.table 1.12.0 jeux de données 3.6.0
DBI 1.0.0 dbplyr 1.3.0 desc 1.2.0
devtools 2.0.1 digest 0.6.18 doMC 1.3.5
dplyr 0.8.0.1 ellipsis 0.1.0 fansi 0.4.0
forcats 0.4.0 foreach 1.4.4 foreign 0.8-71
forge 0.2.0 fs 1.2.7 gbm 2.1.5
generics 0.0.2 ggplot2 3.1.0 gh 1.0.1
git2r 0.25.2 glmnet 2.0-16 glue 1.3.1
gower 0.2.0 graphics 3.6.0 grDevices 3.6.0
grid 3.6.0 gridExtra 2.3 gsubfn 0.7
gtable 0.3.0 h2o 3.22.1.1 haven 2.1.0
hms 0.4.2 htmltools 0.3.6 htmlwidgets 1.3
httr 1.4.0 hwriter 1.3.2 hwriterPlus 1.0-3
ini 0.3.1 ipred 0.9-8 iterators 1.0.10
jsonlite 1.6 KernSmooth 2.23-15 labeling 0.3
lattice 0.20-38 lava 1.6.5 lazyeval 0.2.2
littler 0.3.7 lme4 1.1-21 lubridate 1.7.4
magrittr 1.5 mapproj 1.2.6 cartes 3.3.0
maptools 0.9-5 MASS 7.3-51.1 Matrice 1.2-17
MatrixModels 0.4-1 memoise 1.1.0 methods 3.6.0
mgcv 1.8-28 mime 0,6 minqa 1.2.4
ModelMetrics 1.2.2 munsell 0.5.0 mvtnorm 1.0-10
nlme 3.1-140 nloptr 1.2.1 nnet 7.3-12
numDeriv 2016.8-1 openssl 1.3 openxlsx 4.1.0
parallel 3.6.0 pbkrtest 0.4-7 pillar 1.3.1
pkgbuild 1.0.3 pkgconfig 2.0.2 pkgKitten 0.1.4
pkgload 1.0.2 plogr 0.2.0 plyr 1.8.4
praise 1.0.0 prettyunits 1.0.2 pROC 1.14.0
processx 3.3.0 prodlim 2018.04.18 progress 1.2.0
proto 1.0.0 ps 1.3.0 purrr 0.3.2
quantreg 5.38 R.methodsS3 1.7.1 R.oo 1.22.0
R.utils 2.8.0 r2d3 0.2.3 R6 2.4.0
randomForest 4.6-14 rappdirs 0.3.1 rcmdcheck 1.3.2
RColorBrewer 1.1-2 Rcpp 1.0.1 RcppEigen 0.3.3.5.0
RcppRoll 0.3.0 RCurl 1.95-4.12 readr 1.3.1
readxl 1.3.1 recipes 0.1.5 rematch 1.0.1
remotes 2.0.2 reshape2 1.4.3 rio 0.5.16
rlang 0.3.3 RODBC 1.3-15 roxygen2 6.1.1
rpart 4.1-15 rprojroot 1.3-2 Rserve 1.8-6
RSQLite 2.1.1 rstudioapi 0.10 scales 1.0.0
sessioninfo 1.1.1 sp 1.3-1 sparklyr 1.0.0
SparkR 2.4.4 SparseM 1.77 spatial 7.3-11
splines 3.6.0 sqldf 0.4-11 SQUAREM 2017.10-1
statmod 1.4.30 stats 3.6.0 stats4 3.6.0
stringi 1.4.3 stringr 1.4.0 survival 2.43-3
sys 3.1 tcltk 3.6.0 TeachingDemos 2,10
testthat 2.0.1 tibble 2.1.1 tidyr 0.8.3
tidyselect 0.2.5 timeDate 3043.102 tools 3.6.0
usethis 1.4.0 utf8 1.1.4 utils 3.6.0
viridisLite 0.3.0 whisker 0.3-2 withr 2.1.2
xml2 1.2.0 xopen 1.0.0 yaml 2.2.0
zip 2.0.1

Bibliothèques Java et Scala installées (version de cluster Scala 2.11)

ID de groupe ID d’artefact Version
antlr antlr 2.7.7
com.amazonaws amazon-kinesis-client 1.8.10
com.amazonaws aws-java-sdk-autoscaling 1.11.313
com.amazonaws aws-java-sdk-cloudformation 1.11.313
com.amazonaws aws-java-sdk-cloudfront 1.11.313
com.amazonaws aws-java-sdk-cloudhsm 1.11.313
com.amazonaws aws-java-sdk-cloudsearch 1.11.313
com.amazonaws aws-java-sdk-cloudtrail 1.11.313
com.amazonaws aws-java-sdk-cloudwatch 1.11.313
com.amazonaws aws-java-sdk-cloudwatchmetrics 1.11.313
com.amazonaws aws-java-sdk-codedeploy 1.11.313
com.amazonaws aws-java-sdk-cognitoidentity 1.11.313
com.amazonaws aws-java-sdk-cognitosync 1.11.313
com.amazonaws aws-java-sdk-config 1.11.313
com.amazonaws aws-java-sdk-core 1.11.313
com.amazonaws aws-java-sdk-datapipeline 1.11.313
com.amazonaws aws-java-sdk-directconnect 1.11.313
com.amazonaws aws-java-sdk-directory 1.11.313
com.amazonaws aws-java-sdk-dynamodb 1.11.313
com.amazonaws aws-java-sdk-ec2 1.11.313
com.amazonaws aws-java-sdk-ecs 1.11.313
com.amazonaws aws-java-sdk-efs 1.11.313
com.amazonaws aws-java-sdk-elasticache 1.11.313
com.amazonaws aws-java-sdk-elasticbeanstalk 1.11.313
com.amazonaws aws-java-sdk-elasticloadbalancing 1.11.313
com.amazonaws aws-java-sdk-elastictranscoder 1.11.313
com.amazonaws aws-java-sdk-emr 1.11.313
com.amazonaws aws-java-sdk-glacier 1.11.313
com.amazonaws aws-java-sdk-glue 1.11.313
com.amazonaws aws-java-sdk-iam 1.11.313
com.amazonaws aws-java-sdk-importexport 1.11.313
com.amazonaws aws-java-sdk-kinesis 1.11.313
com.amazonaws aws-java-sdk-kms 1.11.313
com.amazonaws aws-java-sdk-lambda 1.11.313
com.amazonaws aws-java-sdk-logs 1.11.313
com.amazonaws aws-java-sdk-machinelearning 1.11.313
com.amazonaws aws-java-sdk-opsworks 1.11.313
com.amazonaws aws-java-sdk-rds 1.11.313
com.amazonaws aws-java-sdk-redshift 1.11.313
com.amazonaws aws-java-sdk-route53 1.11.313
com.amazonaws aws-java-sdk-s3 1.11.313
com.amazonaws aws-java-sdk-ses 1.11.313
com.amazonaws aws-java-sdk-simpledb 1.11.313
com.amazonaws aws-java-sdk-simpleworkflow 1.11.313
com.amazonaws aws-java-sdk-sns 1.11.313
com.amazonaws aws-java-sdk-sqs 1.11.313
com.amazonaws aws-java-sdk-ssm 1.11.313
com.amazonaws aws-java-sdk-storagegateway 1.11.313
com.amazonaws aws-java-sdk-sts 1.11.313
com.amazonaws aws-java-sdk-support 1.11.313
com.amazonaws aws-java-sdk-swf-libraries 1.11.22
com.amazonaws aws-java-sdk-workspaces 1.11.313
com.amazonaws jmespath-java 1.11.313
com.carrotsearch hppc 0.7.2
com.chuusai shapeless_2.11 2.3.2
com.clearspring.analytics flux 2.7.0
com.databricks Rserve 1.8-3
com.databricks dbml-local_2.11 0.5.0-db8-spark2.4
com.databricks dbml-local_2.11-tests 0.5.0-db8-spark2.4
com.databricks jets3t 0.7.1-0
com.databricks.scalapb compilerplugin_2.11 0.4.15-9
com.databricks.scalapb scalapb-runtime_2.11 0.4.15-9
com.esotericsoftware kryo-shaded 4.0.2
com.esotericsoftware minlog 1.3.0
com.fasterxml classmate 1.0.0
com.fasterxml.jackson.core jackson-annotations 2.6.7
com.fasterxml.jackson.core jackson-core 2.6.7
com.fasterxml.jackson.core jackson-databind 2.6.7.1
com.fasterxml.jackson.dataformat jackson-dataformat-cbor 2.6.7
com.fasterxml.jackson.datatype jackson-datatype-joda 2.6.7
com.fasterxml.jackson.module jackson-module-paranamer 2.6.7
com.fasterxml.jackson.module jackson-module-scala_2.11 2.6.7.1
com.github.fommil jniloader 1.1
com.github.fommil.netlib core 1.1.2
com.github.fommil.netlib native_ref-java 1.1
com.github.fommil.netlib native_ref-java-natives 1.1
com.github.fommil.netlib native_system-java 1.1
com.github.fommil.netlib native_system-java-natives 1.1
com.github.fommil.netlib netlib-native_ref-linux-x86_64-natives 1.1
com.github.fommil.netlib netlib-native_system-linux-x86_64-natives 1.1
com.github.luben zstd-jni 1.3.2-2
com.github.rwl jtransforms 2.4.0
com.google.code.findbugs jsr305 2.0.1
com.google.code.gson gson 2.2.4
com.google.guava guava 15.0
com.google.protobuf protobuf-java 2.6.1
com.googlecode.javaewah JavaEWAH 0.3.2
com.h2database h2 1.3.174
com.jcraft jsch 0.1.50
com.jolbox bonecp 0.8.0.RELEASE
com.microsoft.azure azure-data-lake-store-sdk 2.2.8
com.microsoft.azure azure-storage 5.2.0
com.microsoft.sqlserver mssql-jdbc 6.2.2.jre8
com.ning compress-lzf 1.0.3
com.sun.mail javax.mail 1.5.2
com.thoughtworks.paranamer paranamer 2.8
com.trueaccord.lenses lenses_2.11 0.3
com.twitter chill-java 0.9.3
com.twitter chill_2.11 0.9.3
com.twitter parquet-hadoop-bundle 1.6.0
com.twitter util-app_2.11 6.23.0
com.twitter util-core_2.11 6.23.0
com.twitter util-jvm_2.11 6.23.0
com.typesafe config 1.2.1
com.typesafe.scala-logging scala-logging-api_2.11 2.1.2
com.typesafe.scala-logging scala-logging-slf4j_2.11 2.1.2
com.univocity univocity-parsers 2.7.3
com.vlkan flatbuffers 1.2.0-3f79e055
com.zaxxer HikariCP 3.1.0
commons-beanutils commons-beanutils 1.9.3
commons-cli commons-cli 1.2
commons-codec commons-codec 1,10
commons-collections commons-collections 3.2.2
commons-configuration commons-configuration 1.6
commons-dbcp commons-dbcp 1.4
commons-digester commons-digester 1.8
commons-httpclient commons-httpclient 3.1
commons-io commons-io 2.4
commons-lang commons-lang 2.6
commons-logging commons-logging 1.1.3
commons-net commons-net 3.1
commons-pool commons-pool 1.5.4
info.ganglia.gmetric4j gmetric4j 1.0.7
io.airlift aircompressor 0.10
io.dropwizard.metrics metrics-core 3.1.5
io.dropwizard.metrics metrics-ganglia 3.1.5
io.dropwizard.metrics metrics-graphite 3.1.5
io.dropwizard.metrics metrics-healthchecks 3.1.5
io.dropwizard.metrics metrics-jetty9 3.1.5
io.dropwizard.metrics metrics-json 3.1.5
io.dropwizard.metrics metrics-jvm 3.1.5
io.dropwizard.metrics metrics-log4j 3.1.5
io.dropwizard.metrics metrics-servlets 3.1.5
io.netty netty 3.9.9.Final
io.netty netty-all 4.1.17.Final
javax.activation activation 1.1.1
javax.annotation javax.annotation-api 1.2
javax.el javax.el-api 2.2.4
javax.jdo jdo-api 3.0.1
javax.servlet javax.servlet-api 3.1.0
javax.servlet.jsp jsp-api 2.1
javax.transaction jta 1.1
javax.validation validation-api 1.1.0.Final
javax.ws.rs javax.ws.rs-api 2.0.1
javax.xml.bind jaxb-api 2.2.2
javax.xml.stream stax-api 1.0-2
javolution javolution 5.5.1
jline jline 2.14.6
joda-time joda-time 2.9.3
log4j apache-log4j-extras 1.2.17
log4j log4j 1.2.17
maven-trees hive-exec-with-glue hive-12679-patch_deploy
maven-trees hive-exec-with-glue hive-exec_shaded
net.hydromatic eigenbase-properties 1.1.5
net.razorvine pyrolite 4.13
net.sf.jpam jpam 1.1
net.sf.opencsv opencsv 2.3
net.sf.supercsv super-csv 2.2.0
net.snowflake snowflake-ingest-sdk 0.9.5
net.snowflake snowflake-jdbc 3.6.15
net.snowflake spark-snowflake_2.11 2.4.10-spark_2.4
net.sourceforge.f2j arpack_combined_all 0.1
org.acplt oncrpc 1.0.7
org.antlr ST4 4.0.4
org.antlr antlr-runtime 3.4
org.antlr antlr4-runtime 4,7
org.antlr stringtemplate 3.2.1
org.apache.ant ant 1.9.2
org.apache.ant ant-jsch 1.9.2
org.apache.ant ant-launcher 1.9.2
org.apache.arrow arrow-format 0.10.0
org.apache.arrow arrow-memory 0.10.0
org.apache.arrow arrow-vector 0.10.0
org.apache.avro avro 1.8.2
org.apache.avro avro-ipc 1.8.2
org.apache.avro avro-mapred-hadoop2 1.8.2
org.apache.calcite calcite-avatica 1.2.0-incubating
org.apache.calcite calcite-core 1.2.0-incubating
org.apache.calcite calcite-linq4j 1.2.0-incubating
org.apache.commons commons-compress 1.8.1
org.apache.commons commons-crypto 1.0.0
org.apache.commons commons-lang3 3,5
org.apache.commons commons-math3 3.4.1
org.apache.curator curator-client 2.7.1
org.apache.curator curator-framework 2.7.1
org.apache.curator curator-recipes 2.7.1
org.apache.derby derby 10.12.1.1
org.apache.directory.api api-asn1-api 1.0.0-M20
org.apache.directory.api api-util 1.0.0-M20
org.apache.directory.server apacheds-i18n 2.0.0-M15
org.apache.directory.server apacheds-kerberos-codec 2.0.0-M15
org.apache.hadoop hadoop-annotations 2.7.3
org.apache.hadoop hadoop-auth 2.7.3
org.apache.hadoop hadoop-client 2.7.3
org.apache.hadoop hadoop-common 2.7.3
org.apache.hadoop hadoop-hdfs 2.7.3
org.apache.hadoop hadoop-mapreduce-client-app 2.7.3
org.apache.hadoop hadoop-mapreduce-client-common 2.7.3
org.apache.hadoop hadoop-mapreduce-client-core 2.7.3
org.apache.hadoop hadoop-mapreduce-client-jobclient 2.7.3
org.apache.hadoop hadoop-mapreduce-client-shuffle 2.7.3
org.apache.hadoop hadoop-yarn-api 2.7.3
org.apache.hadoop hadoop-yarn-client 2.7.3
org.apache.hadoop hadoop-yarn-common 2.7.3
org.apache.hadoop hadoop-yarn-server-common 2.7.3
org.apache.htrace htrace-core 3.1.0-incubating
org.apache.httpcomponents httpclient 4.5.4
org.apache.httpcomponents httpcore 4.4.8
org.apache.ivy ivy 2.4.0
org.apache.orc orc-core-nohive 1.5.2
org.apache.orc orc-mapreduce-nohive 1.5.2
org.apache.orc orc-shims 1.5.2
org.apache.parquet parquet-column 1.10.1.1-databricks3
org.apache.parquet parquet-common 1.10.1.1-databricks3
org.apache.parquet parquet-encoding 1.10.1.1-databricks3
org.apache.parquet parquet-format 2.4.0
org.apache.parquet parquet-hadoop 1.10.1.1-databricks3
org.apache.parquet parquet-jackson 1.10.1.1-databricks3
org.apache.thrift libfb303 0.9.3
org.apache.thrift libthrift 0.9.3
org.apache.xbean xbean-asm6-shaded 4.8
org.apache.zookeeper zookeeper 3.4.6
org.codehaus.jackson jackson-core-asl 1.9.13
org.codehaus.jackson jackson-jaxrs 1.9.13
org.codehaus.jackson jackson-mapper-asl 1.9.13
org.codehaus.jackson jackson-xc 1.9.13
org.codehaus.janino commons-compiler 3.0.10
org.codehaus.janino janino 3.0.10
org.datanucleus datanucleus-api-jdo 3.2.6
org.datanucleus datanucleus-core 3.2.10
org.datanucleus datanucleus-rdbms 3.2.9
org.eclipse.jetty jetty-client 9.3.20.v20170531
org.eclipse.jetty jetty-continuation 9.3.20.v20170531
org.eclipse.jetty jetty-http 9.3.20.v20170531
org.eclipse.jetty jetty-io 9.3.20.v20170531
org.eclipse.jetty jetty-jndi 9.3.20.v20170531
org.eclipse.jetty jetty-plus 9.3.20.v20170531
org.eclipse.jetty jetty-proxy 9.3.20.v20170531
org.eclipse.jetty jetty-security 9.3.20.v20170531
org.eclipse.jetty jetty-server 9.3.20.v20170531
org.eclipse.jetty jetty-servlet 9.3.20.v20170531
org.eclipse.jetty jetty-servlets 9.3.20.v20170531
org.eclipse.jetty jetty-util 9.3.20.v20170531
org.eclipse.jetty jetty-webapp 9.3.20.v20170531
org.eclipse.jetty jetty-xml 9.3.20.v20170531
org.fusesource.leveldbjni leveldbjni-all 1.8
org.glassfish.hk2 hk2-api 2.4.0-b34
org.glassfish.hk2 hk2-locator 2.4.0-b34
org.glassfish.hk2 hk2-utils 2.4.0-b34
org.glassfish.hk2 osgi-resource-locator 1.0.1
org.glassfish.hk2.external aopalliance-repackaged 2.4.0-b34
org.glassfish.hk2.external javax.inject 2.4.0-b34
org.glassfish.jersey.bundles.repackaged jersey-guava 2.22.2
org.glassfish.jersey.containers jersey-container-servlet 2.22.2
org.glassfish.jersey.containers jersey-container-servlet-core 2.22.2
org.glassfish.jersey.core jersey-client 2.22.2
org.glassfish.jersey.core jersey-common 2.22.2
org.glassfish.jersey.core jersey-server 2.22.2
org.glassfish.jersey.media jersey-media-jaxb 2.22.2
org.hibernate hibernate-validator 5.1.1.Final
org.iq80.snappy snappy 0.2
org.javassist javassist 3.18.1-GA
org.jboss.logging jboss-logging 3.1.3.GA
org.jdbi jdbi 2.63.1
org.joda joda-convert 1.7
org.jodd jodd-core 3.5.2
org.json4s json4s-ast_2.11 3.5.3
org.json4s json4s-core_2.11 3.5.3
org.json4s json4s-jackson_2.11 3.5.3
org.json4s json4s-scalap_2.11 3.5.3
org.lz4 lz4-java 1.4.0
org.mariadb.jdbc mariadb-java-client 2.1.2
org.mockito mockito-all 1.9.5
org.objenesis objenesis 2.5.1
org.postgresql postgresql 42.1.4
org.roaringbitmap RoaringBitmap 0.7.45
org.roaringbitmap shims 0.7.45
org.rocksdb rocksdbjni 5.2.1
org.rosuda.REngine REngine 2.1.0
org.scala-lang scala-compiler_2.11 2.11.12
org.scala-lang scala-library_2.11 2.11.12
org.scala-lang scala-reflect_2.11 2.11.12
org.scala-lang.modules scala-parser-combinators_2.11 1.1.0
org.scala-lang.modules scala-xml_2.11 1.0.5
org.scala-sbt test-interface 1.0
org.scalacheck scalacheck_2.11 1.12.5
org.scalactic scalactic_2.11 3.0.3
org.scalanlp breeze-macros_2.11 0.13.2
org.scalanlp breeze_2.11 0.13.2
org.scalatest scalatest_2.11 3.0.3
org.slf4j jcl-over-slf4j 1.7.16
org.slf4j jul-to-slf4j 1.7.16
org.slf4j slf4j-api 1.7.16
org.slf4j slf4j-log4j12 1.7.16
org.spark-project.hive hive-beeline 1.2.1.spark2
org.spark-project.hive hive-cli 1.2.1.spark2
org.spark-project.hive hive-jdbc 1.2.1.spark2
org.spark-project.hive hive-metastore 1.2.1.spark2
org.spark-project.spark unused 1.0.0
org.spire-math spire-macros_2.11 0.13.0
org.spire-math spire_2.11 0.13.0
org.springframework spring-core 4.1.4.RELEASE
org.springframework spring-test 4.1.4.RELEASE
org.tukaani xz 1.5
org.typelevel machinist_2.11 0.6.1
org.typelevel macro-compat_2.11 1.1.1
org.xerial sqlite-jdbc 3.8.11.2
org.xerial.snappy snappy-java 1.1.7.3
org.yaml snakeyaml 1.16
oro oro 2.0.8
software.amazon.ion ion-java 1.0.2
stax stax-api 1.0.1
xmlenc xmlenc 0.52