Febrero de 2020

Estas características y mejoras de la plataforma de Azure Databricks se publicaron en febrero de 2020.

Nota:

Las versiones se publican por fases. Es posible que su cuenta de Azure Databricks no se actualice hasta una semana después de la fecha de lanzamiento inicial.

Disponibilidad general de Databricks Runtime 6.4 para Genomics

26 de febrero de 2020

Databricks Runtime 6.4 for Genomics se basa en Databricks Runtime 6.4. Incluye muchas mejoras y actualizaciones de Databricks Runtime 6.3 for Genomics.

Las características clave son las siguientes:

  • Ahora puede personalizar los usuarios de canalizaciones DNASeq de manera selectiva para desactivar cualquier combinación legítima de las fases de alineación de lectura, llamada a variantes y anotación de variantes. Los usuarios también pueden realizar la alineación de lectura de un solo extremo.
  • La versión de Glow incluida en Databricks Runtime 6.4 for Genomics ahora proporciona las API de Python y Scala para las funciones expuestas anteriormente solo a través de expresiones SQL. Estas funciones están disponibles para las operaciones de DataFrame, lo que proporciona una seguridad mejorada en tiempo de compilación.

Disponibilidad general de Databricks Runtime 6.4 ML

26 de febrero de 2020

Databricks Runtime 6.4 ML GA ofrece actualizaciones de bibliotecas, entre las que se incluyen:

  • PyTorch: de 1.3.1 a 1.4.0
  • Horovod: de 0.18.2 a 1.19.0

Para más información, consulte las notas completas de la versión de Databricks Runtime 6.4 for ML (sin soporte técnico).

Disponibilidad general de Databricks Runtime 6.4

26 de febrero de 2020

Databricks Runtime 6.4 GA ofrece nuevas características, mejoras y muchas correcciones de errores.

  • Procesamiento incremental de nuevos archivos de datos con Auto Loader (versión preliminar pública). Auto Loader proporciona una manera más eficaz de procesar nuevos archivos de datos de forma incremental a medida que llegan a un almacén de blobs en la nube durante ETL. Se trata de una mejora con respecto a Structured Streaming basado en archivos, que identifica los nuevos archivos enumerando repetidamente el directorio en la nube y haciendo un seguimiento de los archivos que se han visto, y puede ser muy ineficaz a medida que crece el directorio.
  • Carga de datos en Delta Lake con reintentos idempotentes (versión preliminar pública). El comando SQL COPY INTO permite cargar datos en Delta Lake con reintentos idempotentes (versión preliminar pública). Para cargar datos en Delta Lake hoy en día, debe usar las API de DataFrame de Apache Spark. Si hay errores durante las cargas, debe controlarlos de forma eficaz.
  • Las métricas de operación para todas las escrituras, actualizaciones y eliminaciones de una tabla Delta ahora se muestran en el historial de tablas.
  • Habilitación predeterminada de figuras de Matplotlib insertadas en cuadernos de Azure Databricks (versión preliminar pública).

Para obtener más información, consulte las notas completas de la versión de Databricks Runtime 6.4 (sin soporte técnico).

Los nuevos gráficos interactivos ofrecen gran cantidad de interacciones del lado cliente

Del 25 de febrero al 3 de marzo de 2019: versión 3.14

En esta versión se presentan dos nuevos tipos de gráficos interactivos que reemplazan las implementaciones del gráfico de barras y del gráfico de líneas. Además de la funcionalidad de gráficos existente, el gráfico de líneas tiene algunas nuevas opciones de trazado personalizadas: establecer un intervalo del eje Y, mostrar u ocultar marcadores, y aplicar la escala del registro al eje Y. Ambos gráficos tienen una barra de herramientas integrada que admite un amplio conjunto de interacciones del lado cliente.

Barra de herramientas del gráfico

Si desea usar las implementaciones de gráfico existentes, puede seleccionarlas en el menú desplegable Legacy Charts (Gráficos heredados). Los gráficos existentes seguirán usando las implementaciones disponibles anteriormente.

Tipos de gráficos heredados

La nueva red de ingesta de datos agrega integraciones de asociados en Delta Lake (vista previa pública)

24 de febrero de 2020

Ahora puede rellenar fácilmente su "casa del lago" —el lago de datos con los tipos de estructuras de datos y las características de administración de datos que normalmente obtiene con un almacenamiento de datos— desde cientos de orígenes de datos en Delta Lake. En el centro de esta red se encuentra la nueva galería Partner Integrations (Integraciones de asociados), accesible desde el área de trabajo, y que brinda acceso a una enorme red de orígenes de datos a través de nuestros asociados: Fivetran, Qlik, Infoworks, StreamSets y Syncsort.

Portal de integraciones de asociados

Para obtener información general, consulte nuestro blog. Para más información, consulta Asociados tecnológicos.

El creador de áreas de trabajo se ha agregado automáticamente como administrador de Azure Databricks

24 de febrero de 2020

Antes del 24 de febrero de 2020, el usuario que creaba un área de trabajo de Azure Databricks solo se agregaba como usuario administrador del área de trabajo si también hacía clic en el botón Iniciar área de trabajo en Azure Portal, o si un usuario que ya era usuario administrador del área de trabajo (cualquier Colaborador de Azure de la suscripción que hacía clic en el botón Iniciar área de trabajo se creaba como usuario administrador en el área de trabajo) lo agregaba como administrador. Ahora, el usuario que crea el área de trabajo se agregará automáticamente como administrador del área de trabajo.

Para obtener más información sobre cómo crear e iniciar áreas de trabajo, consulte Administración de la suscripción.

Ya están disponibles las marcas para administrar las características de seguridad y de los cuadernos del área de trabajo

Del 4 al 11 de febrero de 2020: versión 3.12

Esta versión presenta nuevas marcas para administrar los encabezados de seguridad que se envían para evitar ataques en el área de trabajo, así como el acceso a las descargas de resultados de cuadernos y el control de versiones de GIT. Todas estas opciones administrativas están habilitadas de manera predeterminada.