Janeiro de 2020

Esses recursos e melhorias na plataforma Azure Databricks foram lançados em janeiro de 2020.

Nota

Os lançamentos são encenados. Sua conta do Azure Databricks pode não ser atualizada até uma semana após a data de lançamento inicial.

Este mês viu o lançamento das versões 3.9 e 3.11 da plataforma Azure Databricks. Não houve lançamento das versões 3.10 ou 3.8. A versão 3.7 foi uma versão somente de estabilidade e correção de bugs.

Brevemente: propagação das etiquetas de área de trabalho, conjunto e cluster para os detalhes de utilização da DBU e para as VMs do Azure para melhorar o reporte da gestão de custos

Em 10 de fevereiro, lançaremos a propagação de tags para detalhes de uso do Azure Databricks e VMs do Azure. O novo recurso de propagação de tags combina marcas de espaço de trabalho do Azure Databricks (ou seja, tags de grupo de recursos), tags de pool e tags de cluster e as propaga para os detalhes de uso do Databricks DBU e VMs do Azure como tags de recurso. Você poderá ver as informações de tag combinadas no portal do Azure Cost Management e nas exportações de detalhes de uso, oferecendo melhor visibilidade sobre o uso do Azure Databricks (custo total de propriedade) e atribuição precisa a unidades de negócios e equipes.

Agora, o Azure Databricks e o Azure Lighthouse podem residir na mesma subscrição

29 de janeiro de 2020

Todos os espaços de trabalho existentes do Azure Databricks migraram do uso de Bloqueios Gerenciados para Negar Atribuições. Todos os novos espaços de trabalho criados terão Negar Atribuições. Isso não altera nenhum comportamento existente e o nível de segurança permanece o mesmo. Embora você possa integrar assinaturas que usam o Azure Databricks, os usuários no locatário de gerenciamento não podem iniciar espaços de trabalho do Azure Databricks em uma assinatura delegada no momento.

Disponibilidade Geral do Databricks Runtime 6.3 para o Genomics

22 de janeiro de 2020

O Databricks Runtime 6.3 for Genomics foi criado com base no Databricks Runtime 6.3. Ele inclui muitas melhorias e atualizações do Databricks Runtime 6.2 for Genomics.

As principais características são:

  • Suporte para tabelas Delta como entrada para o pipeline de genotipagem conjunta
  • Análise automática de anotações ao ler VCFs
  • Divisor de variantes multialélico melhorado
  • Funções de regressão linear e logística mais rápidas

Disponibilidade Geral do Databricks Runtime 6.3 ML

22 de janeiro de 2020

O Databricks Runtime 6.3 ML GA traz muitas atualizações de biblioteca, incluindo:

  • PyTorch: 1.3.0 a 1.3.1
  • Torchvision: 0.4.1 a 0.4.2
  • MLflow: 1.4.0 a 1.5.0
  • Hiperoptia: 0.2.1 a 0.2.2

Para obter detalhes, consulte as notas de versão completas do Databricks Runtime 6.3 for ML (sem suporte).

Disponibilidade Geral do Databricks Runtime 6.3

22 de janeiro de 2020

O Databricks Runtime 6.3 GA traz novos recursos, melhorias e muitas correções de bugs.

Esta versão introduz uma simultaneidade melhorada. As principais características são:

  • Simultaneidade melhorada para todas as operações do Delta Lake
  • Suporte melhorado para compactação de ficheiros
  • Desempenho aprimorado para mesclagem somente inserção

Para obter detalhes, consulte as notas de versão completas do Databricks Runtime 6.3 (sem suporte).

Cache de disco ativado por padrão

7 a 14 de janeiro de 2020: Versão 3.9

O cache de disco agora está habilitado por padrão em instâncias da série Lsv2 para todas as versões suportadas do Databricks Runtime. Consulte Selecionando tipos de instância para usar o cache de disco.

O passo de dimensionamento automático padrão dos clusters é agora configurável

7 a 14 de janeiro de 2020: Versão 3.9

Por padrão, a primeira etapa do dimensionamento automático padrão adiciona 8 nós. Agora você pode definir o valor da etapa na configuração do cluster Spark. Consulte Referência de configuração de computação.

A API de SCIM suporta a paginação para Get Users e Get Groups (Pré-visualização Pública)

7 a 14 de janeiro de 2020: Versão 3.9

A API SCIM agora suporta paginação para Obter Usuários e Obter Grupos. Quando você especificar os parâmetros e count consultar, o startIndex SCIM retornará um subconjunto de usuários/grupos. O startIndex parâmetro é o índice baseado em 1 do primeiro resultado. O count parâmetro é o número máximo de usuários ou grupos a serem retornados. Isso garante escalabilidade para o Cliente SCIM e simplifica as chamadas SCIM para administradores do Azure Databricks. Consulte API de grupos.

A largura da pista de diagrama do explorador de ficheiros foi aumentada para 240px

7 a 14 de janeiro de 2020: Versão 3.9

O aumento da largura reduz a necessidade de passar o mouse sobre os objetos para ver o nome do arquivo completo.

Fim do suporte para o Databricks Runtime 3.5 LTS

2 de janeiro de 2020

O suporte para Databricks Runtime 3.5 LTS (Long Term Support) terminou em 2 de janeiro. Consulte Ciclos de vida de suporte ao tempo de execução do Databricks.