Novembro de 2020

Esses recursos e as melhorias da plataforma Azure Databricks foram lançados em novembro de 2020.

Observação

As versões são disponibilizadas em fases. Talvez sua conta do Azure Databricks só seja atualizada uma semana após a data de lançamento inicial.

Término do suporte da série 6.6 do Databricks Runtime

26 de novembro de 2020

O suporte para o Databricks Runtime 6.6, o Databricks Runtime 6.6 para Machine Learning e o Databricks Runtime 6.6 para Genomics terminou em 26 de junho. Confira Ciclos de vida de suporte do Databricks Runtime.

GA do Registro de modelos do MLflow

18 de novembro a 1 de dezembro de 2020: versão 3.33

O Registro de Modelo MLflow agora é GA. Várias melhorias foram feitas desde que o Registro de Modelo foi lançado para Visualização Pública:

  • Log de diagnóstico das ações em objetos de registro de modelo. As ações no Registro de Modelo agora são capturadas em logs de diagnóstico. Consulte a entrada modelRegistry na referência do log de auditoria para obter as ações e os parâmetros registrados.
  • Comentários das versões de modelo. Agora você pode adicionar comentários às versões de modelo. Assim, poderá usar o Registro de Modelo em discussões de equipe para ajudar a gerenciar seu pipeline de produção de modelo.
  • Marcas nos modelos e versões de modelo. Você pode criar marcas para modelos e versões de modelo e pesquisá-las usando a API.
  • Melhorias na URL da página de modelos registrados. A URL dessa página agora mantém seu histórico, para que você possa usar os botões voltar e avançar do navegador ao fazer consultas e exibir modelos da página. Você também pode compartilhar a URL com colegas que verão a mesma exibição.

O experimento de filtro é executado com base no fato de um modelo registrado estar associado

18 de novembro a 1 de dezembro de 2020: versão 3.33

Ao exibir as execuções de um experimento, agora você pode filtrá-las com base em se elas criaram uma versão de modelo ou não. Para saber mais, confira Filtrar execuções.

18 de novembro a 1 de dezembro de 2020: versão 3.33

A galeria Integrações de Parceiros foi movida do menu Conta para a guia Adicionar Dados. Para saber mais, confira Parceiros de tecnologia.

As políticas de cluster agora usam lista de permissões e lista de bloqueios como nomes de tipo da política

18 de novembro a 1 de dezembro de 2020: versão 3.33

As políticas de cluster agora usam "lista de permitidos" e "lista de bloqueados" como tipos de política, substituindo "whitelist" e "blacklist". Confira Referência de política de computação. Observe que isso foi originalmente anunciado como um recurso da versão 3.31, que estava incorreto.

Novas tentativas automáticas em caso de falha na criação de um cluster de trabalho

Importante

Essa atualização foi revertida após o lançamento da versão 3.33.

18 de novembro a 1 de dezembro de 2020: versão 3.33

O Azure Databricks agora repete automaticamente a criação de clusters de trabalho quando ocorrem erros recuperáveis específicos. As execuções de trabalho permanecem em RunLifeCycleState: PENDING até a realização do lançamento do cluster. Cada tentativa tem cluster_id e nome diferentes. Quando a criação do cluster é realizada, a execução faz a transição para RunLifeCycleState: RUNNING.

18 de novembro a 1 de dezembro de 2020: versão 3.33

Agora, você pode exibir um sumário dos seus notebooks e usá-lo para navegar rapidamente em um notebook. O sumário do notebook é criado automaticamente com base nos títulos de Markdown. Para saber mais, confira Sumário do notebook.

Databricks SQL (versão prévia pública)

18 de novembro de 2020

O Databricks tem o prazer de apresentar o Databricks SQL, um ambiente intuitivo para execução de consultas ad hoc e criação de painéis com base nos dados armazenados em data lakes. Com o Databricks SQL, sua organização opera uma arquitetura de lakehouse de várias nuvens que fornece um desempenho de data warehouse com a economia do data lake, proporcionando uma agradável experiência de usuário na análise de SQL. Databricks SQL:

  • Integra-se às ferramentas de BI que você usa hoje, como o Tableau e o Microsoft Power BI, para consultar os dados mais completos e recentes no seu data lake.
  • Complementa as ferramentas de BI existentes com uma interface nativa do SQL que permite a analistas de dados e cientistas de dados consultar os dados do data lake diretamente no Azure Databricks.
  • Permite compartilhar insights da consulta por meio de visualizações sofisticadas e painéis do tipo "arrastar e soltar" com alertas automáticos para alterações de dados importantes.
  • Usa Criar um SQL warehouse para trazer confiabilidade, qualidade, escala, segurança e desempenho para o data lake, para que você possa executar cargas de trabalho de análise tradicionais usando seus dados mais recentes e completos.

Confira O que é o armazenamento de dados no Azure Databricks? para mais detalhes.

Clusters de nó único agora dão suporte a serviços de contêiner do Databricks

4 a 10 de novembro de 2020: versão 3.32

Agora você pode usar os Serviços de Contêiner do Databricks em clusters de nó único. Para obter mais informações, consulte Computação de nó único ou de vários nós e Personalizar contêineres com o Serviço de Contêiner do Databricks.

GA do Databricks Runtime 7.4

3 de novembro de 2020

O Databricks Runtime 7.4, o Databricks Runtime 7.4 para ML e o Databricks Runtime 7.4 para Genomics já estão disponíveis para o público geral.

Para obter informações, consulte as notas sobre a versão completas em Databricks Runtime 7.4 (sem suporte) e Databricks Runtime 7.4 para ML (sem suporte).

Atualização do driver JDBC do Databricks

3 de novembro de 2020

Uma nova versão do Driver JDBC do Databricks foi lançada. A nova versão contém várias correções de bug. A principal é que o driver agora retorna o número correto de linhas modificadas nas operações DML quando fornecido pelo Databricks Runtime.

Databricks Connect 7.3 (Beta)

3 de novembro de 2020

O Databricks Connect 7.3 já está disponível como versão beta.

O Databricks Connect 7.3 permite que usar tokens do Microsoft Entra ID para autenticar no Azure Databricks e dá suporte à passagem de credencial do Microsoft Entra ID. Isso possibilita autenticar-se automaticamente no Azure Data Lake Storage Gen1 e no Azure Data Lake Storage Gen2 por meio do Databricks Connect com a mesma identidade do Microsoft Entra ID usada para a autenticação no Azure Databricks.

Para obter mais informações, confira Databricks Connect e Notas sobre a versão do Databricks Connect.