Julho de 2020

Artigo
03/22/2024

Esses recursos e aprimoramentos da plataforma Azure Databricks foram lançados em julho de 2020.

Observação

As versões são disponibilizadas em fases. Talvez sua conta do Azure Databricks só seja atualizada uma semana após a data de lançamento inicial.

Terminal da Web (Versão Prévia Pública)

29 de julho – 4 de agosto de 2020: versão 3.25

O terminal da Web oferece uma maneira conveniente e altamente interativa para que os usuários com as permissão PODE ANEXAR AO em um cluster executem comandos do shell, incluindo editores como Vim ou Emacs. Alguns exemplos de uso do terminal da Web são o monitoramento do uso de recursos e a instalação de pacotes do Linux.

Para obter detalhes, consulte Terminal da Web.

Nova estrutura de script de inicialização global mais segura (Versão Prévia Pública)

29 de julho a 4 de agosto de 2020: Versão 3.25

A nova estrutura de scripts de inicialização global traz melhorias significativas em relação aos scripts de inicialização global herdados:

Os scripts de inicialização são mais seguros, exigindo permissões de administrador para criar, exibir e excluir.
As falhas de inicialização relacionadas ao script são registradas em log.
Você pode definir a ordem de execução de vários scripts de inicialização.
Os scripts de inicialização podem referenciar variáveis de ambiente relacionadas ao cluster.
Os scripts de inicialização podem ser criados e gerenciados usando a página de configurações do administrador ou a nova API REST de Scripts de Inicialização Global.

O Databricks recomenda migrar os scripts de inicialização global herdados existentes para a nova estrutura a fim de aproveitar esses aprimoramentos.

Para obter detalhes, consulte Usar scripts de inicialização globais.

Listas de acesso de IP agora em GA

29 de julho a 4 de agosto de 2020: Versão 3.25

A API de Lista de Acesso de IP já está disponível para o público geral.

A versão de disponibilidade geral inclui uma alteração, que é a renomeação dos valores list_type:

WHITELIST em ALLOW
BLACKLIST em BLOCK

Use a API de Lista de Acesso de IP para configurar os workspaces do Azure Databricks e possibilitar que os usuários se conectem ao serviço apenas por meio de redes corporativas existentes em um perímetro seguro. Os administradores do Azure Databricks podem usar a API de Lista de Acesso de IP para definir um conjunto de endereços IP aprovados, incluindo listas de permissões e bloqueios. Todo o acesso de entrada ao aplicativo Web e às APIs REST exige que o usuário se conecte em um endereço IP autorizado, garantindo que os workspaces não possam ser acessados em uma rede pública como uma cafeteria ou um aeroporto, a menos que os usuários usem a VPN.

Esse recurso requer o plano Premium.

Para obter mais informações, confira Configurar listas de acesso IP para workspaces.

Nova caixa de diálogo de upload do arquivo

29 de julho a 4 de agosto de 2020: Versão 3.25

Agora você pode carregar pequenos arquivos de dados tabulares (como CSVs) e acessá-los em um notebook selecionando Adicionar dados no menu Arquivo do notebook. O código gerado mostra como carregar os dados em Pandas ou DataFrames. Os administradores podem desabilitar esse recurso na guia Avançado do console de administração.

Para obter mais informações, consulte Procurar arquivos no DBFS.

Melhorias na classificação e no filtro da API do SCIM

29 de julho – 4 de agosto de 2020: versão 3.25

A API SCIM agora inclui estas melhorias de filtragem e classificação:

Os usuários administradores podem filtrar os usuários no atributo active.
Qualquer usuário pode classificar os resultados usando os parâmetros de consultasortBy e sortOrder. O padrão é classificar por ID.

Regiões do Azure Government adicionadas

25 de julho de 2020

Recentemente, o Azure Databricks foi disponibilizado nas regiões US Gov - Arizona e US Gov - Virgínia para entidades do governo dos EUA e seus parceiros.

GA do Databricks Runtime 7.1

21 de julho de 2020

O Databricks Runtime 7.1 traz muitos recursos adicionais e aprimoramentos em relação ao Databricks Runtime 7.0, incluindo:

Conector do Google BigQuery
Comandos %pip para gerenciar bibliotecas do Python instaladas em uma sessão do notebook
Koalas instalado
Diversos aprimoramentos do Delta Lake, incluindo:
- Configurar metadados de confirmação definidos pelo usuário
- Obter a versão da última confirmação gravada pelo SparkSession atual
- Converter tabelas Parquet criadas pelo fluxo estruturado usando o log de transações _spark_metadata
- Aprimoramentos no desempenho de MERGE INTO

Para ver detalhes, confira as notas completas sobre a versão do Databricks Runtime 7.1 (sem suporte).

GA do Databricks Runtime 7.1 ML

21 de julho de 2020

O Databricks Runtime 7.1 para Machine Learning é criado com base no Databricks Runtime 7.1, e traz os novos recursos e alterações de biblioteca seguintes:

Comandos mágicos Pip e Conda habilitados por padrão
spark-tensorflow-distributor: 0.1.0
pillow 7.0.0 -> 7.1.0
pytorch 1.5.0 -> 1.5.1
torchvision 0.6.0 -> 0.6.1
horovod 0.19.1 -> 0.19.5
mlflow 1.8.0 -> 1.9.1

Para ver detalhes, confira as notas completas sobre a versão do Databricks Runtime 7.1 para ML (sem suporte).

GA do Databricks Runtime 7.1 Genomics

21 de julho de 2020

O Databricks Runtime 7.1 para Genomics foi desenvolvido com base no Databricks Runtime 7.1 e inclui os seguintes novos recursos:

Transformação LOCO
Função de reformatação de saída GloWGR
O RNASeq dá saída de alinhamentos não emparelhados