O que é o Azure Databricks?

A azure Databricks é uma plataforma de análise de dados otimizada para a plataforma de serviços cloud da Microsoft Azure. A Azure Databricks oferece três ambientes para o desenvolvimento de aplicações intensivas de dados: Databricks SQL, Databricks Data Science & Engineering e Databricks Machine Learning.

Databricks SQL fornece uma plataforma de fácil utilização para analistas que querem executar consultas SQL no seu lago de dados, criar vários tipos de visualização para explorar resultados de consulta de diferentes perspetivas, e construir e partilhar dashboards.

Databricks Data Science & Engineering fornece um espaço de trabalho interativo que permite a colaboração entre engenheiros de dados, cientistas de dados e engenheiros de machine learning. Para um grande oleoduto de dados, os dados (crus ou estruturados) são ingeridos em Azure Data Factory em lotes, ou transmitidos perto de tempo real usando Apache Kafka, Event Hub ou IoT Hub. Estes dados aterram num lago de dados para armazenamento persistido a longo prazo, no Azure Blob Storage ou no Azure Data Lake Storage. Como parte do seu fluxo de trabalho de análise, use Azure Databricks para ler dados de várias fontes de dados e transformá-lo em insights inovadores usando Spark.

Databricks Machine Learning é um ambiente integrado de aprendizagem automática de ponta a ponta, incorporando serviços geridos para rastreio de experiências, formação de modelos, desenvolvimento e gestão de recursos e serviço de recursos e modelos.

Para selecionar um ambiente, lance um espaço de trabalho Azure Databricks e utilize o comutador de persona na barra lateral:

Azure Databricks Persona Switcher.

Passos seguintes