Что такое Azure Databricks?

Azure Databricks — это платформа аналитики данных, оптимизированная для платформы облачных служб Microsoft Azure. Платформа Azure Databricks предлагает три среды для разработки приложений, интенсивно использующих данные: Databricks SQL, Обработка и анализ данных Databricks и Машинное обучение Databricks.

Databricks SQL — это удобная платформа для аналитиков, которым нужно выполнять SQL-запросы к озеру данных, создавать разные типы визуализации для просмотра результатов запросов в разных контекстах, а также создавать и совместно использовать панели мониторинга.

Databricks для обработки, анализа и инжиниринга данных предоставляет интерактивную рабочую область с возможностями совместной работы для специалистов по инжинирингу данных, специалистов по обработке и анализу данных и специалистов по машинному обучению. В конвейере больших данных эти данные (необработанные или структурированные) принимаются в Azure через Фабрику данных Azure в виде пакетов или передаются в рамках потоковой передачи практически в реальном времени с помощи Apache Kafka, концентратора событий или Центра Интернета вещей. Эти данные попадают в озеро данных для долгосрочного хранения в хранилище BLOB-объектов Azure или Azure Data Lake Storage. В рамках рабочего процесса аналитики вы можете использовать Azure Databricks для считывания данных из множества источников данных и получения полезных сведений с помощью Spark.

Машинное обучение Databricks — это интегрированная комплексная среда машинного обучения, которая включает управляемые службы для отслеживания экспериментов, обучения моделей, разработки признаков и управления ими, а также предоставления признаков и моделей.

Чтобы выбрать среду, запустите рабочую область Azure Databricks и воспользуйтесь переключателем пользователей на боковой панели:

Azure Databricks Persona Switcher.

Дальнейшие действия