Co je Azure Databricks?

Azure Databricks je platforma pro analýzu dat optimalizovaná pro platformu cloudových služeb Microsoft Azure. Azure Databricks nabízí tři prostředí pro vývoj aplikací náročných na data: Databricks SQL, Databricks Data Science & Engineering a Databricks Machine Learning.

Databricks SQL poskytuje snadno použitelnou platformu pro analytiky, kteří chtějí spouštět dotazy SQL na datovém jezeře, vytvářet více typů vizualizací pro zkoumání výsledků dotazů z různých perspektiv a vytvářet a sdílet řídicí panely.

Databricks Data Science & Inženýr poskytuje interaktivní pracovní prostor, který umožňuje spolupráci mezi datovými inženýry, datovými vědci a inženýry strojového učení. V případě kanálu pro velké objemy dat se data (nezpracovaná nebo strukturovaná) ingestují do Azure prostřednictvím Azure Data Factory v dávkách nebo streamovaných téměř v reálném čase pomocí Apache Kafka, Centra událostí nebo IoT Hub. Tato data přistane v datovém jezeře pro dlouhodobé trvalé úložiště v Azure Blob Storage nebo Azure Data Lake Storage. V rámci pracovního postupu analýzy můžete pomocí Azure Databricks číst data z více zdrojů dat a převést je na průlomové přehledy pomocí Sparku.

Databricks Machine Learning je integrované ucelené prostředí strojového učení, které zahrnuje spravované služby pro sledování experimentů, trénování modelů, vývoj funkcí a správu a poskytování funkcí a modelů.

Pokud chcete vybrat prostředí, spusťte pracovní prostor Azure Databricks a použijte přepínač persona na bočním panelu:

Přepínač Persona Azure Databricks

Další kroky