Co je Azure Databricks?

Azure Databricks je platforma pro analýzu dat optimalizovaná pro platformu Microsoft Azure cloudových služeb. Azure Databricks nabízí tři prostředí pro vývoj aplikací náročných na data: Databricks SQL, Databricks Data & Science Engineering a Databricks Machine Learning.

Databricks SQL poskytuje snadno použitelnou platformu pro analytiky, kteří chtějí spouštět dotazy SQL na datovém jezeře, vytvářet více typů vizualizací pro zkoumání výsledků dotazů z různých perspektiv a vytvářet a sdílet řídicí panely.

Databricks Data Science & Engineering poskytuje interaktivní pracovní prostor, který umožňuje spolupráci mezi datovými inženýry, datovými vědci a inženýry strojového učení. V případě kanálu pro velké objemy dat se data (nezpracovaná nebo strukturovaná) ingestují do Azure prostřednictvím Azure Data Factory v dávkách nebo streamují téměř v reálném čase pomocí Apache Kafka, Event Hubu nebo IoT Hub. Tato data se nachází v datovém jezeře pro dlouhodobé trvalé úložiště v Azure Blob Storage nebo Azure Data Lake Storage. Jako součást pracovního postupu analýzy můžete pomocí Azure Databricks číst data z více zdrojů dat a převést je na převratné přehledy pomocí Sparku.

Databricks Machine Learning je integrované komplexní prostředí strojového učení, které zahrnuje spravované služby pro sledování experimentů, trénování modelů, vývoj funkcí a správu funkcí a obsluhu modelů.

Pokud chcete vybrat prostředí, spusťte pracovní prostor Azure Databricks a použijte přepínač persona na bočním panelu:

Azure Databricks Persona Switcher.

Další kroky