Co je Azure Databricks?

Azure Databricks je platforma pro analýzu dat optimalizovaná pro platformu cloudových služeb Microsoft Azure. Azure Databricks nabízí tři prostředí pro vývoj aplikací náročných na data: datacihly SQL, datacihly pro datové vědy & a Machine Learning datacihly.

datacihly SQL poskytují snadno použitelnou platformu pro analytiky, kteří chtějí spouštět dotazy SQL na jejich data lake, vytvořit více typů vizualizací pro zkoumání výsledků dotazu z různých perspektiv a vytváření a sdílení řídicích panelů.

Datové cihly datových věd Inženýr poskytuje interaktivní pracovní prostor, který umožňuje spolupráci mezi technickými inženýry, odborníky přes data a inženýry strojového učení. V případě kanálu pro velké objemy dat se data (hrubá nebo strukturovaná) ingestují do Azure prostřednictvím Azure Data Factory v dávkách nebo se streamují téměř v reálném čase s využitím Apache Kafka, centra událostí nebo IoT Hub. tato data se nacházejí v data lake pro dlouhodobé trvalé úložiště v Azure Blob Storage nebo Azure Data Lake Storage. Jako součást pracovního postupu analýzy použijte Azure Databricks ke čtení dat z více zdrojů dat a převeďte je na převratné poznatky pomocí Sparku.

datacihly Machine Learning jsou integrované ucelené prostředí strojového učení, které zahrnuje spravované služby pro účely sledování experimentů, školení modelů, vývoj a správu funkcí a obsluhu funkcí a modelů.

Pokud chcete vybrat prostředí, spusťte Azure Databricks pracovní prostor a na bočním panelu použijte přepínač osoby:

Přepínač Azure Databricksho osoby.

Další kroky