Co je Azure Databricks?
Azure Databricks je platforma pro analýzu dat optimalizovaná pro platformu cloudových služeb Microsoft Azure. Azure Databricks nabízí tři prostředí pro vývoj aplikací náročných na data: datacihly SQL, datacihly pro datové vědy & a Machine Learning datacihly.
datacihly SQL poskytují snadno použitelnou platformu pro analytiky, kteří chtějí spouštět dotazy SQL na jejich data lake, vytvořit více typů vizualizací pro zkoumání výsledků dotazu z různých perspektiv a vytváření a sdílení řídicích panelů.
Datové cihly datových věd Inženýr poskytuje interaktivní pracovní prostor, který umožňuje spolupráci mezi technickými inženýry, odborníky přes data a inženýry strojového učení. V případě kanálu pro velké objemy dat se data (hrubá nebo strukturovaná) ingestují do Azure prostřednictvím Azure Data Factory v dávkách nebo se streamují téměř v reálném čase s využitím Apache Kafka, centra událostí nebo IoT Hub. tato data se nacházejí v data lake pro dlouhodobé trvalé úložiště v Azure Blob Storage nebo Azure Data Lake Storage. Jako součást pracovního postupu analýzy použijte Azure Databricks ke čtení dat z více zdrojů dat a převeďte je na převratné poznatky pomocí Sparku.
datacihly Machine Learning jsou integrované ucelené prostředí strojového učení, které zahrnuje spravované služby pro účely sledování experimentů, školení modelů, vývoj a správu funkcí a obsluhu funkcí a modelů.
Pokud chcete vybrat prostředí, spusťte Azure Databricks pracovní prostor a na bočním panelu použijte přepínač osoby:
.
Další kroky
- Další informace o inženýrech datových věd pro datacihly
- Další informace o datacihlách Machine Learning
- další informace o datacihlách SQL Analytics