Co to jest Azure Databricks?

Azure Databricks to platforma analizy danych zoptymalizowana pod kątem platformy Microsoft Azure w chmurze. Azure Databricks oferuje trzy środowiska do tworzenia aplikacji intensywnie przetwarzanych danych: Databricks SQL, Databricks Data Science Engineering i & Databricks Machine Learning.

Databricks SQL to łatwa w użyciu platforma dla analityków, którzy chcą uruchamiać zapytania usługi SQL w swoich usługach data lake, tworzyć wiele typów wizualizacji, eksplorować wyniki zapytań z różnych perspektyw oraz tworzyć i udostępniać pulpity nawigacyjne.

Databricks Data Science Inżynieria zapewnia interakcyjny obszar roboczy, który umożliwia współpracę między inżynierami danych, badaczami danych i inżynierami uczenia maszynowego. W przypadku potoku danych big data dane (nieprzetworzone lub ustrukturyzowane) są pozyskane na platformę Azure za pośrednictwem usługi Azure Data Factory w partiach lub przesyłane strumieniowo niemal w czasie rzeczywistym przy użyciu usług Apache Kafka, Event Hub lub IoT Hub. Te dane trafiają do magazynu typu data lake w celu długoterminowego trwałego przechowywania w usłudze Azure Blob Storage lub usłudze Azure Data Lake Storage. W ramach przepływu pracy analizy użyj narzędzia Azure Databricks do odczytywania danych z wielu źródeł danych i przekształcić je w przełomowe szczegółowe informacje przy użyciu platformy Spark.

Databricks Machine Learning to zintegrowane, end-to-end środowisko uczenia maszynowego zawierające zarządzane usługi do śledzenia eksperymentów, trenowania modeli, opracowywania funkcji i zarządzania nimi oraz obsługi funkcji i modeli.

Aby wybrać środowisko, uruchom obszar roboczy Azure Databricks i użyj przełącznika osoby na pasku bocznym:

Azure Databricks Persona Switcher.

Następne kroki