Luty 2019 r.

Te funkcje i Azure Databricks platformy zostały wydane w lutym 2019 r.

Uwaga

Wydania są przepuszczane. Konto Azure Databricks nie może zostać zaktualizowane do tygodnia po początkowej dacie wydania.

Usługa Databricks Light jest ogólnie dostępna

26 lutego — 5 marca 2019 r.: wersja 2.92

Databricks Light (znane również jako Data Engineering Light) jest teraz dostępne. Databricks Light to opakowanie usługi Databricks open source Apache Spark uruchomieniowego. Udostępnia ona opcję środowiska uruchomieniowego dla zadań, które nie wymagają zaawansowanych korzyści związanych z wydajnością, niezawodnością ani skalowania automatycznego zapewnianych przez Databricks Runtime. Usługę Databricks Light można wybrać tylko podczas tworzenia klastra w celu uruchomienia zadania JAR, Python lub spark-submit. Nie można wybrać tego środowiska uruchomieniowego dla klastrów, w których są uruchamiane obciążenia zadań interaktywnych lub notesów. Zobacz Databricks Light.

Zarządzana platforma MLflow w usłudze Azure Databricks jest w publicznej wersji zapoznawczej

26 lutego — 5 marca 2019 r.: wersja 2.92

MLflow to platforma typu „open source” umożliwiająca zarządzanie całym cyklem życia uczenia maszynowego. Zajmuje się trzema podstawowymi funkcjami:

  • Śledzenie eksperymentów w celu rekordu i porównania parametrów i wyników.
  • Zarządzanie modelami i wdrażanie ich z różnych bibliotek ML różnych platform obsługujących modele i wnioskowania.
  • Pakowanie ML w formie wielokrotnego użytku, powtarzalnym w celu udostępniania go innym badaczom danych lub przenoszenia do produkcji.

Azure Databricks udostępnia teraz w pełni zarządzaną i hostowaną wersję rozwiązania MLflow zintegrowaną z funkcjami zabezpieczeń przedsiębiorstwa, wysoką dostępnością i innymi funkcjami obszaru roboczego usługi Azure Databricks, takimi jak zarządzanie eksperymentami, zarządzanie przebiegami i przechwytywanie poprawek notesu. Platforma MLflow w usłudze Azure Databricks oferuje zintegrowane środowisko śledzenia i zabezpieczania przebiegów trenowania modeli uczenia maszynowego i uruchamiania projektów uczenia maszynowego. Korzystając z zarządzanego platformy MLflow w Azure Databricks, można uzyskać korzyści z obu platform, w tym:

  • Obszarów roboczych: Zespołowe śledzenie i organizowanie eksperymentów oraz wyników w ramach Azure Databricks roboczych przy użyciu hostowanej platformy MLflow Tracking Server i zintegrowanego interfejsu użytkownika eksperymentu. W przypadku korzystania z programu MLflow w notesach program Azure Databricks automatycznie przechwyci poprawki notesu, aby można było odtworzyć ten sam kod i uruchamiać go później.
  • Zabezpieczeń: Skorzystaj z jednego wspólnego modelu zabezpieczeń dla całego cyklu ML za pośrednictwem ACL.
  • Zadania: Uruchamianie projektów MLflow jako Azure Databricks zadań zdalnych i bezpośrednio z Azure Databricks notesów.

Oto pokaz przepływu pracy śledzenia w Azure Databricks roboczym:

Track runs and organize experiment workflow

Aby uzyskać szczegółowe informacje, zobacz Experiments and Run MLflow Projects on Azure Databricks (Eksperymenty i uruchamianie projektów MLflow na platformie Azure Databricks).

Łącznik usługi Azure Data Lake Storage Gen2 jest już ogólnie dostępny

15 lutego 2019 r.

Usługa Azure Data Lake Storage Gen2 (ADLS Gen2), rozwiązanie nowej generacji data lake do analizy danych big data, jest teraz dostępne w wersji GA, podobnie jak łącznik ADLS Gen2 dla Azure Databricks. Z zadowoleniem ogłaszamy również, ADLS Gen2 obsługuje funkcję delta usługi Databricks w przypadku uruchamiania klastrów w Databricks Runtime 5.2 lub nowsza.

Język Python 3 jest teraz domyślny podczas tworzenia klastrów

12–19 lutego 2019 r.: wersja 2.91

Domyślna wersja języka Python dla klastrów utworzonych przy użyciu interfejsu użytkownika została przełączona z języka Python 2 na język Python 3. Wartością domyślną dla klastrów utworzonych przy użyciu interfejsu API REST jest nadal język Python 2.

Istniejące klastry nie zmienią swoich wersji języka Python. Jeśli jednak masz już nawyk korzystania z ustawień domyślnych języka Python 2 podczas tworzenia nowych klastrów, musisz zacząć zwracać uwagę na wybór wersji języka Python.

Default Python version

Zobacz Obrazy platformy Docker.

Usługa Delta Lake jest teraz ogólnie dostępna

1 lutego 2019 r.

Teraz wszyscy mogą korzystać z zalet zaawansowanej transakcyjnej warstwy magazynu usługi Databricks Delta i bardzo szybkich odczytów: od 1 lutego delta Lake jest dostępna w wersji GA i dostępna we wszystkich obsługiwanych wersjach Databricks Runtime. Aby uzyskać informacje na temat usługi Delta, zobacz przewodnik dotyczący usługi Delta Lake i aparatu delta.