Pobieranie identyfikatorów obiektów obszaru roboczego

W tym artykule wyjaśniono, jak uzyskać identyfikatory i adresy URL obszaru roboczego, klastra, katalogu, modelu, notesu i zadań w usłudze Azure Databricks.

Nazwy, adresy URL i identyfikatory wystąpień obszaru roboczego

Unikatowa nazwa wystąpienia, znana również jako adres URL dla obszaru roboczego, jest przypisywana do każdego wdrożenia usługi Azure Databricks. Jest to w pełni kwalifikowana nazwa domeny używana do logowania się do wdrożenia usługi Azure Databricks i wysyłania żądań interfejsu API.

Obszar roboczy usługi Azure Databricks to miejsce, w którym działa platforma Azure Databricks i gdzie można tworzyć klastry Spark i planować obciążenia. Obszar roboczy ma unikatowy numeryczny identyfikator obszaru roboczego.

Adres URL dla poszczególnych obszarów roboczych

Unikatowy adres URL dla obszaru roboczego ma format adb-<workspace-id>.<random-number>.azuredatabricks.net. Identyfikator obszaru roboczego jest wyświetlany natychmiast po adb- i przed "kropką" (.). Dla adresu URL https://adb-5555555555555555.19.azuredatabricks.net/dla poszczególnych obszarów roboczych:

  • Nazwa wystąpienia to adb-5555555555555555.19.azuredatabricks.net.
  • Identyfikator obszaru roboczego to 5555555555555555.

Określanie adresu URL dla obszaru roboczego

Możesz określić adres URL dla obszaru roboczego dla obszaru roboczego:

Starszy regionalny adres URL

Ważne

Unikaj używania starszych regionalnych adresów URL. Mogą one nie działać w przypadku nowych obszarów roboczych, są mniej niezawodne i wykazują niższą wydajność niż adresy URL poszczególnych obszarów roboczych.

Starszy regionalny adres URL składa się z regionu, w którym wdrożono obszar roboczy usługi Azure Databricks oraz domenę azuredatabricks.net, na przykład https://westus.azuredatabricks.net/.

  • Jeśli logujesz się do starszego regionalnego adresu URL, takiego jak https://westus.azuredatabricks.net/, nazwa wystąpienia to westus.azuredatabricks.net.
  • Identyfikator obszaru roboczego jest wyświetlany w adresie URL dopiero po zalogowaniu się przy użyciu starszego regionalnego adresu URL. Pojawia się on po .o= W adresie URL https://<databricks-instance>/?o=6280049833385130identyfikator obszaru roboczego to 6280049833385130.

Adres URL i identyfikator klastra

Klaster usługi Azure Databricks udostępnia ujednoliconą platformę dla różnych przypadków użycia, takich jak uruchamianie produkcyjnych potoków ETL, analiza przesyłania strumieniowego, analiza ad hoc i uczenie maszynowe. Każdy klaster ma unikatowy identyfikator o nazwie identyfikator klastra. Dotyczy to zarówno klastrów zadań, jak i wszystkich celów. Aby uzyskać szczegółowe informacje o klastrze przy użyciu interfejsu API REST, identyfikator klastra jest niezbędny.

Aby uzyskać identyfikator klastra, kliknij kartę Klastry na pasku bocznym, a następnie wybierz nazwę klastra. Identyfikator klastra to liczba po składniku /clusters/ w adresie URL tej strony

https://<databricks-instance>/#/setting/clusters/<cluster-id>

Na poniższym zrzucie ekranu identyfikator klastra to 0831-211914-clean632.

Cluster URL

Adres URL i identyfikator notesu

Notes to internetowy interfejs dokumentu, który zawiera kod, wizualizacje i tekst narracji z możliwością uruchamiania. Notesy to jeden z interfejsów do interakcji z usługą Azure Databricks. Każdy notes ma unikatowy identyfikator. Adres URL notesu ma identyfikator notesu, dlatego adres URL notesu jest unikatowy dla notesu. Można ją udostępnić dowolnej osobie na platformie Azure Databricks z uprawnieniami do wyświetlania i edytowania notesu. Ponadto każde polecenie notesu (komórka) ma inny adres URL.

Aby znaleźć adres URL lub identyfikator notesu, otwórz notes. Aby znaleźć adres URL komórki, kliknij zawartość polecenia.

  • Przykładowy adres URL notesu:

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
    
  • Przykładowy identyfikator notesu: 1940481404050342.

  • Przykładowy adres URL polecenia (komórki):

    https://adb-62800498333851.30.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
    

Identyfikator folderu

Folder to katalog służący do przechowywania plików, które mogą być używane w obszarze roboczym usługi Azure Databricks. Te pliki mogą być notesami, bibliotekami lub podfolderami. Istnieje określony identyfikator skojarzony z każdym folderem i poszczególnymi podfolderami. Interfejs API uprawnień określa ten identyfikator jako directory_id i jest używany do ustawiania i aktualizowania uprawnień dla folderu.

Aby pobrać directory_id , użyj interfejsu API obszaru roboczego:

curl -n -X GET -H 'Content-Type: application/json' -d '{"path": "/Users/me@example.com/MyFolder"}' \
https://<databricks-instance>/api/2.0/workspace/get-status

Oto przykład odpowiedzi wywołania interfejsu API:

{
  "object_type": "DIRECTORY",
  "path": "/Users/me@example.com/MyFolder",
  "object_id": 123456789012345
}

Model ID

Model odnosi się do zarejestrowanego modelu MLflow, który umożliwia zarządzanie modelami MLflow w środowisku produkcyjnym za pomocą przejść etapów i przechowywania wersji. Zarejestrowany identyfikator modelu jest wymagany do programowego zmieniania uprawnień modelu za pomocą interfejsu API uprawnień.

Aby uzyskać identyfikator zarejestrowanego modelu, możesz użyć punktu końcowego mlflow/databricks/registered-models/getinterfejsu API obszaru roboczego. Na przykład poniższy kod zwraca zarejestrowany obiekt modelu z jego właściwościami, w tym jego identyfikatorem:

curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get

Zwrócona wartość ma format:

{
  "registered_model_databricks": {
    "name":"model_name",
    "id":"ceb0477eba94418e973f170e626f4471"
  }
}

Adres URL i identyfikator zadania

Zadanie to sposób uruchamiania notesu lub pliku JAR natychmiast lub zgodnie z harmonogramem.

Aby uzyskać adres URL zadania, kliknij pozycję Jobs IconPrzepływy pracy na pasku bocznym i kliknij nazwę zadania. Identyfikator zadania jest po tekście #job/ w adresie URL. Adres URL zadania jest wymagany do rozwiązywania problemów z główną przyczyną nieudanych uruchomień zadań.

Na poniższym zrzucie ekranu adres URL zadania to:

https://westus.azuredatabricks.net/?o=6280049833385130#job/1

W tym przykładzie identyfikator zadania to 1.

Job URL