Obter identificadores de áreas de trabalho, clusters, blocos de notas, modelos e tarefas

Este artigo explica como obter espaço de trabalho, cluster, modelo, caderno e identificadores de trabalho e URLs em Azure Databricks.

Nomes de instâncias de espaço de trabalho, URLs e IDs

Um nome único de instância , também conhecido como URL por espaço de trabalho, é atribuído a cada implementação de Azure Databricks. É o nome de domínio totalmente qualificado usado para iniciar sessão na sua implementação de Dados Azure e fazer pedidos de API.

Um espaço de trabalho Azure Databricks é onde funciona a plataforma Azure Databricks e onde você pode criar clusters Spark e agendar cargas de trabalho. Um espaço de trabalho tem um ID numérico único.

URL por espaço de trabalho

O URL único por espaço de trabalho tem o adb-<workspace-id>.<random-number>.azuredatabricks.net formato. O ID do espaço de trabalho aparece imediatamente após adb- e antes do "ponto" (.). Para o URL por espaço de https://adb-5555555555555555.19.azuredatabricks.net/ trabalho:

  • O nome da instância é adb-5555555555555555.19.azuredatabricks.net .
  • O ID do espaço de trabalho 5555555555555555 é.

Determinar URL por espaço de trabalho

Pode determinar o URL por espaço de trabalho para o seu espaço de trabalho:

URL regional legado

Importante

Evite utilizar URLs regionais antigos. Podem não trabalhar para novos espaços de trabalho, são menos fiáveis e apresentam um desempenho inferior ao dos URLs por espaço de trabalho.

O URL regional legado é composto pela região onde o espaço de trabalho Azure Databricks é implantado mais o domínio azuredatabricks.net , por exemplo, https://westus.azuredatabricks.net/ .

  • Se iniciar sessão num URL regional antigo https://westus.azuredatabricks.net/ como, o nome da instância é westus.azuredatabricks.net .
  • O ID do espaço de trabalho só aparece no URL depois de ter iniciado sessão utilizando um URL regional legado. Aparece depois o= do. No https://<databricks-instance>/?o=6280049833385130 URL, o ID do espaço de trabalho é 6280049833385130 .

URL e ID de clusters

Um cluster Azure Databricks fornece uma plataforma unificada para vários casos de uso, tais como a execução de gasodutos ETL de produção, análise de streaming, análise ad-hoc e machine learning. Cada cluster tem uma identificação única chamada ID do cluster. Isto aplica-se tanto a todos os agrupamentos de emprego como a grupos de trabalho. Para obter os detalhes de um cluster usando a API REST, o ID do cluster é essencial.

Para obter o ID do cluster, clique no separador Clusters na barra lateral e, em seguida, selecione um nome de cluster. O ID do cluster é o número após o /clusters/ componente no URL desta página

https://<databricks-instance>/#/setting/clusters/<cluster-id>

Na imagem seguinte, o ID do cluster é 0831-211914-clean632 .

URL do Cluster

URL de portátil e ID

Um bloco de notas é uma interface baseada na web para um documento que contém código, visualizações e texto narrativo. Os cadernos são uma interface para interagir com a Azure Databricks. Cada caderno tem uma identificação única. O URL do portátil tem o ID do portátil, daí que o URL do portátil seja exclusivo de um caderno. Pode ser partilhado com qualquer pessoa na plataforma Azure Databricks com permissão para visualizar e editar o caderno. Além disso, cada comando de caderno (célula) tem um URL diferente.

Para chegar a um URL de caderno, abra um caderno. Para chegar a um URL celular, clique no conteúdo do comando.

URL do Bloco de Notas

Neste caderno:

  • O URL do portátil é:

    https://westus.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342`
    
  • O ID do caderno 1940481404050342 é.

  • O URL de comando (célula) é

    https://westus.azuredatabricks.net/?o=6280049833385130#notebook/1940481404050342/command/2432220274659491
    

ID do Modelo

Um modelo refere-se a um modelo registado em MLflow, que permite gerir os Modelos MLflow em produção através de transições de fase e versão. O ID do modelo registado é necessário para alterar as permissões no modelo programáticamente através da API permissões.

Para obter o ID de um modelo registado, pode utilizar o ponto final REST API 2.0 mlflow/databricks/registered-models/get . Por exemplo, o seguinte código devolve o objeto do modelo registado com as suas propriedades, incluindo o seu ID:

curl -n -X GET -H 'Content-Type: application/json' -d '{"name": "model_name"}' \
https://<databricks-instance>/api/2.0/mlflow/databricks/registered-models/get

O valor devolvido tem o formato:

{
  "registered_model_databricks": {
    "name":"model_name",
    "id":"ceb0477eba94418e973f170e626f4471"
  }
}

URL e ID de Trabalhos

Um trabalho é uma forma de executar um caderno ou JAR imediatamente ou numa base programada.

Para chegar a um URL de trabalho, clique no separador Jobs na barra lateral e clique num nome de trabalho. Esta URL de trabalho é uma peça crítica de informação necessária para resolver problemas de trabalho que falharam e investigar a causa principal. A identificação do trabalho é depois do texto #job/ na URL.

Na imagem seguinte, o URL de trabalho é:

https://westus.azuredatabricks.net/?o=6280049833385130#job/1

Neste exemplo, a identificação do trabalho 1 é.

URL da Tarefa