Share via


Che cos'è l'interfaccia della riga di comando di Databricks?

Nota

Queste informazioni si applicano alle versioni dell'interfaccia della riga di comando di Databricks 0.205 e successive, disponibili in anteprima pubblica. Per trovare la versione dell'interfaccia della riga di comando di Databricks, eseguire databricks -v.

L'interfaccia della riga di comando di Databricks (nota anche come interfaccia della riga di comando di Databricks) offre uno strumento per automatizzare la piattaforma Azure Databricks dal terminale, dal prompt dei comandi o dagli script di automazione.

Informazioni per gli utenti dell'interfaccia della riga di comando di Databricks legacy

  • Databricks non prevede alcun supporto o nuova funzionalità per l'interfaccia della riga di comando di Databricks legacy.
  • Per altre informazioni sull'interfaccia della riga di comando di Databricks legacy, vedere l'interfaccia della riga di comando di Databricks (legacy).
  • Per eseguire la migrazione dall'interfaccia della riga di comando di Databricks versione 0.18 o successiva all'interfaccia della riga di comando di Databricks versione 0.205 o successiva, vedere Migrazione dell'interfaccia della riga di comando di Databricks.

Come funziona l'interfaccia della riga di comando di Databricks?

L'interfaccia della riga di comando esegue il wrapping dell'API REST di Databricks, un'API (Application Programming Interface) che usa una prospettiva REST per automatizzare le risorse e i dati dell'account e dell'area di lavoro di Azure Databricks. Vedere le informazioni di riferimento sull'API REST di Azure Databricks.

Ad esempio, per stampare informazioni su un singolo cluster in un'area di lavoro, eseguire l'interfaccia della riga di comando come indicato di seguito:

databricks clusters get 1234-567890-a12bcde3

Con curl, l'operazione equivalente è più lunga da esprimere ed è più soggetta a errori di digitazione, come indicato di seguito:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Esempio: creare un processo di Azure Databricks

L'esempio seguente usa l'interfaccia della riga di comando per creare un processo di Azure Databricks. Questo processo contiene una singola attività di processo. Questa attività esegue il notebook di Azure Databricks specificato. Questo notebook ha una dipendenza da una versione specifica del pacchetto PyPI denominato wheel. Per eseguire questa attività, il processo crea temporaneamente un cluster di processi che esporta una variabile di ambiente denominata PYSPARK_PYTHON. Dopo l'esecuzione del processo, il cluster viene terminato.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Passaggi successivi