Databricks CLI nedir?

Dekont

Bu bilgiler, Genel Önizleme sürümündeki Databricks CLI 0.205 ve üzeri sürümleri için geçerlidir. Databricks CLI sürümünüzü bulmak için komutunu çalıştırın databricks -v.

Databricks komut satırı arabirimi (Databricks CLI olarak da bilinir), terminal, komut istemi veya otomasyon betiklerinizden Azure Databricks platformunu otomatikleştirmek için bir araç sağlar.

Eski Databricks CLI kullanıcıları için bilgiler

  • Databricks, eski Databricks CLI için destek veya yeni özellik çalışması planlamıyor.
  • Eski Databricks CLI hakkında daha fazla bilgi için bkz . Databricks CLI (eski).
  • Databricks CLI sürüm 0.18 veya altından Databricks CLI sürüm 0.205 veya üzeri sürüme geçiş yapmak için bkz . Databricks CLI geçişi.

Databricks CLI nasıl çalışır?

CLI, Azure Databricks hesabını ve çalışma alanı kaynaklarını ve verilerini otomatikleştirmek için REST perspektifi kullanan bir uygulama programlama arabirimi (API) olan Databricks REST API'sini sarmalar. Bkz. Azure Databricks REST API başvurusu.

Örneğin, çalışma alanında tek bir kümeyle ilgili bilgileri yazdırmak için CLI'yi aşağıdaki gibi çalıştırırsınız:

databricks clusters get 1234-567890-a12bcde3

ile curleşdeğer işlem ifade etmek için daha uzundur ve aşağıdaki gibi yazma hatalarına daha yatkındır:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Örnek: Azure Databricks işi oluşturma

Aşağıdaki örnek, Cli kullanarak bir Azure Databricks işi oluşturur. Bu iş tek bir iş görevi içeriyor. Bu görev belirtilen Azure Databricks not defterini çalıştırır. Bu not defterinin Adlı wheelPyPI paketinin belirli bir sürümüne bağımlılığı vardır. Bu görevi çalıştırmak için, iş geçici olarak adlı PYSPARK_PYTHONbir ortam değişkenini dışarı aktaran bir iş kümesi oluşturur. İş çalıştırıldıktan sonra küme sonlandırılır.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Sonraki adımlar

  • CLI'yı yüklemeyi ve kullanmaya başlamayı öğrenmek için Databricks CLI öğreticisine bakın.
  • Öğreticiyi atlamak ve yalnızca CLI'yı yüklemek için bkz . Databricks CLI'yi yükleme veya güncelleştirme.
  • CLI ile Azure Databricks hesaplarınız ve çalışma alanlarınız arasında kimlik doğrulamasını ayarlamak için bkz . Databricks CLI için kimlik doğrulaması.
  • İlgili CLI ayarları grupları arasında hızla geçiş yapmak üzere yapılandırma profillerini kullanmak için bkz . Databricks CLI için yapılandırma profilleri.
  • CLI'nın temel kullanımı hakkında bilgi edinmek için bkz . Databricks CLI için temel kullanım.
  • CLI komutları hakkında yardım almak için bkz . Databricks CLI komutları.