Aracılığıyla paylaş


Çalışma alanı dosyaları nedir?

Çalışma alanı dosyası, Azure Databricks çalışma alanında Databricks not defteri olmayan herhangi bir dosyadır. Çalışma alanı dosyaları herhangi bir dosya türünde olabilir. Bazı yaygın örnekler aşağıdakileri içermektedir:

  • .py özel modüllerde kullanılan dosyalar.
  • .mdREADME.mdgibi dosyalar.
  • .csv veya diğer küçük veri dosyaları.
  • .txt Dosyaları.
  • .whl Kitaplık.
  • Günlük dosyaları.

Çalışma alanı dosyaları, daha önce "Depolardaki Dosyalar" olarak adlandırılan dosyaları içerir. Dosyalarla çalışma hakkında öneriler için bkz. Birimlerdeki ve çalışma alanı dosyalarındaki dosyalar için Öneriler.

Önemli

Çalışma alanı dosyaları Databricks Runtime sürüm 11.2'de varsayılan olarak her yerde etkinleştirilir, ancak REST API kullanılarak yöneticiler tarafından devre dışı bırakılabilir. Üretim iş yükleri için Databricks Runtime 11.3 LTS veya üzerini kullanın. Bu işleve erişemiyorsanız çalışma alanı yöneticinize başvurun.

Çalışma alanı dosyalarıyla neler yapabilirsiniz?

Azure Databricks, yerleşik bir dosya düzenleyicisi de dahil olmak üzere birçok çalışma alanı dosya türü için yerel geliştirmeye benzer işlevler sağlar. Tüm dosya türleri için tüm kullanım örnekleri desteklenmez. Örneğin, içeri aktarılan bir dizine veya depoya görüntü ekleyebilirsiniz ancak not defterlerine görüntü ekleyemezsiniz.

Not defteri etkileşimlerindeki tanıdık desenleri kullanarak çalışma alanı dosyalarına erişimi oluşturabilir, düzenleyebilir ve yönetebilirsiniz. Yerel geliştirme gibi çalışma alanı dosyalarından kitaplık içeri aktarma işlemleri için göreli yolları kullanabilirsiniz. Daha ayrıntılı bilgi için bkz.

Çalışma alanı dosyalarında depolanan init betiklerinin özel davranışları vardır. Herhangi bir Databricks Runtime sürümünde init betiklerini depolamak ve bunlara başvurmak için çalışma alanı dosyalarını kullanabilirsiniz. Bkz. Çalışma alanı dosyalarında başlatma betiklerini depolama.

Not

Databricks Runtime 14.0 ve üzerinde, yerel olarak yürütülen kod için varsayılan geçerli çalışma dizini (CWD), çalıştırılmakta olan not defterini veya betiği içeren dizindir. Bu, Databricks Runtime 13.3 LTS ve altındaki davranışlarda bir değişikliktir. Bkz. Varsayılan geçerli çalışma dizini nedir?.

Sınırlama

Çalışma alanı dosyaları sınırlamalarının tam listesi Çalışma alanı dosyaları sınırlamaları bölümünde bulunur.

Dosya boyutu sınırı

Tek tek çalışma alanı dosyaları 500 MB ile sınırlıdır.

Kullanıcılar kullanıcı arabiriminden en fazla 500 MB dosya boyutu yükleyebilir. Bir kümeden yazarken izin verilen dosya boyutu üst sınırı 256 MB'tır.

Azure Databricks Container Services ile küme içeren Git klasörlerindeki dosyalar için Databricks Runtime sürümleri

Databricks Runtime 11.3 LTS ve üzerini çalıştıran kümelerde, varsayılan ayarlar Azure Databricks Container Services (DCS) ile Git klasörlerindeki çalışma alanı dosyalarını kullanmanıza olanak tanır.

Databricks Runtime sürüm 10.4 LTS ve 9.1 LTS çalıştıran kümelerde, dockerfile dosyasını DCS içeren bir kümedeki Git klasörlerindeki çalışma alanı dosyalarına erişecek şekilde yapılandırmanız gerekir. İstenen Databricks Runtime sürümü için aşağıdaki dockerfiles dosyasına bakın:

Bkz. Databricks Container Service ile kapsayıcıları özelleştirme

Çalışma alanı dosyalarını etkinleştirme

Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek için, Databricks çalışma alanınıza erişimi olan bir not defterinden veya başka bir ortamdan /api/2.0/workspace-conf REST API'sini çağırın. Çalışma alanı dosyaları varsayılan olarak etkindir.

Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek veya yeniden etkinleştirmek için öğesini çağırın /api/2.0/workspace-conf ve anahtarın enableWorkspaceFileSystem değerini alın. olarak ayarlanırsa true, not defteri olmayan dosyalar çalışma alanınız için zaten etkindir.

Aşağıdaki örnek, çalışma alanı dosyalarının devre dışı bırakılıp bırakılmadığından ve devre dışı bırakıldıysa yeniden etkinleştirmek için bu API'yi bir not defterinden nasıl çağırabileceğinizi gösterir.

Örnek: Databricks çalışma alanı dosya desteğini yeniden etkinleştirmeye yönelik not defteri

Not defterini alma