Çalışma alanı dosyaları nedir?
Çalışma alanı dosyası, Azure Databricks çalışma alanında Databricks not defteri olmayan herhangi bir dosyadır. Çalışma alanı dosyaları herhangi bir dosya türünde olabilir. Bazı yaygın örnekler aşağıdakileri içermektedir:
.py
özel modüllerde kullanılan dosyalar..md
README.md
gibi dosyalar..csv
veya diğer küçük veri dosyaları..txt
Dosyaları..whl
Kitaplık.- Günlük dosyaları.
Çalışma alanı dosyaları, daha önce "Depolardaki Dosyalar" olarak adlandırılan dosyaları içerir. Dosyalarla çalışma hakkında öneriler için bkz. Birimlerdeki ve çalışma alanı dosyalarındaki dosyalar için Öneriler.
Önemli
Çalışma alanı dosyaları Databricks Runtime sürüm 11.2'de varsayılan olarak her yerde etkinleştirilir, ancak REST API kullanılarak yöneticiler tarafından devre dışı bırakılabilir. Üretim iş yükleri için Databricks Runtime 11.3 LTS veya üzerini kullanın. Bu işleve erişemiyorsanız çalışma alanı yöneticinize başvurun.
Çalışma alanı dosyalarıyla neler yapabilirsiniz?
Azure Databricks, yerleşik bir dosya düzenleyicisi de dahil olmak üzere birçok çalışma alanı dosya türü için yerel geliştirmeye benzer işlevler sağlar. Tüm dosya türleri için tüm kullanım örnekleri desteklenmez. Örneğin, içeri aktarılan bir dizine veya depoya görüntü ekleyebilirsiniz ancak not defterlerine görüntü ekleyemezsiniz.
Not defteri etkileşimlerindeki tanıdık desenleri kullanarak çalışma alanı dosyalarına erişimi oluşturabilir, düzenleyebilir ve yönetebilirsiniz. Yerel geliştirme gibi çalışma alanı dosyalarından kitaplık içeri aktarma işlemleri için göreli yolları kullanabilirsiniz. Daha ayrıntılı bilgi için bkz.
- Çalışma alanı dosyaları temel kullanımı
- Çalışma alanı dosyalarıyla program aracılığıyla etkileşim kurma
- Python ve R modülleriyle çalışma
- Not defterlerini yönetme
- Dosya ACL'leri
Çalışma alanı dosyalarında depolanan init betiklerinin özel davranışları vardır. Herhangi bir Databricks Runtime sürümünde init betiklerini depolamak ve bunlara başvurmak için çalışma alanı dosyalarını kullanabilirsiniz. Bkz. Çalışma alanı dosyalarında başlatma betiklerini depolama.
Not
Databricks Runtime 14.0 ve üzerinde, yerel olarak yürütülen kod için varsayılan geçerli çalışma dizini (CWD), çalıştırılmakta olan not defterini veya betiği içeren dizindir. Bu, Databricks Runtime 13.3 LTS ve altındaki davranışlarda bir değişikliktir. Bkz. Varsayılan geçerli çalışma dizini nedir?.
Sınırlama
Çalışma alanı dosyaları sınırlamalarının tam listesi Çalışma alanı dosyaları sınırlamaları bölümünde bulunur.
Dosya boyutu sınırı
Tek tek çalışma alanı dosyaları 500 MB ile sınırlıdır.
Kullanıcılar kullanıcı arabiriminden en fazla 500 MB dosya boyutu yükleyebilir. Bir kümeden yazarken izin verilen dosya boyutu üst sınırı 256 MB'tır.
Azure Databricks Container Services ile küme içeren Git klasörlerindeki dosyalar için Databricks Runtime sürümleri
Databricks Runtime 11.3 LTS ve üzerini çalıştıran kümelerde, varsayılan ayarlar Azure Databricks Container Services (DCS) ile Git klasörlerindeki çalışma alanı dosyalarını kullanmanıza olanak tanır.
Databricks Runtime sürüm 10.4 LTS ve 9.1 LTS çalıştıran kümelerde, dockerfile dosyasını DCS içeren bir kümedeki Git klasörlerindeki çalışma alanı dosyalarına erişecek şekilde yapılandırmanız gerekir. İstenen Databricks Runtime sürümü için aşağıdaki dockerfiles dosyasına bakın:
Bkz. Databricks Container Service ile kapsayıcıları özelleştirme
Çalışma alanı dosyalarını etkinleştirme
Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek için, Databricks çalışma alanınıza erişimi olan bir not defterinden veya başka bir ortamdan /api/2.0/workspace-conf REST API'sini çağırın. Çalışma alanı dosyaları varsayılan olarak etkindir.
Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek veya yeniden etkinleştirmek için öğesini çağırın /api/2.0/workspace-conf
ve anahtarın enableWorkspaceFileSystem
değerini alın. olarak ayarlanırsa true
, not defteri olmayan dosyalar çalışma alanınız için zaten etkindir.
Aşağıdaki örnek, çalışma alanı dosyalarının devre dışı bırakılıp bırakılmadığından ve devre dışı bırakıldıysa yeniden etkinleştirmek için bu API'yi bir not defterinden nasıl çağırabileceğinizi gösterir.
Örnek: Databricks çalışma alanı dosya desteğini yeniden etkinleştirmeye yönelik not defteri
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin