VERI YÜKLEME
Şunun için geçerlidir: databricks Runtime denetimi
Verileri, kullanıcı tarafından belirtilen dizinden veya dosyadan bir Hive SerDe tablosuna yükler. Bir dizin belirtilirse, dizindeki tüm dosyalar yüklenir. Bir dosya belirtilirse, yalnızca tek bir dosya yüklenir. Ayrıca deyimi LOAD DATA
isteğe bağlı bir bölüm belirtimi alır. Bir bölüm belirtildiğinde, veri dosyaları (giriş kaynağı bir dizin olduğunda) veya tek dosya (giriş kaynağı bir dosya olduğunda) hedef tablonun bölümüne yüklenir.
Tablo önbelleğe alınırsa, komut tablonun önbelleğe alınmış verilerini ve tabloya başvuran tüm bağımlılarını temizler. Tabloya veya bağımlılara bir sonraki sefer erişildiğinde önbellek gevşek bir şekilde doldurulur.
Sözdizimi
LOAD DATA [ LOCAL ] INPATH path [ OVERWRITE ] INTO TABLE table_name [ PARTITION clause ]
Parametre
Yolu
Dosya sisteminin yolu. Mutlak veya göreli bir yol olabilir.
-
Eklenecek tabloyu tanımlar. Ad , zamana bağlı belirtim içermemelidir. Tablo bulunamazsa Azure Databricks bir TABLE_OR_VIEW_NOT_FOUND hatası oluşturur.
-
Ekleme için hedef bölümü belirten isteğe bağlı bir parametre. Ayrıca bölümü yalnızca kısmen belirtebilirsiniz.
YEREL
Belirtilirse, genellikle dağıtılmış bir depolama alanı olan varsayılan dosya sistemi yerine yerel dosya sisteminde çözümlenmesine neden olur
INPATH
.ÜZERİNE
Varsayılan olarak, tabloya yeni veriler eklenir. Kullanılırsa
OVERWRITE
, tablonun üzerine yeni veriler yazılır.
Örnekler
-- Example without partition specification.
-- Assuming the students table has already been created and populated.
> SELECT * FROM students;
name address student_id
--------- ---------------------- ----------
Amy Smith 123 Park Ave, San Jose 111111
> CREATE TABLE test_load (name VARCHAR(64), address VARCHAR(64), student_id INT) USING HIVE;
-- Assuming the students table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/students' OVERWRITE INTO TABLE test_load;
> SELECT * FROM test_load;
name address student_id
--------- ---------------------- ----------
Amy Smith 123 Park Ave, San Jose 111111
-- Example with partition specification.
> CREATE TABLE test_partition (c1 INT, c2 INT, c3 INT) PARTITIONED BY (c2, c3);
> INSERT INTO test_partition PARTITION (c2 = 2, c3 = 3) VALUES (1);
> INSERT INTO test_partition PARTITION (c2 = 5, c3 = 6) VALUES (4);
> INSERT INTO test_partition PARTITION (c2 = 8, c3 = 9) VALUES (7);
> SELECT * FROM test_partition;
c1 c2 c3
--- --- ---
1 2 3
4 5 6
7 8 9
> CREATE TABLE test_load_partition (c1 INT, c2 INT, c3 INT) USING HIVE PARTITIONED BY (c2, c3);
-- Assuming the test_partition table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/test_partition/c2=2/c3=3'
OVERWRITE INTO TABLE test_load_partition PARTITION (c2=2, c3=3);
> SELECT * FROM test_load_partition;
c1 c2 c3
--- --- ---
1 2 3