VERI YÜKLEME

Makale
03/01/2024

Şunun için geçerlidir: evet olarak işaretlendi databricks Runtime denetimi

Verileri, kullanıcı tarafından belirtilen dizinden veya dosyadan bir Hive SerDe tablosuna yükler. Bir dizin belirtilirse, dizindeki tüm dosyalar yüklenir. Bir dosya belirtilirse, yalnızca tek bir dosya yüklenir. Ayrıca deyimi LOAD DATA isteğe bağlı bir bölüm belirtimi alır. Bir bölüm belirtildiğinde, veri dosyaları (giriş kaynağı bir dizin olduğunda) veya tek dosya (giriş kaynağı bir dosya olduğunda) hedef tablonun bölümüne yüklenir.

Tablo önbelleğe alınırsa, komut tablonun önbelleğe alınmış verilerini ve tabloya başvuran tüm bağımlılarını temizler. Tabloya veya bağımlılara bir sonraki sefer erişildiğinde önbellek gevşek bir şekilde doldurulur.

Sözdizimi

LOAD DATA [ LOCAL ] INPATH path [ OVERWRITE ] INTO TABLE table_name [ PARTITION clause ]

Parametre

Yolu

Dosya sisteminin yolu. Mutlak veya göreli bir yol olabilir.
Table_name

Eklenecek tabloyu tanımlar. Ad , zamana bağlı belirtim içermemelidir. Tablo bulunamazsa Azure Databricks bir TABLE_OR_VIEW_NOT_FOUND hatası oluşturur.
PARTITION yan tümcesi

Ekleme için hedef bölümü belirten isteğe bağlı bir parametre. Ayrıca bölümü yalnızca kısmen belirtebilirsiniz.
YEREL

Belirtilirse, genellikle dağıtılmış bir depolama alanı olan varsayılan dosya sistemi yerine yerel dosya sisteminde çözümlenmesine neden olur INPATH .
ÜZERİNE

Varsayılan olarak, tabloya yeni veriler eklenir. Kullanılırsa OVERWRITE , tablonun üzerine yeni veriler yazılır.

Örnekler

-- Example without partition specification.
-- Assuming the students table has already been created and populated.
> SELECT * FROM students;
      name                address student_id
 --------- ---------------------- ----------
 Amy Smith 123 Park Ave, San Jose     111111

> CREATE TABLE test_load (name VARCHAR(64), address VARCHAR(64), student_id INT) USING HIVE;

-- Assuming the students table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/students' OVERWRITE INTO TABLE test_load;

> SELECT * FROM test_load;
      name                address student_id
 --------- ---------------------- ----------
 Amy Smith 123 Park Ave, San Jose     111111

-- Example with partition specification.
> CREATE TABLE test_partition (c1 INT, c2 INT, c3 INT) PARTITIONED BY (c2, c3);

> INSERT INTO test_partition PARTITION (c2 = 2, c3 = 3) VALUES (1);

> INSERT INTO test_partition PARTITION (c2 = 5, c3 = 6) VALUES (4);

> INSERT INTO test_partition PARTITION (c2 = 8, c3 = 9) VALUES (7);

> SELECT * FROM test_partition;
  c1  c2  c3
 --- --- ---
   1   2   3
   4   5   6
   7   8   9

> CREATE TABLE test_load_partition (c1 INT, c2 INT, c3 INT) USING HIVE PARTITIONED BY (c2, c3);

-- Assuming the test_partition table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/test_partition/c2=2/c3=3'
      OVERWRITE INTO TABLE test_load_partition PARTITION (c2=2, c3=3);

> SELECT * FROM test_load_partition;
  c1  c2  c3
 --- --- ---
   1   2   3

VERI YÜKLEME

Sözdizimi

Parametre

Örnekler

İlgili makaleler

Ek kaynaklar