FSCK REPAIR TABLE

Şunlar için geçerlidir:check marked yes Databricks SQL check marked yes Databricks Runtime

Delta tablosunun işlem günlüğünden dosya girdilerini kaldırır ve bu girdiler artık temel alınan dosya sisteminde bulunamaz. Bu dosyalar el ile silindiğinde bu durum oluşabilir.

Sözdizimi

FSCK REPAIR TABLE table_name [DRY RUN]

Parametreler

  • Table_name

    Var olan bir Delta tablosunu tanımlar. Ad bir zamansal belirtim içermemelidir.

  • KURU ÇALıŞTıRMA

    Bir Delta tablosunun FSCK REPAIR TABLEişlem günlüğünden tarafından kaldırılacak dosya girişleri hakkındaki bilgileri gösterir çünkü bunlar artık temel alınan dosya sisteminde bulunamaz. Bu dosyalar el ile silindiğinde bu durum oluşabilir. Dosya girdileri bir veri dosyası yolu veya veri dosyası yolu ile silme vektör dosyası yolunun birleşimidir. Veri dosyası eksik olduğunda, silme vektör dosyası eksik olduğunda veya her ikisi de eksik olduğunda dosya girdileri çıktıya eklenir.

    Varsayılan olarak, DRY RUN yalnızca ilk 1000 dosyayı döndürür. Komutu not defterinde çalıştırmadan önce SparkSession değişkenini spark.databricks.delta.fsck.maxNumEntriesInResult daha yüksek bir değere ayarlayarak bu eşiği artırabilirsiniz.

İadeler

Formun A raporu için DRY RUN :

  • dataFilePath STRING NOT NULL
  • dataFileMissing BOOLEAN NOT NULL
  • deletionVectorPath STRING
  • deletionVectorFileMissing BOOLEAN NOT NULL

Örnekler

— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet            true               null                     false

— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet           false            dv1.bin                      true