جدول إصلاح FSCK

ينطبق على:check marked yes Databricks SQL check marked yes Databricks Runtime

إزالة إدخالات الملف من سجل المعاملات لجدول Delta الذي لم يعد من الممكن العثور عليه في نظام الملفات الأساسي. يمكن أن يحدث هذا عندما يتم حذف هذه الملفات يدويا.

بناء الجملة

FSCK REPAIR TABLE table_name [DRY RUN]

المعلمات

  • table_name

    تعريف جدول Delta موجود. يجب ألا يتضمن الاسم مواصفات زمنية.

  • تشغيل جاف

    يعرض معلومات حول إدخالات الملف التي ستتم إزالتها من سجل المعاملات لجدول Delta بواسطة FSCK REPAIR TABLE، لأنه لم يعد من الممكن العثور عليها في نظام الملفات الأساسي. يمكن أن يحدث هذا عندما يتم حذف هذه الملفات يدويا. إدخالات الملف هي إما مسار ملف بيانات أو مزيج من مسار ملف بيانات ومسار ملف متجه الحذف. يتم تضمين إدخالات الملف في الإخراج عندما يكون ملف البيانات مفقودا، أو عندما يكون ملف متجه الحذف مفقودا، أو عندما يكون كلاهما مفقودا.

    بشكل افتراضي، DRY RUN يتم إرجاع أول 1000 ملف فقط. يمكنك زيادة هذا الحد عن طريق تعيين متغير spark.databricks.delta.fsck.maxNumEntriesInResult SparkSession إلى قيمة أعلى قبل تشغيل الأمر في دفتر ملاحظات.

عمليات الإرجاع

للحصول على DRY RUN تقرير النموذج:

  • dataFilePath STRING NOT NULL
  • dataFileMissing BOOLEAN NOT NULL
  • deletionVectorPath STRING
  • deletionVectorFileMissing BOOLEAN NOT NULL

الأمثلة

— Assume file1.parquet is missing and no DV is expected.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet            true               null                     false

— Assume dv1.bin is missing.
> FSCK REPAIR TABLE t DRY RUN;
  dataFilePath dataFileMissing deletionVectorPath deletionVectorFileMissing
 ------------- --------------- ------------------ -------------------------
 file1.parquet           false            dv1.bin                      true