Jangkauan (pecahan data)

Tabel dipartisi sejauh mana, atau pecahan data. Setiap tingkat adalah segmen horizontal tabel yang berisi data dan metadata seperti waktu pembuatannya dan tag opsional. Penyatuan semua tingkatan ini berisi seluruh himpunan data tabel. Jangkauan didistribusikan secara merata di seluruh simpul dalam kluster, dan di-cache di SSD lokal dan memori untuk performa yang dioptimalkan.

Jangkauan tidak dapat diubah, yang berarti dapat dikueri, ditetapkan ulang ke simpul yang berbeda, atau dihilangkan dari tabel tetapi tidak pernah dimodifikasi. Modifikasi data terjadi dengan membuat jangkauan baru dan secara transaksional menukar jangkauan lama dengan yang baru. Kekekalan jangkauan memberikan manfaat seperti peningkatan ketahanan dan pembalikan yang mudah ke rekam jepret sebelumnya.

Jangkauan menyimpan kumpulan rekaman yang diatur secara fisik dalam kolom, memungkinkan pengodean dan pemadatan data yang efisien. Untuk menjaga efisiensi kueri, tingkat yang lebih kecil digabungkan menjadi jangkauan yang lebih besar sesuai dengan kebijakan penggabungan dan kebijakan sharding yang dikonfigurasi. Menggabungkan jangkauan mengurangi overhead manajemen dan menyebabkan pengoptimalan indeks dan kompresi yang ditingkatkan.

Siklus hidup tingkat umum adalah sebagai berikut:

  1. jangkauan dibuat oleh operasi penyerapan.
  2. Jangkauan digabungkan dengan jangkauan lain.
  3. Jangkauan gabungan (mungkin yang melacak silsilahnya ke tingkat lain) akhirnya dihilangkan karena kebijakan penyimpanan.

Waktu pembuatan jangkauan

Dua nilai tanggalwaktu dilacak per tingkat: MinCreatedOn dan MaxCreatedOn. Nilai-nilai ini awalnya sama tetapi dapat berubah ketika jangkauan digabungkan dengan tingkat lain. Ketika jangkauan digabungkan dengan jangkauan lain, nilai-nilai baru disesuaikan dengan nilai minimum dan maksimum asli dari jangkauan yang digabungkan.

Waktu pembuatan jangkauan digunakan untuk tujuan berikut:

  • Retensi: Jangkauan yang dibuat sebelumnya dihilangkan sebelumnya.
  • Penembolokan: Jangkauan yang dibuat baru-baru ini disimpan dalam cache panas.
  • Pengambilan sampel: Tingkat terbaru lebih disukai saat menggunakan operasi kueri seperti ambil.

Untuk menimpa waktu pembuatan sejauh mana, berikan creationTime alternatif dalam properti penyerapan data. Ini dapat berguna untuk tujuan retensi, seperti jika Anda ingin menyerap ulang data tetapi tidak ingin data muncul seolah-olah tiba terlambat.

Catatan

Perhitungan untuk menghapus jangkauan berdasarkan waktu menggunakan waktu pembuatan jangkauan terbaru dalam jangkauan gabungan.