Geçmiş verileri Azure Veri Gezgini alma

Azure Veri Gezgini'a ekleme sırasında sık karşılaşılan bir senaryo, bazen backfill olarak da adlandırılan geçmiş verilerini almaktır. bu işlem, mevcut bir depolama sisteminden bir tabloya veri alımını içerir ve bu da bir kapsam koleksiyonudur.

Uzantıların oluşturma zamanını verilerin oluşturulduğu zamana ayarlamak için creationTime alma özelliğini kullanarak geçmiş verileri almanızı öneririz. Alım bölümleme ölçütü olarak oluşturma zamanını kullanmak, verilerinizi önbellek ve bekletme ilkelerinize göre eskitebilir ve zaman filtrelerini daha verimli hale getirir.

Varsayılan olarak, kapsamlar için oluşturma süresi verilerin alınma zamanına ayarlanır ve bu da beklediğiniz davranışı üretmeyebilir. Örneğin, önbellek süresi 30 gün ve saklama süresi iki yıl olan bir tablonuz olduğunu varsayalım. Normal akışta, üretildiği şekilde alınan veriler 30 gün boyunca önbelleğe alınır ve ardından soğuk depolama alanına taşınır. İki yıl sonra, oluşturma zamanına bağlı olarak eski veriler günde bir kez kaldırılır. Ancak, varsayılan olarak verilerin alındığı zaman olarak oluşturma zamanıyla işaretlendiği iki yıllık geçmiş verileri alırsanız. Bu, aşağıdaki nedenden dolayı istenen sonucu üretmeyebilir:

  • Tüm veriler önbellekte kalır ve tahmin ettiğinizden daha fazla önbellek kullanarak 30 gün boyunca orada kalır.
  • Eski veriler günde bir kez kaldırılmaz; bu nedenle veriler kümede gerekenden daha uzun süre saklanır ve iki yıl sonra hepsi aynı anda kaldırılır.
  • Daha önce kaynak sistemde tarihe göre gruplandırılmış veriler artık aynı ölçüde birlikte toplu olarak toplanarak verimsiz sorgulara yol açabilir.

Varsayılan oluşturma zamanı kullanılarak geçmiş verileri alma işleminin beklenen ve gerçek sonucunu gösteren diyagram.

Bu makalede geçmiş verileri bölümlemeyi öğreneceksiniz:

  • creationTime Alma sırasında alma özelliğini kullanma (önerilir)

    Mümkün olduğunda, dosya veya blob yolundan ayıklayarak uzantıların creationTimeoluşturma zamanını ayarlamanıza olanak tanıyan alma özelliğini kullanarak geçmiş verileri alın. Klasör yapınız oluşturma tarihi deseni kullanmıyorsa, dosyanızı veya blob yolunuzu oluşturma zamanını yansıtacak şekilde yeniden yapılandırmanızı öneririz. Bu yöntem kullanılarak veriler tabloya doğru oluşturma zamanıyla alınır ve önbellek ve saklama süreleri doğru şekilde uygulanır.

    Not

    Varsayılan olarak, uzantılar oluşturma zamanına (alma) göre bölümlenir ve çoğu durumda veri bölümleme ilkesi ayarlamanız gerekmez.

  • Alma sonrasında bölümleme ilkesi kullanma

    Alma özelliğini kullanamıyorsanız creationTime , örneğin oluşturma zamanını denetleyememenize neden olan Azure Cosmos DB bağlayıcısını kullanarak veri alımı gerçekleştiriyorsanız veya klasör yapınızı yeniden yapılandıramıyorsanız, bölümleme ilkesini kullanarak aynı etkiyi elde etmek için veri alımından sonra tabloyu yeniden bölümleyebilirsiniz. Ancak bu yöntem, ilke özelliklerini iyileştirmek için biraz deneme ve hata gerektirebilir ve alım özelliğini kullanmaktan creationTime daha az verimlidir. Bu yöntemi yalnızca alma özelliğini kullanmak creationTime mümkün olmadığında öneririz.

Önkoşullar

Geçmiş verileri alma

Alma sırasında alma özelliğini kullanarak creationTime geçmiş verileri bölümlemenizi kesinlikle öneririz. Ancak, bu yöntemi kullanamıyorsanız, bölümleme ilkesi kullanarak veri alımından sonra tabloyu yeniden bölümleyebilirsiniz.

LightIngest, mevcut bir depolama sisteminden Azure Veri Gezgini geçmiş verilerini yüklemek için yararlı olabilir. Komut satırı bağımsız değişkenlerinin listesini kullanarak kendi komutunuzu derleyebilmenize karşın, bu makalede bir alma sihirbazı aracılığıyla bu komutun nasıl otomatik olarak oluşturulabileceği gösterilir. Komutu oluşturmaya ek olarak, bu işlemi kullanarak yeni bir tablo oluşturabilir ve şema eşlemesi oluşturabilirsiniz. Bu araç, veri kümenizden şema eşlemesi çıkartır.

Hedef

  1. Azure Veri Gezgini web kullanıcı arabiriminin sol menüsünde Sorgu'yu seçin.

  2. Verileri almak istediğiniz veritabanına sağ tıklayın ve ardından LightIngest'i seçin.

    Veritabanı daha fazla menüsünü gösteren Azure Veri Gezgini web kullanıcı arabiriminin ekran görüntüsü.

    Veri alma penceresi açılır ve Hedef sekmesi seçili durumdadır. Küme ve Veritabanı alanları otomatik olarak doldurulur.

  3. Bir hedef tablo seçin. Verileri yeni bir tabloya almak istiyorsanız Yeni tablo'yu seçin ve bir tablo adı girin.

    Not

    Tablo adları boşluk, alfasayısal, kısa çizgi ve alt çizgi gibi en fazla 1024 karakter olabilir. Özel karakterler desteklenmez.

    Hedef veritabanını ve tabloyu gösteren hedef sekmenin ekran görüntüsü.

  4. İleri: Kaynak'ı seçin.

Source

  1. Kaynak seç'in altında URL Ekle'yi veya Kapsayıcı seç'i seçin.

    • URL eklerken Kaynağa bağlan altında kapsayıcının hesap anahtarını veya SAS URL'sini belirtin. SAS URL'sini el ile veya otomatik olarak oluşturabilirsiniz.

    • Depolama hesabınızdan bir kapsayıcı seçerken açılan menülerden Depolama aboneliğinizi, Depolama hesabınızı ve Kapsayıcı'yı seçin.

      Depolama aboneliğinden ve hesabından kapsayıcı seçme iletişim kutusunun ekran görüntüsü.

    Not

    Veri alımı en fazla 6 GB'lık dosya boyutunu destekler. Öneri, 100 MB ile 1 GB arasında dosyaları almaktır.

  2. LightIngest kullanarak alım işlemi için ek ayarlar tanımlamak için Gelişmiş ayarlar'ı seçin.

    LightIngest aracını içeren alım işlemi için gelişmiş ayarları seçme işleminin ekran görüntüsü.

  3. Gelişmiş yapılandırma bölmesinde, aşağıdaki tabloya göre En Açık ayarları tanımlayın.

    LightIngest aracını içeren alım işlemi için ek ayarları gösteren gelişmiş yapılandırma bölmesinin ekran görüntüsü.

    Özellik Açıklama
    Oluşturma zamanı düzeni Oluşturulan uzantının alma süresi özelliğini bir desenle geçersiz kılmak için belirtin; örneğin, kapsayıcının klasör yapısına göre bir tarih uygulamak için. Ayrıca bkz . Oluşturma zamanı düzeni.
    Blob adı deseni Alınacak dosyaları tanımlamak için kullanılan deseni belirtin. Verilen kapsayıcıdaki blob adı deseni ile eşleşen tüm dosyaları alın. Joker karakterleri destekler. Çift tırnak içine alınması önerilir.
    Tag Alınan verilere atanmış bir etiket . Etiket herhangi bir dize olabilir.
    Dosya miktarını sınırla Alınabilecek dosya sayısını belirtin. Belirtilen sayıya kadar blob adı deseni ile eşleşen ilk n dosyaları alır.
    Alımın tamamlanmasını beklemeyin Ayarlanırsa, alma işlemini izlemeden blobları alım için kuyruğa alır. Ayarlanmadıysa LightIngest, alım tamamlanana kadar alım durumunu yoklama işlemine devam eder.
    Yalnızca seçili öğeleri görüntüle Kapsayıcıdaki dosyaları listeleyin, ancak almaz.
  4. Kaynak sekmesine dönmek için Bitti'yi seçin.

    1. İsteğe bağlı olarak, verileri yalnızca belirli bir klasör yolundaki veya belirli bir dosya uzantısına sahip dosyaları almak üzere filtrelemek için Dosya Filtreleri'ni seçin.

      Yeni veri alma ekranının kaynak sekmesindeki verileri filtreleme işleminin ekran görüntüsü.

      Varsayılan olarak, kapsayıcıdaki dosyalardan biri rastgele seçilir ve tablonun şemasını oluşturmak için kullanılır.

    2. İsteğe bağlı olarak, Şema tanımlama dosyası altında kullanılacak dosyayı belirtebilirsiniz.

  5. Tablo sütunu yapılandırmanızı görüntülemek ve düzenlemek için İleri: Şema'ya tıklayın.

Şema

Şema sekmesi verilerin önizlemesini sağlar.

LightIngest komutunu oluşturmak için İleri: Alımı Başlat'ı seçin.

İsteğe bağlı olarak:

  • Açılan menüden istediğiniz biçimi seçerek otomatik olarak çıkarılan Veri biçimini değiştirin.
  • Otomatik olarak çıkarsanan Eşleme adını değiştirin. Alfasayısal karakterler ve alt çizgi kullanabilirsiniz. Boşluklar, özel karakterler ve kısa çizgiler desteklenmez.
  • Varolan bir tabloyu kullanırken, tablo şeması seçili biçimle eşleşiyorsa Geçerli tablo şemasını tutabilirsiniz .
  • Girdilerinizden oluşturulan otomatik komutları görüntülemek ve kopyalamak için Komut görüntüleyicisi'ni seçin.
  • Sütunları düzenleme. Kısmi veri önizleme altında, tablonun çeşitli yönlerini değiştirmek için sütun açılan menülerini seçin.

Tabloda yapabileceğiniz değişiklikler aşağıdaki parametrelere bağlıdır:

  • Tablo türü yeni veya var
  • Eşleme türü yeni veya var
Tablo türü Eşleme türü Kullanılabilir ayarlamalar
Yeni tablo Yeni eşleme Veri türünü değiştirme, Sütunu yeniden adlandırma, Yeni sütun, Sütunu sil, Sütunu güncelleştir, Artan düzende sırala, Azalan düzende sırala
Varolan tablo Yeni eşleme Yeni sütun (daha sonra veri türünü değiştirebileceğiniz, yeniden adlandırabileceğiniz ve güncelleştirebileceğiniz),
Sütunu güncelleştir, Artan düzende sırala, Azalan düzende sırala
Mevcut eşleme Artan düzende sırala, Azalan düzende sırala

Not

Yeni sütun eklerken veya bir sütunu güncelleştirirken eşleme dönüşümlerini değiştirebilirsiniz. Daha fazla bilgi için bkz . Eşleme dönüştürmeleri

Alma

  1. Tablo, eşleme ve LightIngest komutu yeşil onay işaretleri ile işaretlendikten sonra, oluşturulan LightIngest komutunu kopyalamak için Oluşturulan komut kutusunun sağ üst köşesindeki kopyala simgesini seçin.

    Komutun oluşturulduğu Özet sekmesinin ekran görüntüsü. Oluşturulan komut kutusunun üzerindeki kopyala simgesini kullanarak komutu kopyalayabilirsiniz.

    Not

    Gerekirse LightIngest'i İndir'i seçerek LightIngest aracını indirebilirsiniz.

  2. Alma işlemini tamamlamak için kopyalanan komutu kullanarak LightIngest'i çalıştırmanız gerekir.