Azure Purview'da taramalar ve alma

Bu makale, Azure Purview'daki Tarama ve Alma özelliklerine genel bir bakış sağlar. Bu özellikler, Purview aracılığıyla verilerinizi keşfetmeye ve yönetmeye başlamak üzere veri haritasını ve veri kataloğunu doldurmak için Purview hesabınıza bağlanmanızı sağlar.

Tarama

Veri kaynakları Purview hesabınıza kaydedildikten sonra, sonraki adım veri kaynaklarını taramaktır. Tarama işlemi veri kaynağıyla bağlantı oluşturur ve adlar, dosya boyutu, sütunlar gibi teknik meta verileri yakalar. Ayrıca yapılandırılmış veri kaynakları için şemayı ayıklar, şemalara sınıflandırmalar uygular ve Purview hesabınız bir Microsoft 365 Güvenlik ve Uyumluluk Merkezi'ne (SCC)bağlı ise duyarlılık etiketleri uygular. Tarama işlemi hemen çalıştırılmalıdır veya Purview hesabınız güncel tutmak için düzenli aralıklarla çalıştırılmalıdır.

Her tarama için, yalnızca ihtiyacınız olan bilgileri almak için kaynaklarınızı tarayabilecek özelleştirmeler uygulayabilirsiniz.

Taramalar için kimlik doğrulama yöntemi seçme

Purview varsayılan olarak güvenlidir. Parolalar veya gizli diziler doğrudan Purview'da depolanmayacak, bu nedenle kaynaklarınız için bir kimlik doğrulama yöntemi seçmeniz gerekir. Purview hesabınız için kimlik doğrulamasının dört olası yolu vardır, ancak her veri kaynağı için tüm yöntemler desteklanmaz.

  • Yönetilen Kimlik
  • Hizmet Sorumlusu
  • SQL Kimlik Doğrulaması
  • Hesap Anahtarı veya Temel Kimlik Doğrulaması

Yönetilen Kimlik, her veri kaynağı için kimlik bilgilerini depolama ve yönetme ihtiyacı ortadan kaldıran tercih edilen kimlik doğrulama yöntemidir. Bu, siz ve takımınız için taramalar için kimlik doğrulaması ayarlamaya ve sorun gidermeye harcadığınız zamanı önemli ölçüde azaltır. Purview hesabınız için yönetilen kimliği etkinleştirebilirsiniz. Bu kimlik, Azure Active Directory hesabın yaşam döngüsüne bağlanır.

Taramanızı kapsamla

Bir kaynağı tararken, veri kaynağının tamamını tarama veya taramak için yalnızca belirli varlıkları (klasörler/tablolar) seçebilirsiniz. Kullanılabilir seçenekler tarama kaynağına bağlıdır ve hem tek kullanımlık hem de zamanlanmış taramalar için tanımlanabilir.

Örneğin, bir Azure SQL Veritabanı için tarama oluştururken ve çalıştırarakhangi tabloların taranmayacaklarını seçebilir veya veritabanının tamamını seçebilirsiniz.

Tarama kuralı kümesi

Tarama kuralı kümesi, bir taramanın kaynaklarından biri üzerinde çalıştırıken ne tür bilgiler alacacazı belirler. Kullanılabilir kurallar, taramanız gereken kaynağın türüne bağlıdır, ancak taramanız gereken dosya türleri ve ihtiyacınız olan sınıflandırma türleri gibi şeyleri içerir.

Birçok veri kaynağı türü için zaten kullanılabilen sistem taraması kural kümeleri vardır, ancak taramalarınızı kuruluşa uyarlamak için kendi tarama kuralı kümelerinizi de oluşturabilirsiniz.

Taramanızı zamanlama

Purview, seçtiğiniz belirli bir zamanda haftalık veya aylık tarama seçeneği sunar. Haftalık taramalar, geliştirme aşamasında olan veya sık sık değişiklik yapılan yapılara sahip veri kaynakları için uygun olabilir. Aylık tarama, sık değişmeyen veri kaynakları için daha uygundur. En iyi yöntem, taramak istediğiniz kaynağın yöneticisiyle birlikte çalışmak ve kaynakta işlem taleplerinin düşük olduğu bir zamanı belirlemektir.

Taramalar silinen varlıkları nasıl algılar?

Azure Purview kataloğu yalnızca tarama çalıştıran veri deposu durumunun farkındadır. Katalogda bir dosyanın, tablonun veya kapsayıcının silinp silinmemiş olduğunu bilmek için son tarama çıktısını geçerli tarama çıkışıyla karşılaştırıldığında. Örneğin, Azure Data Lake 2. Nesil hesabında en son tarama Depolama klasör1 adlı bir klasöre sahip olduğunu varsayalım. Aynı hesap yeniden tarandığında klasör1 eksik olur. Bu nedenle katalog, klasörün silinmiş olduğunu varsayıyor.

Silinen dosyaları algılama

Eksik dosyaları algılama mantığı, aynı kullanıcı ve farklı kullanıcılar tarafından yapılan birden çok taramada çalışır. Örneğin, bir kullanıcının A, B ve C klasörlerinden Data Lake Depolama 2. Nesil veri deposu üzerinde tek kullanımlık bir tarama çalıştıracağını varsayalım. Daha sonra aynı hesapta bulunan farklı bir kullanıcı, aynı veri deposuna sahip C, D ve E klasörlerini tek kez tarar. C klasörü iki kez taranmış olduğundan katalog olası silme işlemlerini denetler. Ancak A, B, D ve E klasörleri yalnızca bir kez taranmış ve katalog silinmiş varlıkları denetlemez.

Silinen dosyaları kataloğun dışında tutmak için düzenli taramalar çalıştırmanız önemlidir. Katalog, başka bir tarama çalıştırana kadar silinmiş varlıkları algılayamayay olduğundan tarama aralığı önemlidir. Bu nedenle taramaları belirli bir depoda ayda bir kez çalıştırıyorsanız katalog, bir ay sonra bir sonraki taramayı çalıştırmadan bu depoda silinmiş veri varlıklarını algılayamayacak.

Data Lake Depolama 2. Nesil gibi büyük veri depolarını numaralara 1. Nesil olarak numaralarsanız, bilgileri kaçırmanın birden çok yolu (numaralama hataları ve bırakılan olaylar dahil) vardır. Belirli bir tarama, bir dosyanın oluşturulmuş veya silinmiş olduğunu kaçırabilirsiniz. Bu nedenle, katalog bir dosyanın silindiği kesin değilse katalogdan silinmez. Bu strateji, taranan veri depolamada mevcut olmayan bir dosya katalogda hala mevcut olduğunda hatalar olabilir. Bazı durumlarda, bir veri deposu belirli silinmiş varlıkları yakalamadan önce iki veya üç kez taranmış olabilir.

Not

Silinmek üzere işaretlenmiş varlıklar başarılı bir taramadan sonra silinir. Silinen varlıklar işlenmeden ve silinmeden önce kataloğunda bir süre görünmeye devam eder.

Alma

Tarama işlemi tarafından tanımlanan teknik meta veriler veya sınıflandırmalar daha sonra Veri Alımı'ne gönderilir. Veri eşlemesi doldurmaktan alma işlemi sorumludur ve Purview tarafından yönetilir. Veri alımı taramadan gelen girişi analiz eder,kaynak kümesi desenlerini uygular, kullanılabilir veri verisi bilgilerini yükler ve ardından veri eşlemesini otomatik olarak yükler. Varlıklar/şemalar ancak veri alımı tamamlandıktan sonra keşfedilme veya seçim olabilir. Bu nedenle taramanız tamamlandıktan sonra varlıklarınızı veri haritasında veya katalogda göremenize gerek yoksa, veri alımı işleminin tamamlandıktan sonra bitmelerini beklemeniz gerekir.

Sonraki adımlar

Daha fazla bilgi için veya kaynakları taramaya yönelik belirli yönergeler için aşağıdaki bağlantıları izleyin.