Azure Purview'da özel sınıflandırmalar

Bu makalede, veri varlıklarınızı kuruluş için benzersiz olan veri türlerini tanımlamak için nasıl özel sınıflandırmalar oluşturabilirsiniz? Ayrıca veri varlıklarının tamamda belirtilen verileri bulmanızı sağlarken özel sınıflandırma kurallarının oluşturulmasını da açıklar.

Varsayılan sistem sınıflandırmaları

Azure Purview Veri Kataloğu, veri alanınıza sahip olabileceğiniz tipik kişisel veri türlerini temsil eden çok sayıda varsayılan sistem sınıflandırması sağlar. Kullanılabilir sistem sınıflandırmalarının tam listesi için bkz. Azure Purview'da desteklenen sınıflandırmalar.

sınıflandırma seçme

Varsayılan sınıflandırmalardan herhangi biri ihtiyaçlarınızı karşılayamasa özel sınıflandırmalar da oluşturabilirsiniz.

Not

Veri örnekleme kurallarımız hem sisteme hem de özel sınıflandırmalara uygulanır.

Not

Purview özel sınıflandırmaları yalnızca SQL ve CosmosDB gibi yapılandırılmış veri kaynaklarına ve CSV, JSON ve Parquet gibi yapılandırılmış dosya türlerine uygulanır. Doc, PDF ve XLSX gibi yapılandırılmamış veri dosyası türlerine özel sınıflandırma uygulanmaz.

Özel sınıflandırma oluşturma adımları

Özel sınıflandırma oluşturmak için şu adımları izleyin:

  1. Kataloğundan sol menüden Veri Haritası'yi seçin.

  2. Ek açıklama yönetimi altında Sınıflandırmalar'ı seçin.

  3. + Yeni'yi seçin

    Yeni sınıflandırma

Sınıflandırmanıza bir ad ve açıklama verebilirsiniz. Yeni sınıflandırma ekle bölmesi açılır. gibi bir ad aralığı kuralı kullanmak iyi bir your company name.classification name uygulamadır.

Microsoft sistem sınıflandırmaları ayrılmış ad alanı altında MICROSOFT. gruplandı. Örnek olarak MICROSOFT'u kullanabilirsiniz. HÜKÜMET. BİZİ. SOSYAL _ GÜVENLIK _ NUMARASı.

Sınıflandırmanın adı bir harf, ardından harf, sayı ve nokta (.) veya alt çizgi karakter dizisiyle başlamalıdır. Boşluklara izin verilmez. Siz yazarak, UX otomatik olarak kolay bir ad üretir. Bu kolay ad, katalogda bir var ya da bir vara uygulayan kullanıcıların göreceği addır.

Adı kısa tutmak için sistem, aşağıdaki mantığa göre kolay adı oluşturur:

  • Ad alanının son iki kesiminin hepsi kırpıldı.

  • Büyük/büyük/büyük harf, her sözcüğün ilk harfi büyük olacak şekilde ayarlanır.

  • Tüm alt çizgi ( _ ) boşluklarla değiştirilir.

Örneğin, sınıflandırmanızı bir CONTOSO.HR. EMPLOYEE _ ID, kolay ad sistemde Hr.Employee ID olarak depolanır.

Contoso.hr.employee_id

Tamam'ı seçin ve yeni sınıflandırmanız sınıflandırma listenize eklenir.

Özel sınıflandırma

Listeden sınıflandırmayı seçmek sınıflandırma ayrıntıları sayfasını açar. Burada sınıflandırmayla ilgili tüm ayrıntıları bulabilirsiniz.

Bu ayrıntılar kaç örnek olduğunu, resmi adı, ilişkili sınıflandırma kurallarını (varsa) ve sahip adını içerir.

Sınıflandırma seçme

Özel sınıflandırma kuralları

Katalog hizmeti, tarayıcı tarafından belirli veri türlerini otomatik olarak algılamak için kullanılan bir dizi varsayılan sınıflandırma kuralı sağlar. Veri varlıklarınızı bulmakla ilgilenebilirsiniz diğer veri türlerini algılamak için kendi özel sınıflandırma kurallarınızı da ekebilirsiniz. Bu özellik, veri kaynağınız içindeki verileri bulmaya çalışırken güçlü olabilir.

Örneğin, Contoso adlı bir şirketin, ' " employee{GUID} oluşturmak için şirket genelinde Employee sözcüğü ve ardından bir GUID ile standartlaştırılmış çalışan kimlikleri olduğunu " diyelim. Örneğin, çalışan kimliğinin bir örneği gibi EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55 görünüyor.

Contoso, özel bir sınıflandırma kuralı oluşturarak tarama sistemini bu kimliklerin örneklerini bulmak üzere yapılandırıyor. Veri deseniyle eşleşen normal bir ifade (bu durumda) \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$ sn. İsteğe bağlı olarak, veriler genellikle adını bildiğiniz bir sütunda (Çalışan Kimliği veya EmployeeID gibi) varsa, taramayı daha da doğru hale etmek için bir sütun deseni normal ifadesi _ ekleyebilirler. Örnek bir ifade Employee _ | ID EmployeeID'dir.

Tarama sistemi daha sonra bu kuralı kullanarak sütundaki gerçek verileri ve sütun adını inceler ve çalışan kimliği deseninin bulunduğu her örneği tanımlamayı deneyebilir.

Özel sınıflandırma kuralı oluşturma adımları

Özel sınıflandırma kuralı oluşturmak için:

  1. Önceki bölümde verilen yönergeleri izleyerek özel bir sınıflandırma oluşturun. Bu özel sınıflandırmayı sınıflandırma kuralı yapılandırmasına ek olarak sistem sütunda bir eşleşme bulduğunda uygular.

  2. Uygulama simgesini Veri Haritası seçin.

  3. Sınıflandırma kuralları bölümünü seçin.

    Sınıflandırma kuralları kutucuğu

  4. Yeni'yi seçin.

    Yeni sınıflandırma kuralı ekleme

  5. Yeni sınıflandırma kuralı iletişim kutusu açılır. Alanları doldurun ve bir normal ifade kuralı mı yoksa sözlük kuralı mı oluşturularak karar verin.

    Alan Açıklama
    Ad Gereklidir. En fazla 100 karakterdir.
    Description İsteğe bağlı. En fazla 256 karakterdir.
    Sınıflandırma Adı Gereklidir. Tarayıcıya eşleşme bulunursa uygulayacaklarını söylemek için açılan listeden sınıflandırmanın adını seçin.
    Durum Gereklidir. Seçenekler etkin veya devre dışıdır. Varsayılan değer etkindir.

    Yeni sınıflandırma kuralı oluşturma

Normal İfade Kuralı Oluşturma

  1. Normal ifade kuralı oluşturuyorsanız aşağıdaki ekranı görürsünüz. İsteğe bağlı olarak kuralınız için önerilen regex desenleri oluşturmak için kullanılacak bir dosyayı karşıya yükleyebilirsiniz.

    Yeni regex kuralı oluşturma

  2. Önerilen bir regex deseni oluşturmak için dosyayı karşıya yükledikten sonra önerilen desenlerden birini seçin ve önerilen verileri ve sütun desenlerini kullanmak için Desenlere Ekle'yi seçin. Önerilen desenlerde ince ayar veya dosya yüklemeden kendi desenlerinizi de yazabilirsiniz.

    Önerilen regex oluşturma

    Alan Açıklama
    Veri Düzeni İsteğe bağlı. Veri alanında depolanan verileri temsil eden normal bir ifade. Sınır çok büyüktür. Önceki örnekte veri desenleri, sözcük anlamıyla olan bir çalışan kimliğini test Employee{GUID} ediyor.
    Sütun Deseni İsteğe bağlı. Eşleşmek istediğiniz sütun adlarını temsil eden normal bir ifade. Sınır çok büyüktür.
  3. Veri Düzeni altında, sınıflandırmanın uygulanması için tarayıcı tarafından bulunmalıdır bir sütundaki benzersiz veri değeri eşleşmelerinin en düşük yüzdesini ayarlamak için Minimum eşleşme eşiğini kullanabilirsiniz. Önerilen değer %60'tır. Birden çok veri deseni belirtirseniz bu ayar devre dışı bırakılır ve değer %60 olarak sabitlenmiş olur.

    Not

    Minimum eşleşme eşiği en az %1'dir.

  4. Artık kuralınızı doğrular ve oluşturabilirsiniz.

  5. Varlıklarınıza etiket uygulayacaklarını doğrulamak için oluşturma işlemini tamamlamadan önce sınıflandırma kuralını test edin. Kuralda sınıflandırmalar, tıpkı bir taramada olduğu gibi karşıya yüklenen örnek verilere uygulanır. Bu, tüm sistem sınıflandırmalarının ve özel sınıflandırmanın dosyanız içinde yer alan veriyle eşleştirilebilir.

    Giriş dosyaları sınırlandırılmış dosyalar (CSV, PSV, SSV, TSV), JSON veya XML içeriği içerebilir. İçerik, giriş dosyasının dosya uzantısına göre ayrıştırıldı. Sınırlandırılmış veriler, belirtilen türlerden herhangi biri ile eşleşen bir dosya uzantısına sahip olabilir. Örneğin, TSV verileri MySampleData.csv. Sınırlandırılmış içeriğin de en az 3 sütunu olması gerekir.

    Oluşturmadan önce kuralı test etmek

    Test dosyasını karşıya yükledikten sonra uygulanan sınıflandırmaları görüntüleme

Sözlük Kuralı Oluşturma

  1. Sözlük kuralı oluşturuyorsanız aşağıdaki ekranı görürsünüz. Upload tek sütunda oluşturmakta olduğunu sınıflandırma için tüm olası değerleri içeren bir dosya içerir.

    Sözlük kuralı oluşturma

  2. Sözlük oluşturularak minimum eşleşme eşiğini ayarlayabilir ve kuralı gönderebilirsiniz.

    Dictionary-Generated onay işaretiyle sözlük kuralı oluşturun.

Sonraki adımlar

Sınıflandırma kuralınızı oluşturduğunuza göre, taramanız taramada kuralı kullandığı için bir tarama kural kümesine eklenmeye hazırdır. Daha fazla bilgi için bkz. Tarama kuralı kümesi oluşturma.