Azure Purview'da özel sınıflandırmalar
Bu makalede, veri varlıklarınızı kuruluş için benzersiz olan veri türlerini tanımlamak için nasıl özel sınıflandırmalar oluşturabilirsiniz? Ayrıca veri varlıklarının tamamda belirtilen verileri bulmanızı sağlarken özel sınıflandırma kurallarının oluşturulmasını da açıklar.
Varsayılan sistem sınıflandırmaları
Azure Purview Veri Kataloğu, veri alanınıza sahip olabileceğiniz tipik kişisel veri türlerini temsil eden çok sayıda varsayılan sistem sınıflandırması sağlar. Kullanılabilir sistem sınıflandırmalarının tam listesi için bkz. Azure Purview'da desteklenen sınıflandırmalar.
Varsayılan sınıflandırmalardan herhangi biri ihtiyaçlarınızı karşılayamasa özel sınıflandırmalar da oluşturabilirsiniz.
Not
Veri örnekleme kurallarımız hem sisteme hem de özel sınıflandırmalara uygulanır.
Not
Purview özel sınıflandırmaları yalnızca SQL ve CosmosDB gibi yapılandırılmış veri kaynaklarına ve CSV, JSON ve Parquet gibi yapılandırılmış dosya türlerine uygulanır. Doc, PDF ve XLSX gibi yapılandırılmamış veri dosyası türlerine özel sınıflandırma uygulanmaz.
Özel sınıflandırma oluşturma adımları
Özel sınıflandırma oluşturmak için şu adımları izleyin:
Kataloğundan sol menüden Veri Haritası'yi seçin.
Ek açıklama yönetimi altında Sınıflandırmalar'ı seçin.
+ Yeni'yi seçin
Sınıflandırmanıza bir ad ve açıklama verebilirsiniz. Yeni sınıflandırma ekle bölmesi açılır. gibi bir ad aralığı kuralı kullanmak iyi bir your company name.classification name uygulamadır.
Microsoft sistem sınıflandırmaları ayrılmış ad alanı altında MICROSOFT. gruplandı. Örnek olarak MICROSOFT'u kullanabilirsiniz. HÜKÜMET. BİZİ. SOSYAL _ GÜVENLIK _ NUMARASı.
Sınıflandırmanın adı bir harf, ardından harf, sayı ve nokta (.) veya alt çizgi karakter dizisiyle başlamalıdır. Boşluklara izin verilmez. Siz yazarak, UX otomatik olarak kolay bir ad üretir. Bu kolay ad, katalogda bir var ya da bir vara uygulayan kullanıcıların göreceği addır.
Adı kısa tutmak için sistem, aşağıdaki mantığa göre kolay adı oluşturur:
Ad alanının son iki kesiminin hepsi kırpıldı.
Büyük/büyük/büyük harf, her sözcüğün ilk harfi büyük olacak şekilde ayarlanır.
Tüm alt çizgi ( _ ) boşluklarla değiştirilir.
Örneğin, sınıflandırmanızı bir CONTOSO.HR. EMPLOYEE _ ID, kolay ad sistemde Hr.Employee ID olarak depolanır.
Tamam'ı seçin ve yeni sınıflandırmanız sınıflandırma listenize eklenir.
Listeden sınıflandırmayı seçmek sınıflandırma ayrıntıları sayfasını açar. Burada sınıflandırmayla ilgili tüm ayrıntıları bulabilirsiniz.
Bu ayrıntılar kaç örnek olduğunu, resmi adı, ilişkili sınıflandırma kurallarını (varsa) ve sahip adını içerir.
Özel sınıflandırma kuralları
Katalog hizmeti, tarayıcı tarafından belirli veri türlerini otomatik olarak algılamak için kullanılan bir dizi varsayılan sınıflandırma kuralı sağlar. Veri varlıklarınızı bulmakla ilgilenebilirsiniz diğer veri türlerini algılamak için kendi özel sınıflandırma kurallarınızı da ekebilirsiniz. Bu özellik, veri kaynağınız içindeki verileri bulmaya çalışırken güçlü olabilir.
Örneğin, Contoso adlı bir şirketin, ' " employee{GUID} oluşturmak için şirket genelinde Employee sözcüğü ve ardından bir GUID ile standartlaştırılmış çalışan kimlikleri olduğunu " diyelim. Örneğin, çalışan kimliğinin bir örneği gibi EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55 görünüyor.
Contoso, özel bir sınıflandırma kuralı oluşturarak tarama sistemini bu kimliklerin örneklerini bulmak üzere yapılandırıyor. Veri deseniyle eşleşen normal bir ifade (bu durumda) \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$ sn. İsteğe bağlı olarak, veriler genellikle adını bildiğiniz bir sütunda (Çalışan Kimliği veya EmployeeID gibi) varsa, taramayı daha da doğru hale etmek için bir sütun deseni normal ifadesi _ ekleyebilirler. Örnek bir ifade Employee _ | ID EmployeeID'dir.
Tarama sistemi daha sonra bu kuralı kullanarak sütundaki gerçek verileri ve sütun adını inceler ve çalışan kimliği deseninin bulunduğu her örneği tanımlamayı deneyebilir.
Özel sınıflandırma kuralı oluşturma adımları
Özel sınıflandırma kuralı oluşturmak için:
Önceki bölümde verilen yönergeleri izleyerek özel bir sınıflandırma oluşturun. Bu özel sınıflandırmayı sınıflandırma kuralı yapılandırmasına ek olarak sistem sütunda bir eşleşme bulduğunda uygular.
Uygulama simgesini Veri Haritası seçin.
Sınıflandırma kuralları bölümünü seçin.
Yeni'yi seçin.
Yeni sınıflandırma kuralı iletişim kutusu açılır. Alanları doldurun ve bir normal ifade kuralı mı yoksa sözlük kuralı mı oluşturularak karar verin.
Alan Açıklama Ad Gereklidir. En fazla 100 karakterdir. Description İsteğe bağlı. En fazla 256 karakterdir. Sınıflandırma Adı Gereklidir. Tarayıcıya eşleşme bulunursa uygulayacaklarını söylemek için açılan listeden sınıflandırmanın adını seçin. Durum Gereklidir. Seçenekler etkin veya devre dışıdır. Varsayılan değer etkindir.
Normal İfade Kuralı Oluşturma
Normal ifade kuralı oluşturuyorsanız aşağıdaki ekranı görürsünüz. İsteğe bağlı olarak kuralınız için önerilen regex desenleri oluşturmak için kullanılacak bir dosyayı karşıya yükleyebilirsiniz.
Önerilen bir regex deseni oluşturmak için dosyayı karşıya yükledikten sonra önerilen desenlerden birini seçin ve önerilen verileri ve sütun desenlerini kullanmak için Desenlere Ekle'yi seçin. Önerilen desenlerde ince ayar veya dosya yüklemeden kendi desenlerinizi de yazabilirsiniz.
Alan Açıklama Veri Düzeni İsteğe bağlı. Veri alanında depolanan verileri temsil eden normal bir ifade. Sınır çok büyüktür. Önceki örnekte veri desenleri, sözcük anlamıyla olan bir çalışan kimliğini test Employee{GUID}ediyor.Sütun Deseni İsteğe bağlı. Eşleşmek istediğiniz sütun adlarını temsil eden normal bir ifade. Sınır çok büyüktür. Veri Düzeni altında, sınıflandırmanın uygulanması için tarayıcı tarafından bulunmalıdır bir sütundaki benzersiz veri değeri eşleşmelerinin en düşük yüzdesini ayarlamak için Minimum eşleşme eşiğini kullanabilirsiniz. Önerilen değer %60'tır. Birden çok veri deseni belirtirseniz bu ayar devre dışı bırakılır ve değer %60 olarak sabitlenmiş olur.
Not
Minimum eşleşme eşiği en az %1'dir.
Artık kuralınızı doğrular ve oluşturabilirsiniz.
Varlıklarınıza etiket uygulayacaklarını doğrulamak için oluşturma işlemini tamamlamadan önce sınıflandırma kuralını test edin. Kuralda sınıflandırmalar, tıpkı bir taramada olduğu gibi karşıya yüklenen örnek verilere uygulanır. Bu, tüm sistem sınıflandırmalarının ve özel sınıflandırmanın dosyanız içinde yer alan veriyle eşleştirilebilir.
Giriş dosyaları sınırlandırılmış dosyalar (CSV, PSV, SSV, TSV), JSON veya XML içeriği içerebilir. İçerik, giriş dosyasının dosya uzantısına göre ayrıştırıldı. Sınırlandırılmış veriler, belirtilen türlerden herhangi biri ile eşleşen bir dosya uzantısına sahip olabilir. Örneğin, TSV verileri MySampleData.csv. Sınırlandırılmış içeriğin de en az 3 sütunu olması gerekir.
Sözlük Kuralı Oluşturma
Sözlük kuralı oluşturuyorsanız aşağıdaki ekranı görürsünüz. Upload tek sütunda oluşturmakta olduğunu sınıflandırma için tüm olası değerleri içeren bir dosya içerir.
Sözlük oluşturularak minimum eşleşme eşiğini ayarlayabilir ve kuralı gönderebilirsiniz.
Sonraki adımlar
Sınıflandırma kuralınızı oluşturduğunuza göre, taramanız taramada kuralı kullandığı için bir tarama kural kümesine eklenmeye hazırdır. Daha fazla bilgi için bkz. Tarama kuralı kümesi oluşturma.