كيف يعمل Microsoft Purview
هنا سنلقي نظرة على كيفية عمل Microsoft Purview، خلف الكواليس. ستتعرف على نظرية التشغيل الأساسية وراء عمل Microsoft Purview لتعيين مصادر البيانات وفحصها. وتشمل المجالات الرئيسية التي سنركز عليها ما يلي:
- تحميل البيانات في مخطط البيانات «Data Map»
- استعراض المعلومات والبحث عنها
تحميل البيانات في مخطط البيانات «Data Map»
«Purview Data Map» هي خريطة موحدة لأصول البيانات وعلاقاتها التي تمكنك من حوكمة أكثر فعالية للبيانات الخاصة بك. وهو رسم بياني معرفي وأحد ركائز«Purview Data Catalog» وجميع الميزات التي يقدمها. إنه قابل للتطوير وقادر على تلبية متطلبات الامتثال الخاصة بمؤسستك.
توريد البيانات
يبدأ توريد بياناتك بعملية تقوم فيها بتسجيل مصادر البيانات. يدعم Microsoft Purview مجموعة من مصادر البيانات تحتوي على خيارات محلية ومتعددة السحابة وبرامج ممنوحة للاستخدام كخدمة (SaaS). يمكنك تسجيل مصادر البيانات المختلفة حتى يمكن لـ Microsoft Purview التعرف عليها. تبقى البيانات في موقعها ولا يتم ترحيلها إلى أي نظام أساسي آخر.
يتم تسجيل مصدر بيانات من داخل مدخل Azure. بمجرد أن يكتمل تكوين خدمة Microsoft Purview في Azure، يمكنك استخدام مدخل إدارة Microsoft Purview لتسجيل مصادر البيانات الخاصة بك.
يتطلب كل نوع من أنواع مصادر البيانات التي تختارها معلومات محددة لإكمال التسجيل. على سبيل المثال، إذا كانت مصادر البيانات موجودة في اشتراك Azure، فسوف تختار اسم حساب الاشتراك واسم حساب التخزين. الصورة التالية مثال على اختيار مصدر تخزين Azure Blob.
وسيكون لكل مصدر بيانات متطلبات محددة للمصادقة والتكوين، للسماح بفحص الأصول في مصدر البيانات الذي تحدده. إذا كان لديك بيانات مخزنة في مستودع Amazon S3 النموذجية، فستحتاج إلى توفير تكوين للاتصال. لهذه الخدمة، استخدم «Purview» لتوفير حساب Microsoft مع وصول آمن إلى AWS، حيث سيتم تشغيل أداة فحص «Purview». تستخدم أداة فحص Purview قناة الوصول إلى مستودعات Amazon S3 لقراءة بياناتك، ثم يقوم بإصدار تقارير بنتائج الفحص، بما في ذلك بيانات التعريف والتصنيف فقط إلى Azure. استخدم تصنيف Purview وتقارير العلامات لتحليل نتائج فحص البيانات ومراجعتها.
ملاحظة
تحقق من موصل Microsoft Purview للحصول على وثائق Amazon S3 للحصول على دعم المنطقة المتعلق بمصادر AWS S3.
في Microsoft Purview، هناك بعض خيارات المصادقة يمكنك استخدامها عندما تحتاج الخدمة إلى فحص مصادر البيانات. ومن هذه الخيارات:
- Microsoft Purview Managed Identity
- «Account Key» (باستخدام Key Vault)
- «SQL Authentication» (باستخدام Key Vault)
- «Service Principal» (باستخدام Key Vault)
تعيين البيانات
خريطة البيانات هي المنصة الأساسية لـ Microsoft Purview. مخطط البيانات = أصول البيانات + دورة الحياة + التصنيفات + سياق الأعمال. يقوم العملاء بإنشاء رسم بياني معرفي للبيانات الواردة من مجموعة من المصادر. يسهل «Purview» عمليات التسجيل، وفحص البيانات وتصنيفها تلقائيًا على نطاق واسع. ضمن مخطط البيانات، يمكنك تحديد نوع مصدر البيانات مع تفاصيل أخرى حول الأمان والفحص وما إلى ذلك. كما تتيح لك خريطة البيانات استخدام مجموعات كاملة.
المجموعات هي طريقة لتجميع أصول البيانات في مجموعات منطقية (فئات) لتبسيط إدارة واكتشاف الأصول داخل الكتالوج.
عند تحديد طريقة عرض «Map» يتم عرض مصادر البيانات في رسم بياني، إلى جانب المجموعات التي قمت بإنشائها لهم.
فحص البيانات
بمجرد تسجيل مصادر البيانات الخاصة بك، ستحتاج إلى عمل فحص لتتمكن من الوصول إلى بيانات التعريف وتصفح معلومات الأصول. يمكنك تكوين قواعد الفحص للبيانات التي تريد فحصها. في كتالوج Microsoft Purview، يمكنك إنشاء مجموعات قواعد الفحص لتمكينك من فحص مصادر البيانات بسرعة في مؤسستك.
مجموعة قواعد الفحص هي حاوية لتجميع مجموعة من قواعد الفحص معًا بحيث يمكنك ربطها بسهولة بفحص ما. تتيح لك مجموعة قواعد الفحص تحديد أنواع الملفات لاستخراج المخطط وتصنيفه، كما تتيح لك تحديد أنواع ملفات مخصصة جديدة. على سبيل المثال، قد تقوم بإنشاء قاعدة فحص افتراضي لكل نوع من أنواع مصادر البيانات، ثم استخدام مجموعات قواعد الفحص هذه افتراضيًا لكل عمليات الفحص داخل الشركة. قد تحتاج أيضا إلى أن يقوم المستخدمون الذين لديهم الأذونات المناسبة بإنشاء مجموعات قواعد فحص أخرى ذات تكوينات مختلفة بناءً على حاجة العمل.
يتطلب فحص مصادر البيانات إدخال بيانات الاعتماد لهذه المصادر. يمكنك تخزين بيانات الاعتماد في Azure Key Vault من أجل الأمان وسهولة الوصول بواسطة قواعد الفحص. يأتي مدخل إدارة Microsoft Purview مع مجموعات قواعد فحص النظام الموجودة التي يمكنك تحديدها عند إنشاء قاعدة فحص جديدة، أو يمكنك تحديد مجموعة قواعد فحص مخصصة.
يمكنك أيضا تحديد أنواع الملفات لتضمينها في الفحص. سيتم استخدام أنواع الملفات في استخراج المخطط وتصنيف البيانات. يتضمن دعم نوع الملف المضمن الأنواع التالية:
- CSV
- JSON
- PSV
- SSV
- TSV
- TXT
- XML
- PARQUET
- AVRO
- ORC
- أنواع ملفات المستندات (.doc، pdf، xls، إلخ)
يمكنك تحديد النظام وقواعد التصنيف المخصصة التي تريد تشغيلها. قواعد تصنيف النظام هي نفس أنواع المعلومات الحساسة في Microsoft 365، التي سوف تتيح لك توسيع نهج وضع علامات البيانات الحساسة الخاصة بك في مدخل توافق Microsoft Purview ليمتد إلى مخازن Microsoft Purview المدعومة.
التصنيف
يتم استخدام بيانات التعريف للمساعدة في وصف البيانات التي يتم فحصها وتوفيرها في الكتالوج. أثناء تكوين مجموعة الفحص، يمكنك تحديد قواعد التصنيف لتطبيقها أثناء الفحص، وستكون أيضاً بمثابة بيانات تعريف. تندرج قواعد التصنيف ضمن خمس فئات رئيسية:
- الحكومة - تغطي سمات مثل بطاقات الهوية الحكومية وأرقام رخص القيادة وأرقام جوازات السفر وما إلى ذلك.
- المالية - تغطي سمات مثل أرقام الحسابات المصرفية أو أرقام بطاقات الائتمان.
- شخصي - معلومات شخصية مثل سن الشخص وتاريخ الميلاد وعنوان البريد الإلكتروني ورقم الهاتف وما إلى ذلك.
- الأمان - سمات مثل كلمات المرور التي قد يتم تخزينها.
- متنوعة - سمات غير مشمولة في الفئات الأخرى.
بعد تسجيل مصدر بيانات، يمكنك بعد ذلك إثراء بيانات التعريف الخاصة به. يمكن للمستخدم الذي قام بتسجيل مصدر البيانات أو أي مستخدم آخر في المؤسسة إضافة بيانات التعريف. يمكن لأي مستخدم التعليق على مصدر بيانات من خلال توفير أوصاف أو علامات أو بيانات تعريف أخرى لطلب الوصول إلى مصدر البيانات. هذه البيانات التعريفية الوصفية هي استكمال لبيانات التعريف الهيكلية، مثل أسماء الأعمدة وأنواع البيانات، المسجلة من مصدر البيانات.
اكتشاف وفهم مصادر البيانات واستخدامها هو الغرض الأساسي من تسجيل المصادر. قد يحتاج مستخدمو المؤسسة إلى بيانات لذكاء الأعمال أو تطوير التطبيقات أو علم البيانات أو أي مهمة أخرى تتطلب البيانات الصحيحة. ويعتمد المستخدمون على تجربة اكتشاف كتالوج البيانات للعثور بسرعة على البيانات التي تتطابق مع احتياجاتهم، وفهم البيانات لتقييم ملاءمتها لهذا الغرض، واستهلاك البيانات عن طريق فتح مصدر البيانات في الأداة التي يختارونها.
وفي الوقت نفسه، يمكن للمستخدمين المساهمة في الكتالوج عن طريق وضع علامات وتوثيق وشرح مصادر البيانات التي تم تسجيلها بالفعل. كما يمكنهم تسجيل مصادر بيانات جديدة، بعد قيام مجتمع مستخدمي الكتالوج باكتشافها وفهمها واستهلاكها.
تصفح وبحث
يسمح لك Microsoft Purview بالبحث عن المعلومات من خريطة البيانات باستخدام «Purview Catalog». يمكنك إجراء بحث مستند إلى النص ودمج سياق العمل في البحث أيضا.
استخدم سياق العمل للبحث عن المعلومات من كتالوج «Purview». يمكنك تعريف مسردات الأعمال (استيراد مجمع للمسارد الموجودة أيضا) وتطبيق سياق العمل على الأصول في «Data Map». يمكنهم بعد ذلك استخدام سياق العمل هذا لاستعراض المعلومات والبحث عنها من «Data Map».
تمكين الاكتشاف السهل باستخدام:
- البحث الدلالي والتصفح
- مسرد الأعمال وسير العمل
- نسب البيانات مع المصادر والمالكين والتحويلات ودورة حياة البيانات
دورة حياة البيانات
يركز مفهوم نسب البيانات على دورة حياة البيانات. دورة الحياة تهتم بمراحل مختلفة قد تمر بها البيانات. يتم الحصول على البيانات ونقلها وتخزينها طوال دورة الحياة. قد تخضع البيانات أيضا لتحولات في عمليات تحويل / استخراج تحويل الحمل (ELT / ETL).
يمكن أن تقدم نسب البيانات رؤى حول دورة حياة البيانات من خلال النظر إلى خط أنابيب البيانات. يمكنك استخدام النسب لتحديد السبب الجذري للمشكلات، وإجراء تحليل جودة البيانات، والتحقق من التوافق.
يمثل Microsoft Purview نسب البيانات هذا في نموذج مرئي، حيث يظهر حركة البيانات بداية من المصدر وصولاً إلى الوجهة.
هل تحتاج إلى مساعدة؟ راجع دليل استكشاف الأخطاء وإصلاحها الذي نقدمه أو يمكنك توفير ملاحظات معينة عبر الإبلاغ عن مشكلة.

