إلغاء التكرار في نتائج بحث eDiscovery
ملاحظة
يسمى التوافق Microsoft 365 الآن Microsoft Purview وقد تم تغيير تسمية الحلول داخل منطقة الامتثال. لمزيد من المعلومات حول Microsoft Purview، راجع إعلان المدونة.
تصف هذه المقالة كيفية عمل إلغاء تكرار نتائج البحث في eDiscovery وتشرح قيود خوارزمية إلغاء التكرار.
عند استخدام أدوات eDiscovery لتصدير نتائج بحث eDiscovery، لديك خيار إلغاء تكرار النتائج التي يتم تصديرها. ماذا يعني هذا؟ عند تمكين إلغاء التكرار (بشكل افتراضي، لا يتم تمكين إلغاء التكرار)، يتم تصدير نسخة واحدة فقط من رسالة البريد الإلكتروني على الرغم من أنه قد تم العثور على مثيلات متعددة لنفس الرسالة في علب البريد التي تم البحث فيها. يساعدك إلغاء التكرار على توفير الوقت عن طريق تقليل عدد العناصر التي يجب عليك مراجعتها وتحليلها بعد تصدير نتائج البحث. ولكن من المهم فهم كيفية عمل إلغاء التكرار وإدراك أن هناك قيود على الخوارزمية قد تتسبب في وضع علامة على عنصر فريد على أنه مكرر أثناء عملية التصدير.
كيفية تحديد الرسائل المكررة
تستخدم أدوات eDiscovery مجموعة من خصائص البريد الإلكتروني التالية لتحديد ما إذا كانت الرسالة مكررة:
InternetMessageId - تحدد هذه الخاصية معرف رسالة إنترنت لرسالة بريد إلكتروني، وهو معرف فريد عمومي يشير إلى إصدار معين من رسالة معينة. يتم إنشاء هذا المعرف بواسطة برنامج عميل البريد الإلكتروني الخاص بالمرسل أو نظام البريد الإلكتروني المضيف الذي يرسل الرسالة. إذا أرسل شخص رسالة إلى أكثر من مستلم واحد، فسيكون معرف رسالة الإنترنت هو نفسه لكل مثيل من الرسالة. ستتلقى المراجعات اللاحقة للرسالة الأصلية معرف رسالة مختلف.
ConversationTopic - تحدد هذه الخاصية موضوع مؤشر ترابط المحادثة لرسالة. قيمة الخاصية ConversationTopic هي السلسلة التي تصف الموضوع العام للمحادثة. تتكون المحادثة من رسالة أولية وكافة الرسائل المرسلة للرد على الرسالة الأولية. الرسائل داخل المحادثة نفسها لها نفس القيمة للخاصية ConversationTopic . عادة ما تكون قيمة هذه الخاصية هي سطر الموضوع من الرسالة الأولية التي أفرزت المحادثة.
BodyTagInfo - هذه خاصية مخزن Exchange داخلية. يتم حساب قيمة هذه الخاصية عن طريق التحقق من السمات المختلفة في النص الأساسي للرسالة. يتم استخدام هذه الخاصية لتحديد الاختلافات في النص الأساسي للرسائل.
أثناء عملية تصدير eDiscovery، تتم مقارنة هذه الخصائص الثلاث لكل رسالة تطابق معايير البحث. إذا كانت هذه الخصائص متطابقة لرسالتين (أو أكثر)، فسيتم تحديد هذه الرسائل على أنها مكررة والنتيجة هي أنه سيتم تصدير نسخة واحدة فقط من الرسالة إذا تم تمكين إلغاء التكرار. تعرف الرسالة التي يتم تصديرها باسم "العنصر المصدر". يتم تضمين معلومات حول الرسائل المكررة في تقارير Results.csv وتقارير Manifest.xml المضمنة في نتائج البحث التي تم تصديرها. في ملف Results.csv ، يتم تعريف رسالة مكررة عن طريق وجود قيمة في العمود "تكرار إلى عنصر ". تتطابق القيمة الموجودة في هذا العمود مع القيمة الموجودة في عمود "هوية العنصر" للرسالة التي تم تصديرها.
تعرض الرسومات التالية كيفية عرض الرسائل المكررة في تقاريرResults.csv وتقارير Manifest.xml التي يتم تصديرها مع نتائج البحث. لا تتضمن هذه التقارير خصائص البريد الإلكتروني الموضحة سابقا، والتي تستخدم في خوارزمية إلغاء التكرار. بدلا من ذلك، تتضمن التقارير الخاصية "هوية العنصر" التي تم تعيينها للعناصر بواسطة مخزن Exchange.
تقرير Results.csv (يتم عرضه في Excel)

تقرير Manifest.xml (يتم عرضه في Excel)

بالإضافة إلى ذلك، يتم تضمين خصائص أخرى من الرسائل المكررة في تقارير التصدير. يتضمن ذلك علبة البريد التي توجد فيها الرسالة المكررة، وما إذا كانت الرسالة قد تم إرسالها إلى مجموعة توزيع، وما إذا كانت الرسالة نسخة أو نسخة مخفية إلى مستخدم آخر.
قيود خوارزمية إلغاء التكرار
هناك بعض القيود المعروفة لخوارزمية إلغاء التكرار التي قد تتسبب في وضع علامة على العناصر الفريدة على أنها تكرارات. من المهم فهم هذه القيود حتى تتمكن من تحديد ما إذا كنت تريد استخدام ميزة إلغاء التكرار الاختيارية أم لا.
هناك حالة واحدة قد تحدد فيها ميزة إلغاء التكرار عن طريق الخطأ الرسالة على أنها مكررة ولا تقوم بتصديرها (ولكن لا تزال تقتبسها على أنها مكررة في تقارير التصدير). هذه هي الرسائل التي يقوم المستخدم بتحريرها ولكن لا يرسلها. على سبيل المثال، لنفترض أن المستخدم يحدد رسالة في Outlook، وينسخ محتويات الرسالة، ثم يلصقها في رسالة جديدة. ثم يغير المستخدم إحدى النسخ عن طريق إزالة مرفق أو إضافته، أو تغيير سطر الموضوع أو النص الأساسي نفسه. إذا كانت هاتين الرسالتين تتطابقان مع استعلام بحث eDiscovery، فسيتم تصدير رسالة واحدة فقط إذا تم تمكين إلغاء التكرار عند تصدير نتائج البحث. لذلك على الرغم من تغيير الرسالة الأصلية أو الرسالة المنسوخة، لم يتم إرسال أي من الرسائل المنقحة وبالتالي لم يتم تحديث قيم خصائص InternetMessageId و ConversationTopic و BodyTagInfo . ولكن كما هو موضح سابقا، سيتم سرد كلتا الرسالتين في تقارير التصدير
يمكن أيضا وضع علامة على الرسائل الفريدة كرسائل مكررة عند تمكين ميزة حماية صفحة النسخ عند الكتابة، كما هو الحال في حالة وجود علبة بريد قيد الاحتجاز في التقاضي أو In-Place احتجاز. تنسخ ميزة النسخ عند الكتابة الرسالة الأصلية (وتحفظها في مجلد "الإصدارات" في مجلد "العناصر القابلة للاسترداد" الخاص بالمستخدم) قبل حفظ مراجعة العنصر الأصلي. في هذه الحالة، قد تعتبر النسخة المنقحة والرسالة الأصلية (في مجلد العناصر القابلة للاسترداد) رسائل مكررة وبالتالي سيتم تصدير واحدة منها فقط.
هام
إذا كانت قيود خوارزمية إلغاء التكرار قد تؤثر على جودة نتائج البحث، فلا يجب تمكين إلغاء التكرار عند تصدير العناصر. إذا كان من غير المحتمل أن تكون الحالات الموضحة في هذا القسم عاملا في نتائج البحث، وكنت تريد تقليل عدد العناصر التي من المرجح أن تكون مكررة، فيجب عليك التفكير في تمكين إلغاء التكرار.
معلومات إضافية
تنطبق المعلومات الواردة في هذه المقالة عند تصدير نتائج البحث باستخدام إحدى أدوات eDiscovery التالية:
البحث عن المحتوى في مركز التوافق في Office 365
In-Place eDiscovery في Exchange Online
مركز eDiscovery في SharePoint Online
لمزيد من المعلومات حول تصدير نتائج البحث، راجع:
الملاحظات
إرسال الملاحظات وعرضها المتعلقة بـ