العناصر المفهرسة جزئيا في eDiscovery
ملاحظة
يسمى التوافق Microsoft 365 الآن Microsoft Purview وقد تم تغيير تسمية الحلول داخل منطقة الامتثال. لمزيد من المعلومات حول Microsoft Purview، راجع إعلان المدونة.
يتضمن بحث eDiscovery Microsoft Purview الذي تقوم بتشغيله من مدخل التوافق في Microsoft Purview العناصر المفهرسة جزئيا في نتائج البحث المقدرة عند تشغيل عملية بحث. العناصر المفهرسة جزئيا هي Exchange عناصر علبة البريد والمستندات على SharePoint ومواقع OneDrive for Business التي لم تتم فهرستها بشكل كامل للبحث لسبب ما. في Exchange، يحتوي العنصر المفهرس جزئيا عادة على ملف (من نوع ملف لا يمكن فهرسته) مرفق برسالة بريد إلكتروني. فيما يلي بعض الأسباب الأخرى التي تجعل العناصر لا يمكن فهرستها للبحث ويتم إرجاعها كعناصر مفهرسة جزئيا عند تشغيل بحث eDiscovery:
نوع الملف غير معترف به أو غير معتمد للفهرسة.
تحتوي الرسائل على ملف مرفق لا يمكن فتحه؛ هذا هو السبب الأكثر شيوعا لعناصر البريد الإلكتروني المفهرسة جزئيا.
نوع الملف معتمد للفهرسة ولكن حدث خطأ فهرسة لملف معين.
عدد الملفات المرفقة برسالة بريد إلكتروني كبير جدا.
ملف مرفق برسالة بريد إلكتروني كبير جدا.
يتم تشفير الملف باستخدام تقنيات غير Microsoft.
الملف محمي بكلمة مرور.
ملاحظة
تحتوي معظم المؤسسات على أقل من 1٪ من المحتوى حسب وحدة التخزين وأقل من 12٪ حسب الحجم الذي تتم فهرسته جزئيا. السبب في الفرق بين وحدة التخزين والحجم هو أن الملفات الكبيرة لديها احتمال أعلى لاحتواء محتوى لا يمكن فهرسته بالكامل.
بالنسبة للتحقيقات القانونية، قد يطلب من مؤسستك مراجعة العناصر المفهرسة جزئيا. يمكنك أيضا تحديد ما إذا كنت تريد تضمين عناصر مفهرسة جزئيا عند تصدير نتائج البحث إلى كمبيوتر محلي أو عند إعداد النتائج للتحليل باستخدام eDiscovery (Premium). لمزيد من المعلومات، راجع التحقق من العناصر المفهرسة جزئيا في eDiscovery.
أنواع الملفات غير مفهرسة للبحث
لا تحتوي بعض أنواع الملفات، مثل ملفات Bitmap أو MP3، على محتوى يمكن فهرسته. ونتيجة لذلك، لا تقوم خوادم فهرسة البحث في Exchange SharePoint بإجراء فهرسة النص الكامل على هذه الأنواع من الملفات. تعتبر هذه الأنواع من الملفات أنواع ملفات غير معتمدة. هناك أيضا أنواع ملفات تم تعطيل فهرسة النص الكامل لها، إما بشكل افتراضي أو من قبل مسؤول. يتم تسمية أنواع الملفات غير المعتمدة والمعطلة كعناصر غير مفهرسة في عمليات البحث في المحتوى. كما ذكر سابقا، يمكن تضمين العناصر المفهرسة جزئيا في مجموعة نتائج البحث عند تشغيل عملية بحث أو تصدير نتائج البحث إلى كمبيوتر محلي أو تحضير نتائج البحث ل eDiscovery (Premium).
للحصول على قائمة بتنسيقات الملفات المعتمدة والمعطلة، راجع المواضيع التالية:
-
- تنسيقات Exchange File المفهرسة بواسطة Exchange Search
-
- Exchange Get-SearchDocumentFormat
يمكن إرجاع الرسائل والمستندات ذات أنواع الملفات المفهرسة جزئيا في نتائج البحث
لا يتم إرجاع كل رسالة بريد إلكتروني تحتوي على مرفق ملف مفهرس جزئيا أو كل مستند SharePoint مفهرس جزئيا تلقائيا كعنصر مفهرس جزئيا. وذلك لأن خصائص الرسالة أو المستند الأخرى، مثل الخاصية "الموضوع " في رسائل البريد الإلكتروني وخصائص "العنوان " أو "الكاتب" للمستندات تتم فهرستها وإتاحتها للبحث فيها. على سبيل المثال، يؤدي البحث عن كلمة أساسية عن "مالي" إلى إرجاع العناصر ذات مرفق ملف مفهرس جزئيا إذا ظهرت هذه الكلمة الأساسية في موضوع رسالة بريد إلكتروني أو في اسم الملف أو عنوان المستند. ومع ذلك، إذا ظهرت الكلمة الأساسية في النص الأساسي للملف فقط، فسيتم إرجاع الرسالة أو المستند كعنصر مفهرس جزئيا.
وبالمثل، يتم تضمين الرسائل التي تحتوي على مرفقات ملفات مفهرسة جزئيا ومستندات من نوع ملف مفهرس جزئيا في نتائج البحث عندما تتطابق خصائص الرسالة أو المستند الأخرى، التي تتم مفهرستها وقابلة للبحث فيها، مع معايير البحث. تتضمن خصائص الرسالة التي تتم فهرستها للبحث التواريخ المرسلة والمستلمة والمرسل والمستلم واسم ملف المرفق والنص في نص الرسالة. تتضمن خصائص المستند المفهرسة للبحث التواريخ التي تم إنشاؤها وتعديلها. لذلك على الرغم من أن مرفق الرسالة قد يكون عنصرا مفهرسا جزئيا، سيتم تضمين الرسالة في نتائج البحث العادية إذا تطابقت قيمة خصائص الرسالة أو المستند الأخرى مع معايير البحث.
للحصول على قائمة بخصائص البريد الإلكتروني والمستند التي يمكنك البحث فيها باستخدام أدوات eDiscovery في مدخل التوافق، راجع استعلامات الكلمات الأساسية وشروط البحث في eDiscovery.
ملاحظة
إذا تم نقل عنصر علبة بريد من مجلد تمت فهرسته إلى مجلد غير مفهرس، يتم تعيين علامة إلى unindex العنصر وتتم إزالة العنصر من الفهرس ولن يكون قابلا للبحث. في وقت لاحق، إذا تم نقل نفس العنصر مرة أخرى إلى مجلد تمت فهرسته، فلن تتم إعادة تعيين العلامة. وهذا يعني أن العنصر سيبقى بدون فهرسة، وغير قابل للبحث.
العناصر المفهرسة جزئيا المضمنة في نتائج البحث
قد تكون مؤسستك مطالبة بتحديد وإجراء تحليل إضافي على العناصر المفهرسة جزئيا لتحديد ماهيتها وما تحتوي عليه وما إذا كانت ذات صلة بالتحقيق المحدد. كما هو موضح سابقا، يتم تضمين العناصر المفهرسة جزئيا في مواقع المحتوى التي يتم البحث فيها تلقائيا مع نتائج البحث المقدرة. لديك خيار تضمين هذه العناصر المفهرسة جزئيا عند تصدير نتائج البحث أو تحضير نتائج البحث ل eDiscovery (Premium).
ضع ما يلي في الاعتبار حول العناصر المفهرسة جزئيا:
عند تشغيل بحث eDiscovery، يتم عرض العدد الإجمالي للعناصر Exchange المفهرسة جزئيا وحجمها (التي يتم إرجاعها بواسطة استعلام البحث) في إحصائيات البحث في صفحة القائمة المنبثقة، ويتم تسميتها كعناصر غير مفهرسة. لا تتضمن الإحصائيات حول العناصر المفهرسة جزئيا المعروضة في صفحة القائمة المنبثقة عناصر مفهرسة جزئيا في مواقع SharePoint أو حسابات OneDrive.
إذا كان البحث الذي تقوم بتصدير النتائج منه بحثا عن مواقع محتوى معينة أو كافة مواقع المحتويات في مؤسستك، فسيتم تصدير العناصر غير المفهرسة من مواقع المحتوى التي تحتوي على عناصر تطابق معايير البحث فقط. بمعنى آخر، إذا لم يتم العثور على أي نتائج بحث في علبة بريد أو موقع، فلن يتم تصدير أي عناصر غير مفهرسة في علبة البريد أو الموقع. والسبب في ذلك هو أن تصدير العناصر المفهرسة جزئيا من الكثير من المواقع في المؤسسة قد يزيد من احتمالية حدوث أخطاء في التصدير ويزيد من الوقت المستغرق لتصدير نتائج البحث وتنزيلها.
لتصدير العناصر المفهرسة جزئيا من كافة مواقع المحتوى للبحث، قم بتكوين البحث لإرجاع كافة العناصر (عن طريق إزالة أي كلمات أساسية من استعلام البحث) ثم تصدير العناصر المفهرسة جزئيا فقط عند تصدير نتائج البحث (بالنقر فقط فوق العناصر التي لها تنسيق غير متعرف عليه، أو مشفرة، أو لم تتم فهرستها لأسباب أخرى ضمن خيارات الإخراج).
إذا اخترت تضمين كافة عناصر علبة البريد في نتائج البحث، أو إذا لم يحدد استعلام البحث أي كلمات أساسية أو حدد نطاق تاريخ فقط، فقد لا يتم نسخ العناصر المفهرسة جزئيا إلى ملف PST الذي يحتوي على العناصر المفهرسة جزئيا. وذلك لأن جميع العناصر، بما في ذلك أي عناصر مفهرسة جزئيا، سيتم تضمينها تلقائيا في نتائج البحث العادية.
لا تتوفر العناصر المفهرسة جزئيا لمعاينتها. يجب تصدير نتائج البحث لعرض العناصر المفهرسة جزئيا التي تم إرجاعها بواسطة البحث.
بالإضافة إلى ذلك، عند تصدير نتائج البحث وتضمين عناصر مفهرسة جزئيا في عملية التصدير، يتم تصدير العناصر المفهرسة جزئيا من عناصر SharePoint إلى مجلد يسمى "غير قابل للفهرسة". عند تصدير عناصر Exchange مفهرسة جزئيا، يتم تصديرها بشكل مختلف استنادا إلى ما إذا كانت العناصر المفهرسة جزئيا تطابق استعلام البحث وتكوين إعدادات التصدير أم لا.
يعرض الجدول التالي سلوك تصدير العناصر المفهرسة والمفهرسة جزئيا وما إذا كان يتم تضمين كل منها لإعدادات تكوين التصدير المختلفة أم لا.
تصدير التكوين العناصر المفهرسة التي تتطابق مع استعلام البحث عناصر مفهرسة جزئيا تتطابق مع استعلام البحث عناصر مفهرسة جزئيا لا تتطابق مع استعلام البحث تصدير العناصر المفهرسة فقط تصدير تم التصدير (مضمن مع العناصر المفهرسة التي يتم تصديرها) لم يتم تصديره تصدير العناصر المفهرسة جزئيا فقط لم يتم تصديره المصدرة (كعناصر مفهرسة جزئيا) المصدرة (كعناصر مفهرسة جزئيا) تصدير العناصر المفهرسة والمفهرسة جزئيا تصدير تم التصدير (مضمن مع العناصر المفهرسة التي يتم تصديرها) المصدرة (كعناصر مفهرسة جزئيا)
الحل البديل لاستخدام نطاق تاريخ لاستبعاد العناصر المفهرسة جزئيا
في البحث عن المحتوى Microsoft Purview eDiscovery (قياسي)، لا يمكنك استخدام نطاق تاريخ لاستبعاد العناصر المفهرسة جزئيا من إرجاعها بواسطة استعلام بحث. بمعنى آخر، لا تزال العناصر المفهرسة جزئيا التي تقع خارج نطاق التاريخ مضمنة كعناصر مفهرسة جزئيا في إحصائيات البحث وعند تصدير العناصر المفهرسة جزئيا. في eDiscovery (Premium)، يمكنك استبعاد العناصر المفهرسة جزئيا باستخدام نطاق تاريخ في استعلام بحث.
كحل بديل لهذا القيد، نوصي بالإجراء التالي.
إنشاء بحث وتشغيله باستخدام استعلام بحث يلبي متطلباتك ويعيد النتائج المطلوبة.
قم بتصدير نتائج البحث من الخطوة 1، ولكن لا تقم بتضمين العناصر المفهرسة جزئيا في التصدير. للقيام بذلك، يمكنك تحديد كافة العناصر، باستثناء العناصر ذات التنسيق غير المتعرف عليه، أو المشفرة، أو التي لم تتم فهرستها لأسباب أخرى خيار التصدير. 1

قم بإنشاء بحث ثان وتشغيله يستخدم نفس استعلام البحث (ويبحث في المواقع نفسها) الذي استخدمته في الخطوة 1. قم بإلحاق العبارة التالية بالاستعلام الأصلي باستخدام عامل التشغيل AND :
<original query> AND ((IndexingErrorCode>0 OR IndexingErrorCode<0) AND sent:date1..date2)ستؤدي إضافة هذه العبارة إلى إرجاع العناصر المفهرسة جزئيا التي تتطابق مع استعلام البحث الأصلي والتي تقع ضمن نطاق تاريخ معين. 2
تصدير نتائج البحث من الخطوة 3، وهذه المرة تتضمن عناصر مفهرسة جزئيا في التصدير. للقيام بذلك، يمكنك تحديد كافة العناصر، بما في ذلك تلك التي تحتوي على تنسيق غير متعرف عليه، مشفرة، أو لم تتم فهرستها لأسباب أخرى خيار التصدير.
ملاحظة
1 ينتج عن إخراج الخطوة 2 تصدير العناصر المفهرسة فقط.
2 يحدد الشرط المستخدم في الخطوة 3 العناصر التي بها أخطاء فهرسة فقط تقع ضمن نطاق التاريخ المحدد. لا ترجع أي عناصر تمت فهرستها بالكامل. وهذا يعني أن العناصر التي تم تصديرها في الخطوة 4 تتضمن فقط العناصر غير المفهرسة التي تقع ضمن نطاق التاريخ. لا يتضمن التصدير عناصر مفهرسة. ونتيجة لذلك، يحتوي الإخراج المدمج للخطوة 2 والخطوة 4 على كافة العناصر المفهرسة وغير المفهرسة التي تقع ضمن نطاق التاريخ المحدد.
استخدم البحث الثاني الذي أنشأته في الخطوة 3 والتصدير المطابق لعرض العناصر المفهرسة جزئيا التي تتطابق مع استعلام البحث الأصلي وفهمها. يتضمن التصدير من البحث الثاني أيضا كافة العناصر المفهرسة جزئيا التي تم تصديرها بحيث يمكنك مراجعتها إذا لزم الأمر.
تلميح
في الإجراء السابق، يمكنك تصدير نتائج البحث الفعلية أو تصدير تقرير فقط.
حدود الفهرسة للرسائل
يصف الجدول التالي حدود الفهرسة التي قد تؤدي إلى إرجاع رسالة بريد إلكتروني كعنصر مفهرس جزئيا في بحث eDiscovery في Microsoft 365.
للحصول على قائمة بحدود الفهرسة لمستندات SharePoint، راجع حدود البحث SharePoint Online.
| حد الفهرسة | الحد الأقصى للقيمة | الوصف |
|---|---|---|
| الحد الأقصى لحجم المرفق (باستثناء ملفات Excel) |
150 ميغابايت |
الحد الأقصى لحجم مرفق البريد الإلكتروني الذي سيتم تحليله للفهرسة. لن يتم تحليل أي مرفق أكبر من هذا الحد للفهرسة، وسيتم وضع علامة على الرسالة التي تحتوي على المرفق على أنها مفهرسة جزئيا. ملاحظه: التحليل هو العملية التي تستخرج فيها خدمة الفهرسة النص من المرفق، وتزيل الأحرف غير الضرورية مثل علامات الترقيم والمسافات، ثم تقسم النص إلى كلمات (في عملية تسمى الرمز المميز)، ثم يتم تخزينها في الفهرس. |
| الحد الأقصى لحجم ملفات Excel |
4 ميغابايت |
الحد الأقصى لحجم ملف Excel موجود على موقع أو مرفق برسالة بريد إلكتروني سيتم تحليلها للفهرسة. لن يتم تحليل أي ملف Excel أكبر من هذا الحد، وسيتم وضع علامة أحادية الفهرسة على الملف أو البريد الإلكتروني الذي يحتوي على مرفق الملف. |
| الحد الأقصى لعدد المرفقات |
250 |
الحد الأقصى لعدد الملفات المرفقة برسالة بريد إلكتروني سيتم تحليلها للفهرسة. إذا كانت الرسالة تحتوي على أكثر من 250 مرفقا، يتم تحليل أول 250 مرفقا وفهرستها، ويتم وضع علامة على الرسالة كفهرسة جزئية لأنها تحتوي على مرفقات إضافية لم يتم تحليلها. |
| الحد الأقصى لعمق المرفق |
30 |
الحد الأقصى لعدد المرفقات المتداخلة التي يتم تحليلها. على سبيل المثال، إذا كانت رسالة بريد إلكتروني تحتوي على رسالة أخرى مرفقة بها وكان للرسالة المرفقة مستند Word مرفق، فسيتم فهرسة مستند Word والرسالة المرفقة. سيستمر هذا السلوك لما يصل إلى 30 مرفقا متداخلا. |
| الحد الأقصى لعدد الصور المرفقة |
0 |
يتم تخطي الصورة المرفقة برسالة بريد إلكتروني بواسطة المحلل ولا تتم فهرستها. |
| الحد الأقصى للوقت المنقضي في تحليل عنصر |
30 ثانية |
يتم قضاء 30 ثانية كحد أقصى في تحليل عنصر للفهرسة. إذا تجاوز وقت التوزيع 30 ثانية، يتم وضع علامة على العنصر على أنه مفهرس جزئيا. |
| الحد الأقصى لإخراج المحلل |
2 مليون حرف |
الحد الأقصى لمقدار إخراج النص من المحلل المفهرس. على سبيل المثال، إذا استخرج المحلل 8 ملايين حرف من مستند، تتم فهرسة أول مليوني حرف فقط. |
| الحد الأقصى للرموز المميزة للتعليق التوضيحي |
2 مليون |
عند فهرسة رسالة بريد إلكتروني، تتم إضافة تعليقات توضيحية إلى كل كلمة باستخدام إرشادات معالجة مختلفة تحدد كيفية فهرسة هذه الكلمة. تسمى كل مجموعة من إرشادات المعالجة رمزا مميزا للتعليق التوضيحي. للحفاظ على جودة الخدمة في Office 365، هناك حد يبلغ 2 مليون رمز مميز للتعليق التوضيحي لرسالة بريد إلكتروني. |
| الحد الأقصى لحجم النص الأساسي في الفهرس |
67 مليون حرف |
إجمالي عدد الأحرف في النص الأساسي لرسالة بريد إلكتروني وكافة مرفقاتها. عند فهرسة رسالة بريد إلكتروني، يتم تسلسل كل النص الموجود في النص الأساسي للرسالة وفي كل المرفقات في سلسلة واحدة. الحد الأقصى لحجم هذه السلسلة المفهرسة هو 67 مليون حرف. |
| الحد الأقصى للرموز المميزة الفريدة في النص الأساسي |
1 مليون |
كما هو موضح سابقا، الرموز المميزة هي نتيجة استخراج النص من المحتوى، وإزالة علامات الترقيم والمسافات، ثم تقسيمها إلى كلمات (تسمى الرموز المميزة) المخزنة في الفهرس. على سبيل المثال، تحتوي العبارة "cat, mouse, bird, dog, dog" على 5 رموز مميزة. ولكن 4 منها فقط هي رموز مميزة فريدة. هناك حد يبلغ 1 مليون رمز مميز فريد لكل رسالة بريد إلكتروني، مما يساعد على منع الفهرس من أن يزداد حجمه باستخدام الرموز المميزة العشوائية. |
مزيد من المعلومات حول العناصر المفهرسة جزئيا
كما ذكر سابقا، نظرا لفهرسة خصائص الرسالة والمستند وبيانات التعريف الخاصة بها، قد ترجع عملية البحث عن الكلمات الأساسية نتائج إذا ظهرت هذه الكلمة الأساسية في بيانات التعريف المفهرسة. ومع ذلك، قد لا ترجع نفس عملية البحث عن الكلمة الأساسية العنصر نفسه إذا ظهرت الكلمة الأساسية فقط في محتوى عنصر بنوع ملف غير معتمد. في هذه الحالة، سيتم إرجاع العنصر كعنصر مفهرس جزئيا.
إذا تم تضمين عنصر مفهرس جزئيا في نتائج البحث لأنه مطابق لمعايير استعلام البحث، فلن يتم تضمينه كعنصر مفهرس جزئيا في إحصائيات البحث المقدرة. علاوة على ذلك، لن يتم تضمينه مع العناصر المفهرسة جزئيا عند تصدير نتائج البحث.
على الرغم من أن نوع الملف معتمد للفهرسة ومفهرس، فقد تكون هناك أخطاء في الفهرسة أو البحث تؤدي إلى إرجاع ملف كعنصر مفهرس جزئيا. على سبيل المثال، قد يكون البحث في ملف Excel كبير ناجحا جزئيا (لأنه تمت فهرسة أول 4 ميغابايت)، ولكنه يفشل بعد ذلك بسبب تجاوز الحد الأقصى لحجم الملف. في هذه الحالة، من الممكن إرجاع الملف نفسه مع نتائج البحث وكعنصر مفهرس جزئيا.
يمكن معاينة الملفات المشفرة باستخدام تقنيات تشفير Microsoft والمرفقة برسالة بريد إلكتروني تتطابق مع معايير البحث وسيتم فك تشفيرها عند تصديرها. في هذا الوقت، تتم فهرسة الملفات المشفرة باستخدام تقنيات تشفير Microsoft (وتخزينها في SharePoint أو OneDrive for Business) بشكل جزئي.
يتم فهرسة رسائل البريد الإلكتروني المشفرة باستخدام S/MIME جزئيا. يتضمن ذلك الرسائل المشفرة مع مرفقات الملفات أو بدونها.
تتم فهرسة رسائل البريد الإلكتروني المحمية باستخدام Azure Rights Management وسيتم تضمينها في نتائج البحث إذا تطابقت مع استعلام البحث. يتم فك تشفير رسائل البريد الإلكتروني المحمية بحقوق ويمكن معاينتها وتصديرها. تتطلب هذه الوظيفة تعيين دور فك تشفير RMS، الذي يتم تعيينه بشكل افتراضي إلى مجموعة دور eDiscover Manager.
إذا قمت بإنشاء قائمة احتجاز مستندة إلى استعلام مقترنة بحالة eDiscovery، يتم وضع جميع العناصر المفهرسة جزئيا قيد الاحتجاز. يتضمن ذلك عناصر مفهرسة جزئيا لا تتطابق مع معايير استعلام البحث ل قائمة الاحتجاز. لمزيد من المعلومات حول إنشاء قوائم احتجاز eDiscovery المستندة إلى الاستعلام، راجع إنشاء قائمة احتجاز eDiscovery.
راجع أيضًا
الملاحظات
إرسال الملاحظات وعرضها المتعلقة بـ