بيانات الفهرس من Azure Data Lake Storage Gen2
في هذه المقالة، تعرف على كيفية تكوين مفهرس يستورد المحتوى من Azure Data Lake Storage (ADLS) Gen2 ويجعله قابلا للبحث في البحث المعرفي في Azure. المدخلات إلى المفهرس هي النقط الخاصة بك ، في حاوية واحدة. الإخراج هو فهرس بحث يحتوي على محتوى قابل للبحث وبيانات وصفية مخزنة في حقول فردية.
تكمل هذه المقالة إنشاء مفهرس يحتوي على معلومات خاصة بالفهرسة من ADLS Gen2. يستخدم واجهات برمجة تطبيقات REST لإظهار سير عمل مكون من ثلاثة أجزاء مشترك بين جميع المفهرسين: إنشاء مصدر بيانات وإنشاء فهرس وإنشاء مفهرس. يحدث استخراج البيانات عند إرسال طلب إنشاء مفهرس.
للحصول على نموذج تعليمات برمجية في C#، راجع Index Data Lake Gen2 باستخدام Azure AD على GitHub.
المتطلبات الأساسية
ADLS Gen2 مع تمكين مساحة الاسم الهرمية . يتوفر ADLS Gen2 من خلال Azure Storage. عند إعداد حساب تخزين، يتوفر لديك خيار تمكين مساحة الاسم الهرمية، وتنظيم الملفات في تسلسل هرمي من الدلائل والدلائل الفرعية المتداخلة. من خلال تمكين مساحة اسم هرمية، يمكنك تمكين ADLS Gen2.
تتضمن مستويات الوصول ل ADLS Gen2 الساخنة والباردة والأرشيفية. يمكن الوصول إلى الساخنة والباردة فقط بواسطة مفهرسي البحث.
بقع تحتوي على نص. إذا كان لديك بيانات ثنائية، يمكنك تضمين إثراء الذكاء الاصطناعي لتحليل الصور. لا يمكن أن يتجاوز محتوى Blob حدود المفهرس لطبقة خدمة البحث.
أذونات القراءة على تخزين Azure. تتضمن سلسلة اتصال "الوصول الكامل" مفتاحا يمنح حق الوصول إلى المحتوى، ولكن إذا كنت تستخدم أدوار Azure بدلا من ذلك، فتأكد من أن الهوية المدارة لخدمة البحث لديها أذونات Storage Blob Data Reader .
عميل REST، مثل Postman أو Visual Studio Code مع ملحق Azure Cognitive Search لإرسال مكالمات REST التي تنشئ مصدر البيانات والفهرس والمفهرس.
ملاحظة
يقوم ADLS Gen2 بتنفيذ نموذج التحكم في الوصول الذي يدعم كل من التحكم في الوصول المستند إلى دور Azure (Azure RBAC) وقوائم التحكم في الوصول الشبيهة ب POSIX (ACLs) على مستوى blob. لا يدعم Azure Cognitive Search الأذونات على مستوى المستند. يتمتع جميع المستخدمين بنفس مستوى الوصول إلى جميع المحتويات القابلة للبحث والاسترداد في الفهرس. إذا كانت الأذونات على مستوى المستند أحد متطلبات التطبيق، ففكر في اقتطاع الأمان كحل محتمل.
تنسيقات المستندات المعتمدة
يمكن لمفهرس ADLS Gen2 استخراج النص من تنسيقات المستندات التالية:
- CSV (راجع فهرسة نقاط CSV)
- يمل
- EPUB
- جي زد
- HTML
- JSON (انظر فهرسة نقاط JSON)
- KML (XML للتمثيلات الجغرافية)
- تنسيقات Microsoft Office: DOCX / DOC / DOCM ، XLSX / XLS / XLSM ، PPTX / PPT / PPTM ، MSG (رسائل البريد الإلكتروني Outlook) ، XML (كل من 2003 و 2006 WORD XML)
- تنسيقات المستندات المفتوحة: ODT و ODS و ODP
- ملفات النص العادي (انظر أيضا فهرسة النص العادي)
- آر تي إف
- XML
- ZIP
تحديد النقط التي يجب فهرستها
قبل إعداد الفهرسة، راجع بيانات المصدر لتحديد ما إذا كان ينبغي إجراء أي تغييرات مقدما. يمكن للمفهرس فهرسة المحتوى من حاوية واحدة في كل مرة. بشكل افتراضي ، تتم معالجة جميع النقاط الموجودة في الحاوية. لديك العديد من الخيارات لمعالجة أكثر انتقائية:
ضع النقاط في مجلد ظاهري. يتضمن تعريف مصدر بيانات المفهرس معلمة "استعلام" يمكنها أخذ مجلد ظاهري. إذا قمت بتحديد مجلد ظاهري، فهرسة تلك النقاط الموجودة في المجلد فقط.
قم بتضمين أو استبعاد النقاط حسب نوع الملف. يمكن أن تساعدك قائمة تنسيقات المستندات المدعومة في تحديد النقاط التي يجب استبعادها. على سبيل المثال، قد ترغب في استبعاد ملفات الصور أو الصوت التي لا توفر نصا قابلا للبحث. يتم التحكم في هذه القدرة من خلال إعدادات التكوين في المفهرس.
تضمين أو استبعاد النقط التعسفية. إذا كنت ترغب في تخطي نقطة معينة لأي سبب من الأسباب، يمكنك إضافة خصائص وقيم بيانات التعريف التالية إلى النقاط في Blob Storage. عندما يواجه مفهرس هذه الخاصية، فإنه يتخطى النقطة أو محتواها في تشغيل الفهرسة.
اسم الخاصية قيمة العقار التوضيح "AzureSearch_Skip" "true"يرشد مفهرس الفقاعة إلى تخطي النقطة تماما. لا تتم محاولة استخراج البيانات الوصفية أو المحتوى. هذا مفيد عندما تفشل نقطة معينة بشكل متكرر وتقاطع عملية الفهرسة. "AzureSearch_SkipContent" "true"يتخطى المحتوى ويستخرج البيانات الوصفية فقط. هذا يعادل الإعداد الموضح في إعدادات التكوين "dataToExtract" : "allMetadata"، فقط نطاق إلى نقطة معينة.
إذا لم تقم بإعداد معايير التضمين أو الاستبعاد، فسيقوم المفهرس بالإبلاغ عن نقطة غير مؤهلة كخطأ والمضي قدما. في حالة حدوث أخطاء كافية، قد تتوقف المعالجة. يمكنك تحديد تفاوت الخطأ في إعدادات تكوين المفهرس.
عادة ما ينشئ المفهرس مستند بحث واحد لكل نقطة، حيث يتم التقاط محتوى النص وبيانات التعريف كحقول قابلة للبحث في فهرس. إذا كانت النقط عبارة عن ملفات كاملة ، فيمكنك تحليلها في مستندات بحث متعددة. على سبيل المثال، يمكنك تحليل الصفوف في ملف CSV لإنشاء مستند بحث واحد لكل صف.
فهرسة البيانات الوصفية للنقطة
يمكن أيضا فهرسة البيانات الوصفية ل Blob ، وهذا مفيد إذا كنت تعتقد أن أيا من خصائص بيانات التعريف القياسية أو المخصصة ستكون مفيدة في الفلاتر والاستعلامات.
يتم استخراج خصائص بيانات التعريف المحددة من قبل المستخدم حرفيا. لتلقي القيم ، يجب عليك تعريف الحقل في فهرس البحث من النوع Edm.String، بنفس اسم مفتاح بيانات التعريف الخاص بالنقطة. على سبيل المثال ، إذا كانت النقطة تحتوي على مفتاح Sensitivity بيانات تعريف ذو قيمة High، فيجب عليك تحديد حقل مسمى Sensitivity في فهرس البحث الخاص بك وسيتم ملؤه بالقيمة High.
يمكن استخراج خصائص البيانات الوصفية القياسية للنقطة إلى حقول تحمل نفس الاسم والكتابة، كما هو موضح أدناه. يقوم مفهرس blob تلقائيا بإنشاء تعيينات حقول داخلية لخصائص البيانات الوصفية للنقطة هذه، وتحويل الاسم الواصلة الأصلي ("اسم تخزين البيانات الوصفية") إلى اسم مكافئ مسطر ("metadata_storage_name").
لا يزال يتعين عليك إضافة الحقول المسطرة إلى تعريف الفهرس، ولكن يمكنك حذف تعيينات الحقول لأن المفهرس سيقوم بإجراء الاقتران تلقائيا.
metadata_storage_name (
Edm.String) - اسم ملف الفقاعة. على سبيل المثال، إذا كان لديك نقطة /my-container/my-folder/subfolder/resume.pdf، فإن قيمة هذا الحقل هيresume.pdf.metadata_storage_path (
Edm.String) - عنوان URI الكامل للنقطة ، بما في ذلك حساب التخزين. على سبيل المثال،https://myaccount.blob.core.windows.net/my-container/my-folder/subfolder/resume.pdfmetadata_storage_content_type (
Edm.String) - نوع المحتوى كما هو محدد بواسطة الرمز الذي استخدمته لتحميل النقطة. على سبيل المثال، application/octet-stream.metadata_storage_last_modified (
Edm.DateTimeOffset) - آخر تعديل للطابع الزمني للفقاعة. يستخدم Azure Cognitive Search هذا الطابع الزمني لتحديد النقاط التي تم تغييرها، لتجنب إعادة فهرسة كل شيء بعد الفهرسة الأولية.metadata_storage_size (
Edm.Int64) - حجم الفقاعة بالبايت.metadata_storage_content_md5 (
Edm.String) - تجزئة MD5 لمحتوى الفقاعة، إن وجد.metadata_storage_sas_token (
Edm.String) - رمز SAS مؤقت يمكن استخدامه بواسطة مهارات مخصصة للوصول إلى الفقاعة. لا ينبغي تخزين هذا الرمز المميز للاستخدام لاحقا لأنه قد تنتهي صلاحيته.
وأخيرا، يمكن أيضا تمثيل أي خصائص بيانات أولية خاصة بتنسيق المستند للنقاط التي تقوم بفهرستها في مخطط الفهرسة. لمزيد من المعلومات حول البيانات الوصفية الخاصة بالمحتوى، راجع خصائص بيانات تعريف المحتوى.
من المهم الإشارة إلى أنك لست بحاجة إلى تحديد حقول لجميع الخصائص المذكورة أعلاه في فهرس البحث - ما عليك سوى التقاط الخصائص التي تحتاجها لتطبيقك.
تعريف مصدر البيانات
يحدد تعريف مصدر البيانات البيانات المراد فهرستها وبيانات اعتمادها وسياساتها لتحديد التغييرات في البيانات. يتم تعريف مصدر البيانات كمورد مستقل بحيث يمكن استخدامه من قبل مفهرسين متعددين.
إنشاء مصدر بيانات أو تحديثه لتعيين تعريفه:
{ "name" : "my-adlsgen2-datasource", "type" : "adlsgen2", "credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<account name>;AccountKey=<account key>;" }, "container" : { "name" : "my-container", "query" : "<optional-virtual-directory-name>" } }اضبط "النوع" على
"adlsgen2"(مطلوب).تعيين
"credentials"إلى سلسلة اتصال تخزين Azure. يصف القسم التالي التنسيقات المدعومة.اضبط
"container"على حاوية blob ، واستخدم "استعلام" لتحديد أي مجلدات فرعية.
يمكن أن يتضمن تعريف مصدر البيانات أيضا نهج الحذف الناعم، إذا كنت تريد أن يقوم المفهرس بحذف مستند بحث عند وضع علامة على المستند المصدر للحذف.
بيانات الاعتماد المدعومة وسلاسل الاتصال
يمكن للمفهرسين الاتصال بحاوية نقط باستخدام الاتصالات التالية.
| سلسلة اتصال حساب تخزين الوصول الكامل |
|---|
{ "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<your storage account>;AccountKey=<your account key>;" } |
| يمكنك الحصول على سلسلة الاتصال من صفحة حساب التخزين في مدخل Azure عن طريق تحديد مفاتيح Access في جزء التنقل الأيمن. تأكد من تحديد سلسلة اتصال كاملة وليس مجرد مفتاح. |
| سلسلة اتصال الهوية المدارة |
|---|
{ "connectionString" : "ResourceId=/subscriptions/<your subscription ID>/resourceGroups/<your resource group name>/providers/Microsoft.Storage/storageAccounts/<your storage account name>/;" } |
| لا تتطلب سلسلة الاتصال هذه مفتاح حساب، ولكن يجب أن تكون قد قمت مسبقا بتكوين خدمة بحث للاتصال باستخدام هوية مدارة. |
| سلسلة اتصال توقيع الوصول المشترك لحساب التخزين** (SAS) |
|---|
{ "connectionString" : "BlobEndpoint=https://<your account>.blob.core.windows.net/;SharedAccessSignature=?sv=2016-05-31&sig=<the signature>&spr=https&se=<the validity end time>&srt=co&ss=b&sp=rl;" } |
| يجب أن يكون لدى SAS القائمة وأذونات القراءة على الحاويات والكائنات (النقط في هذه الحالة). |
| توقيع الوصول المشترك للحاوية |
|---|
{ "connectionString" : "ContainerSharedAccessUri=https://<your storage account>.blob.core.windows.net/<container name>?sv=2016-05-31&sr=c&sig=<the signature>&se=<the validity end time>&sp=rl;" } |
| يجب أن يكون لدى SAS القائمة وأذونات القراءة على الحاوية. لمزيد من المعلومات، راجع استخدام توقيعات الوصول المشترك. |
ملاحظة
إذا كنت تستخدم بيانات اعتماد SAS، فستحتاج إلى تحديث بيانات اعتماد مصدر البيانات بشكل دوري بتوقيعات متجددة لمنع انتهاء صلاحيتها. إذا انتهت صلاحية بيانات اعتماد SAS، فسوف يفشل المفهرس مع ظهور رسالة خطأ مشابهة ل "بيانات الاعتماد المتوفرة في سلسلة الاتصال غير صالحة أو انتهت صلاحيتها".
إضافة حقول بحث إلى فهرس
في فهرس البحث، أضف حقولا لقبول المحتوى وبيانات التعريف الخاصة بنقاط Azure الخاصة بك.
إنشاء فهرس أو تحديثه لتحديد حقول البحث التي ستخزن محتوى النقطة والبيانات الوصفية:
POST https://[service name].search.windows.net/indexes?api-version=2020-06-30 { "name" : "my-search-index", "fields": [ { "name": "ID", "type": "Edm.String", "key": true, "searchable": false }, { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false }, { "name": "metadata_storage_name", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true }, { "name": "metadata_storage_size", "type": "Edm.Int64", "searchable": false, "filterable": true, "sortable": true }, { "name": "metadata_storage_content_type", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true }, ] } }إنشاء حقل مفتاح مستند ("المفتاح": true). بالنسبة لمحتوى blob ، فإن أفضل المرشحين هم خصائص البيانات الوصفية.
metadata_storage_path(افتراضي) المسار الكامل إلى الكائن أو الملف. سيتم ملء حقل المفتاح ("المعرف" في هذا المثال) بقيم من metadata_storage_path لأنه الافتراضي.metadata_storage_name، لا يمكن استخدامها إلا إذا كانت الأسماء فريدة. إذا كنت تريد أن يكون هذا الحقل هو المفتاح، فانتقل"key": trueإلى تعريف الحقل هذا.خاصية بيانات تعريف مخصصة تضيفها إلى النقاط. يتطلب هذا الخيار أن تضيف عملية تحميل blob خاصية البيانات الوصفية هذه إلى جميع النقط. نظرا لأن المفتاح هو خاصية مطلوبة، فإن أي نقاط تفتقد قيمة ما ستفشل في فهرستها. إذا كنت تستخدم خاصية بيانات تعريف مخصصة كمفتاح، فتجنب إجراء تغييرات على هذه الخاصية. ستضيف المفهرسات مستندات مكررة لنفس النقطة إذا تغيرت الخاصية الرئيسية.
غالبا ما تتضمن خصائص بيانات التعريف أحرفا، مثل
/و-، غير صالحة لمفاتيح المستندات. نظرا لأن المفهرس يحتوي على خاصية "base64EncodeKeys" (صحيح بشكل افتراضي)، فإنه يقوم تلقائيا بتشفير خاصية بيانات التعريف، دون الحاجة إلى تكوين أو تعيين حقل.أضف حقل "محتوى" لتخزين النص المستخرج من كل ملف من خلال خاصية "المحتوى" الخاصة بالنقطة. لست مطالبا باستخدام هذا الاسم، ولكن القيام بذلك يتيح لك الاستفادة من تعيينات الحقول الضمنية.
أضف حقولا لخصائص بيانات التعريف القياسية. يمكن للمفهرس قراءة خصائص بيانات التعريف المخصصة وخصائص بيانات التعريف القياسية وخصائص بيانات التعريف الخاصة بالمحتوى .
تكوين مفهرس ADLS Gen2 وتشغيله
بمجرد إنشاء الفهرس ومصدر البيانات، تصبح جاهزا لإنشاء المفهرس. يحدد تكوين المفهرس المدخلات والمعلمات والخصائص التي تتحكم في سلوكيات وقت التشغيل. يمكنك أيضا تحديد أجزاء النقطة المراد فهرستها.
إنشاء مفهرس أو تحديثه عن طريق إعطائه اسما والرجوع إلى مصدر البيانات والفهرس المستهدف:
POST https://[service name].search.windows.net/indexers?api-version=2020-06-30 { "name" : "my-adlsgen2-indexer, "dataSourceName" : "my-adlsgen2-datasource", "targetIndexName" : "my-search-index", "parameters": { "batchSize": null, "maxFailedItems": null, "maxFailedItemsPerBatch": null, "base64EncodeKeys": null, "configuration:" { "indexedFileNameExtensions" : ".pdf,.docx", "excludedFileNameExtensions" : ".png,.jpeg", "dataToExtract": "contentAndMetadata", "parsingMode": "default" } }, "schedule" : { }, "fieldMappings" : [ ] }قم بتعيين "حجم الدفعة" إذا كان الافتراضي (10 مستندات) إما قيد الاستخدام أو غارقا في الموارد المتاحة. أحجام الدفعات الافتراضية خاصة بمصدر البيانات. تحدد فهرسة Blob حجم الدفعة عند 10 مستندات تقديرا لمتوسط حجم المستند الأكبر.
ضمن "التكوين"، يمكنك التحكم في النقاط التي تتم فهرستها استنادا إلى نوع الملف، أو اتركها غير محددة لاسترداد جميع النقط.
ل
"indexedFileNameExtensions"، قم بتوفير قائمة مفصولة بفواصل من امتدادات الملفات (مع نقطة بادئة). افعل الشيء نفسه"excludedFileNameExtensions"للإشارة إلى الامتدادات التي يجب تخطيها. إذا كان الامتداد نفسه موجودا في كلتا القائمتين، استبعاده من الفهرسة.ضمن "التكوين"، قم بتعيين "dataToExtract" للتحكم في أجزاء النقط التي تتم فهرستها:
يحدد "contentAndMetadata" فهرسة جميع البيانات الوصفية والمحتوى النصي المستخرج من الفقاعة. هذه هي القيمة الافتراضية.
تحدد "storageMetadata" أنه يتم فهرسة خصائص blob القياسية وبيانات التعريف المحددة من قبل المستخدم فقط.
تحدد "allMetadata" أن خصائص النقطة القياسية وأي بيانات تعريف لأنواع المحتوى التي تم العثور عليها يتم استخراجها من محتوى blob وفهرستها.
ضمن "التكوين"، قم بتعيين "parsingMode" إذا كان يجب تعيين النقاط إلى مستندات بحث متعددة، أو إذا كانت تتكون من نص عادي أو مستندات JSON أو ملفات CSV.
حدد تعيينات الحقول إذا كانت هناك اختلافات في اسم الحقل أو نوعه، أو إذا كنت بحاجة إلى إصدارات متعددة من حقل مصدر في فهرس البحث.
في فهرسة النقاط، يمكنك غالبا حذف تعيينات الحقول لأن المفهرس لديه دعم مضمن لتعيين خصائص "المحتوى" وبيانات التعريف إلى الحقول ذات الأسماء والكتابة المماثلة في الفهرس. بالنسبة لخصائص بيانات التعريف، سيقوم المفهرس تلقائيا باستبدال الواصلات
-بشرطة سفلية في فهرس البحث.راجع إنشاء مفهرس لمزيد من المعلومات حول الخصائص الأخرى. للحصول على القائمة الكاملة لأوصاف المعلمات، راجع معلمات تكوين Blob في واجهة برمجة تطبيقات REST.
يتم تشغيل المفهرس تلقائيا عند إنشائه. يمكنك منع ذلك عن طريق تعيين "معطل" إلى true. للتحكم في تنفيذ المفهرس، قم بتشغيل مفهرس عند الطلب أو وضعه على جدول زمني.
التحقق من حالة المفهرس
لمراقبة حالة المفهرس ومحفوظات التنفيذ، أرسل طلب الحصول على حالة المفهرس :
GET https://myservice.search.windows.net/indexers/myindexer/status?api-version=2020-06-30
Content-Type: application/json
api-key: [admin key]
تتضمن الاستجابة الحالة وعدد العناصر التي تمت معالجتها. يجب أن تبدو مشابهة للمثال التالي:
{
"status":"running",
"lastResult": {
"status":"success",
"errorMessage":null,
"startTime":"2022-02-21T00:23:24.957Z",
"endTime":"2022-02-21T00:36:47.752Z",
"errors":[],
"itemsProcessed":1599501,
"itemsFailed":0,
"initialTrackingState":null,
"finalTrackingState":null
},
"executionHistory":
[
{
"status":"success",
"errorMessage":null,
"startTime":"2022-02-21T00:23:24.957Z",
"endTime":"2022-02-21T00:36:47.752Z",
"errors":[],
"itemsProcessed":1599501,
"itemsFailed":0,
"initialTrackingState":null,
"finalTrackingState":null
},
... earlier history items
]
}
يحتوي سجل التنفيذ على ما يصل إلى 50 من أحدث عمليات التنفيذ المكتملة، والتي يتم فرزها بترتيب زمني عكسي بحيث يأتي أحدث تنفيذ أولا.
معالجة الأخطاء
تتضمن الأخطاء التي تحدث عادة أثناء الفهرسة أنواع المحتوى غير المعتمدة أو المحتوى المفقود أو النقط كبيرة الحجم.
بشكل افتراضي، يتوقف مفهرس النقطة بمجرد أن يواجه نقطة بنوع محتوى غير مدعوم (على سبيل المثال، ملف صوتي). يمكنك استخدام المعلمة "مستبعدFileNameExtensions" لتخطي أنواع معينة من المحتوى. ومع ذلك، قد ترغب في الفهرسة للمتابعة حتى في حالة حدوث أخطاء، ثم تصحيح أخطاء المستندات الفردية لاحقا. لمزيد من المعلومات حول أخطاء المفهرس، راجع إرشادات استكشاف أخطاء المفهرس وإصلاحها وأخطاء المفهرس وتحذيراته.
هناك خمس خصائص مفهرس تتحكم في استجابة المفهرس عند حدوث أخطاء.
PUT /indexers/[indexer name]?api-version=2020-06-30
{
"parameters" : {
"maxFailedItems" : 10,
"maxFailedItemsPerBatch" : 10,
"configuration" : {
"failOnUnsupportedContentType" : false,
"failOnUnprocessableDocument" : false,
"indexStorageMetadataOnlyForOversizedDocuments": false
}
}
| المعلمة | قيم صحيحة | الوصف |
|---|---|---|
| "maxFailedItems" | -1، فارغ أو 0، عدد صحيح موجب | استمر في الفهرسة في حالة حدوث أخطاء في أي نقطة من المعالجة، إما أثناء تحليل النقاط أو أثناء إضافة مستندات إلى فهرس. قم بتعيين هذه الخصائص إلى عدد حالات الفشل المقبولة. قيمة -1 تسمح بالمعالجة بغض النظر عن عدد الأخطاء التي تحدث. خلاف ذلك ، تكون القيمة عددا صحيحا موجبا. |
| "maxFailedItemsPerBatch" | -1، فارغ أو 0، عدد صحيح موجب | نفس الشيء أعلاه ، ولكن تستخدم لفهرسة الدفعات. |
| "failOnUnsupportedContentType" | صواب أو خطأ | إذا لم يتمكن المفهرس من تحديد نوع المحتوى، فحدد ما إذا كنت تريد متابعة المهمة أو فشلها. |
| "failOnUnprocessableDocument" | صواب أو خطأ | إذا كان المفهرس غير قادر على معالجة مستند من نوع محتوى مدعوم بخلاف ذلك، فحدد ما إذا كنت تريد متابعة المهمة أو فشلها. |
| "indexStorageMetadataOnlyForOversizedDocuments" | صواب أو خطأ | يتم التعامل مع النقط كبيرة الحجم على أنها أخطاء بشكل افتراضي. إذا قمت بتعيين هذه المعلمة إلى true، فسيحاول المفهرس فهرسة بيانات التعريف الخاصة به حتى إذا تعذر فهرسة المحتوى. للاطلاع على القيود المفروضة على حجم النقطة، راجع حدود الخدمة. |
الخطوات التالية
يمكنك الآن تشغيل المفهرس أو مراقبة الحالة أو جدولة تنفيذ المفهرس. تنطبق المقالات التالية على المفهرسين الذين يسحبون المحتوى من Azure Storage: