بيانات الفهرس من Azure Blob Storage

في هذه المقالة، تعرف على كيفية تكوين مفهرس يستورد المحتوى من Azure Blob Storage ويجعله قابلا للبحث في Azure Cognitive Search. المدخلات إلى المفهرس هي النقط الخاصة بك ، في حاوية واحدة. الإخراج هو فهرس بحث يحتوي على محتوى قابل للبحث وبيانات وصفية مخزنة في حقول فردية.

تكمل هذه المقالة إنشاء مفهرس يحتوي على معلومات خاصة ب Blob Storage. يستخدم واجهات برمجة تطبيقات REST لإظهار سير عمل مكون من ثلاثة أجزاء مشترك بين جميع المفهرسين: إنشاء مصدر بيانات وإنشاء فهرس وإنشاء مفهرس. يحدث استخراج البيانات عند إرسال طلب إنشاء مفهرس.

تستخدم مفهرسات Blob بشكل متكرر لكل من إثراء الذكاء الاصطناعي والمعالجة المستندة إلى النص. تركز هذه المقالة على مفهرسات الفهرسة المستندة إلى النص، حيث يتم استيعاب المحتوى النصي وبيانات التعريف فقط لسيناريوهات البحث في النص الكامل.

المتطلبات الأساسية

  • Azure Blob Storage, Standard Performance (الإصدار 2 للأغراض العامة).

  • تتضمن طبقات الوصول ل Blob Storage الساخنة والباردة والأرشيفية. يمكن الوصول إلى Hot and Cool فقط بواسطة مفهرسي البحث.

  • Blobs التي توفر محتوى النص والبيانات الوصفية. إذا كانت النقط تحتوي على محتوى ثنائي أو نص غير منظم، ففكر في إضافة الذكاء الاصطناعي إثراء لمعالجة الصور واللغات الطبيعية. لا يمكن أن يتجاوز محتوى Blob حدود المفهرس لطبقة خدمة البحث.

  • تكوين شبكة مدعوم والوصول إلى البيانات. كحد أدنى، ستحتاج إلى أذونات قراءة في Azure Storage. ستمنحك سلسلة اتصال التخزين التي تتضمن مفتاح وصول حق الوصول للقراءة إلى محتوى التخزين. إذا كنت تستخدم بدلا من ذلك عمليات تسجيل الدخول والأدوار الخاصة ب Azure AD، فتأكد من أن الهوية المدارة لخدمة البحث تحتوي على أذونات قارئ بيانات Storage Blob .

    بشكل افتراضي، يقبل كل من البحث والتخزين الطلبات الواردة من عناوين IP العامة. إذا لم يكن أمان الشبكة مصدر قلق فوري ، فيمكنك فهرسة بيانات blob باستخدام سلسلة الاتصال وأذونات القراءة فقط. عندما تكون مستعدا لإضافة حماية الشبكة، راجع وصول المفهرس إلى المحتوى المحمي بواسطة ميزات أمان شبكة Azure للحصول على إرشادات حول الوصول إلى البيانات.

  • عميل REST، مثل ساعي البريد أو Visual Studio التعليمات البرمجية مع ملحق Azure البحث المعرفي لإجراء الطلبات الموضحة في هذه المقالة.

تنسيقات المستندات المعتمدة

يمكن لمفهرس النقط استخراج النص من تنسيقات المستندات التالية:

  • CSV (راجع فهرسة نقاط CSV)
  • يمل
  • EPUB
  • جي زد
  • HTML
  • JSON (انظر فهرسة نقاط JSON)
  • KML (XML للتمثيلات الجغرافية)
  • تنسيقات Microsoft Office: DOCX / DOC / DOCM ، XLSX / XLS / XLSM ، PPTX / PPT / PPTM ، MSG (رسائل البريد الإلكتروني Outlook) ، XML (كل من 2003 و 2006 WORD XML)
  • تنسيقات المستندات المفتوحة: ODT و ODS و ODP
  • PDF
  • ملفات النص العادي (انظر أيضا فهرسة النص العادي)
  • آر تي إف
  • XML
  • ZIP

تحديد النقط التي يجب فهرستها

قبل إعداد الفهرسة، راجع بيانات المصدر لتحديد ما إذا كان ينبغي إجراء أي تغييرات مقدما. يمكن للمفهرس فهرسة المحتوى من حاوية واحدة في كل مرة. بشكل افتراضي ، تتم معالجة جميع النقاط الموجودة في الحاوية. لديك العديد من الخيارات لمعالجة أكثر انتقائية:

  • ضع النقاط في مجلد ظاهري. يتضمن تعريف مصدر بيانات المفهرس معلمة "استعلام" يمكنها أخذ مجلد ظاهري. إذا قمت بتحديد مجلد ظاهري، فهرسة تلك النقاط الموجودة في المجلد فقط.

  • قم بتضمين أو استبعاد النقاط حسب نوع الملف. يمكن أن تساعدك قائمة تنسيقات المستندات المدعومة في تحديد النقاط التي يجب استبعادها. على سبيل المثال، قد ترغب في استبعاد ملفات الصور أو الصوت التي لا توفر نصا قابلا للبحث. يتم التحكم في هذه القدرة من خلال إعدادات التكوين في المفهرس.

  • تضمين أو استبعاد النقط التعسفية. إذا كنت ترغب في تخطي نقطة معينة لأي سبب من الأسباب، يمكنك إضافة خصائص وقيم بيانات التعريف التالية إلى النقاط في Blob Storage. عندما يواجه مفهرس هذه الخاصية، فإنه يتخطى النقطة أو محتواها في تشغيل الفهرسة.

    اسم الخاصية قيمة العقار التوضيح
    "AzureSearch_Skip" "true" يرشد مفهرس الفقاعة إلى تخطي النقطة تماما. لا تتم محاولة استخراج البيانات الوصفية أو المحتوى. هذا مفيد عندما تفشل نقطة معينة بشكل متكرر وتقاطع عملية الفهرسة.
    "AzureSearch_SkipContent" "true" يتخطى المحتوى ويستخرج البيانات الوصفية فقط. هذا يعادل الإعداد الموضح في إعدادات التكوين"dataToExtract" : "allMetadata" ، فقط نطاق إلى نقطة معينة.

إذا لم تقم بإعداد معايير التضمين أو الاستبعاد، فسيقوم المفهرس بالإبلاغ عن نقطة غير مؤهلة كخطأ والمضي قدما. في حالة حدوث أخطاء كافية، قد تتوقف المعالجة. يمكنك تحديد تفاوت الخطأ في إعدادات تكوين المفهرس.

عادة ما ينشئ المفهرس مستند بحث واحد لكل نقطة، حيث يتم التقاط محتوى النص وبيانات التعريف كحقول قابلة للبحث في فهرس. إذا كانت النقط عبارة عن ملفات كاملة ، فيمكنك تحليلها في مستندات بحث متعددة. على سبيل المثال، يمكنك تحليل الصفوف في ملف CSV لإنشاء مستند بحث واحد لكل صف.

فهرسة البيانات الوصفية للنقطة

يمكن أيضا فهرسة البيانات الوصفية ل Blob ، وهذا مفيد إذا كنت تعتقد أن أيا من خصائص بيانات التعريف القياسية أو المخصصة ستكون مفيدة في الفلاتر والاستعلامات.

يتم استخراج خصائص بيانات التعريف المحددة من قبل المستخدم حرفيا. لتلقي القيم ، يجب عليك تعريف الحقل في فهرس البحث من النوع Edm.String، بنفس اسم مفتاح بيانات التعريف الخاص بالنقطة. على سبيل المثال ، إذا كانت النقطة تحتوي على مفتاح Sensitivity بيانات تعريف ذو قيمة High، فيجب عليك تحديد حقل مسمى Sensitivity في فهرس البحث الخاص بك وسيتم ملؤه بالقيمة High.

يمكن استخراج خصائص البيانات الوصفية القياسية للنقطة إلى حقول تحمل نفس الاسم والكتابة، كما هو موضح أدناه. يقوم مفهرس blob تلقائيا بإنشاء تعيينات حقول داخلية لخصائص البيانات الوصفية للنقطة هذه، وتحويل الاسم الواصلة الأصلي ("اسم تخزين البيانات الوصفية") إلى اسم مكافئ مسطر ("metadata_storage_name").

لا يزال يتعين عليك إضافة الحقول المسطرة إلى تعريف الفهرس، ولكن يمكنك حذف تعيينات الحقول لأن المفهرس سيقوم بإجراء الاقتران تلقائيا.

  • metadata_storage_name (Edm.String) - اسم ملف الفقاعة. على سبيل المثال، إذا كان لديك نقطة /my-container/my-folder/subfolder/resume.pdf، فإن قيمة هذا الحقل هي resume.pdf.

  • metadata_storage_path (Edm.String) - عنوان URI الكامل للنقطة ، بما في ذلك حساب التخزين. على سبيل المثال، https://myaccount.blob.core.windows.net/my-container/my-folder/subfolder/resume.pdf

  • metadata_storage_content_type (Edm.String) - نوع المحتوى كما هو محدد بواسطة الرمز الذي استخدمته لتحميل النقطة. على سبيل المثال، ⁧application/octet-stream⁩.

  • metadata_storage_last_modified (Edm.DateTimeOffset) - آخر تعديل للطابع الزمني للفقاعة. يستخدم Azure Cognitive Search هذا الطابع الزمني لتحديد النقاط التي تم تغييرها، لتجنب إعادة فهرسة كل شيء بعد الفهرسة الأولية.

  • metadata_storage_size (Edm.Int64) - حجم الفقاعة بالبايت.

  • metadata_storage_content_md5 (Edm.String) - تجزئة MD5 لمحتوى الفقاعة، إن وجد.

  • metadata_storage_sas_token (Edm.String) - رمز SAS مؤقت يمكن استخدامه بواسطة مهارات مخصصة للوصول إلى الفقاعة. لا ينبغي تخزين هذا الرمز المميز للاستخدام لاحقا لأنه قد تنتهي صلاحيته.

وأخيرا، يمكن أيضا تمثيل أي خصائص بيانات أولية خاصة بتنسيق المستند للنقاط التي تقوم بفهرستها في مخطط الفهرسة. لمزيد من المعلومات حول البيانات الوصفية الخاصة بالمحتوى، راجع خصائص بيانات تعريف المحتوى.

من المهم الإشارة إلى أنك لست بحاجة إلى تحديد حقول لجميع الخصائص المذكورة أعلاه في فهرس البحث - ما عليك سوى التقاط الخصائص التي تحتاجها لتطبيقك.

تعريف مصدر البيانات

يحدد تعريف مصدر البيانات البيانات المراد فهرستها وبيانات اعتمادها وسياساتها لتحديد التغييرات في البيانات. يتم تعريف مصدر البيانات كمورد مستقل بحيث يمكن استخدامه من قبل مفهرسين متعددين.

  1. إنشاء مصدر بيانات أو تحديثه لتعيين تعريفه:

    {
        "name" : "my-blob-datasource",
        "type" : "azureblob",
        "credentials" : { "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<account name>;AccountKey=<account key>;" },
        "container" : { "name" : "my-container", "query" : "<optional-virtual-directory-name>" }
    }
    
  2. اضبط "النوع" على "azureblob" (مطلوب).

  3. قم بتعيين "بيانات الاعتماد" إلى سلسلة اتصال Azure Storage. يصف القسم التالي التنسيقات المدعومة.

  4. اضبط "الحاوية" على حاوية blob ، واستخدم "استعلام" لتحديد أي مجلدات فرعية.

يمكن أن يتضمن تعريف مصدر البيانات أيضا نهج الحذف الناعم، إذا كنت تريد أن يقوم المفهرس بحذف مستند بحث عند وضع علامة على المستند المصدر للحذف.

بيانات الاعتماد المدعومة وسلاسل الاتصال

يمكن للمفهرسين الاتصال بحاوية نقط باستخدام الاتصالات التالية.

سلسلة اتصال حساب تخزين الوصول الكامل
{ "connectionString" : "DefaultEndpointsProtocol=https;AccountName=<your storage account>;AccountKey=<your account key>;" }
يمكنك الحصول على سلسلة الاتصال من صفحة حساب التخزين في مدخل Azure عن طريق تحديد مفاتيح Access في جزء التنقل الأيمن. تأكد من تحديد سلسلة اتصال كاملة وليس مجرد مفتاح.
سلسلة اتصال الهوية المدارة
{ "connectionString" : "ResourceId=/subscriptions/<your subscription ID>/resourceGroups/<your resource group name>/providers/Microsoft.Storage/storageAccounts/<your storage account name>/;" }
لا تتطلب سلسلة الاتصال هذه مفتاح حساب، ولكن يجب أن تكون قد قمت مسبقا بتكوين خدمة بحث للاتصال باستخدام هوية مدارة.
سلسلة اتصال توقيع الوصول المشترك لحساب التخزين** (SAS)
{ "connectionString" : "BlobEndpoint=https://<your account>.blob.core.windows.net/;SharedAccessSignature=?sv=2016-05-31&sig=<the signature>&spr=https&se=<the validity end time>&srt=co&ss=b&sp=rl;" }
يجب أن يكون لدى SAS القائمة وأذونات القراءة على الحاويات والكائنات (النقط في هذه الحالة).
توقيع الوصول المشترك للحاوية
{ "connectionString" : "ContainerSharedAccessUri=https://<your storage account>.blob.core.windows.net/<container name>?sv=2016-05-31&sr=c&sig=<the signature>&se=<the validity end time>&sp=rl;" }
يجب أن يكون لدى SAS القائمة وأذونات القراءة على الحاوية. لمزيد من المعلومات، راجع استخدام توقيعات الوصول المشترك.

ملاحظة

إذا كنت تستخدم بيانات اعتماد SAS، فستحتاج إلى تحديث بيانات اعتماد مصدر البيانات بشكل دوري بتوقيعات متجددة لمنع انتهاء صلاحيتها. إذا انتهت صلاحية بيانات اعتماد SAS، فسوف يفشل المفهرس مع ظهور رسالة خطأ مشابهة ل "بيانات الاعتماد المتوفرة في سلسلة الاتصال غير صالحة أو انتهت صلاحيتها".

إضافة حقول بحث إلى فهرس

في فهرس البحث، أضف حقولا لقبول المحتوى وبيانات التعريف الخاصة بنقاط Azure الخاصة بك.

  1. إنشاء فهرس أو تحديثه لتحديد حقول البحث التي ستخزن محتوى النقطة والبيانات الوصفية:

    POST https://[service name].search.windows.net/indexes?api-version=2020-06-30
    {
        "name" : "my-search-index",
        "fields": [
            { "name": "ID", "type": "Edm.String", "key": true, "searchable": false },
            { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false },
            { "name": "metadata_storage_name", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true  },
            { "name": "metadata_storage_size", "type": "Edm.Int64", "searchable": false, "filterable": true, "sortable": true  },
            { "name": "metadata_storage_content_type", "type": "Edm.String", "searchable": false, "filterable": true, "sortable": true },        
        ]
      }
    }
    
  2. إنشاء حقل مفتاح مستند ("المفتاح": true). بالنسبة لمحتوى blob ، فإن أفضل المرشحين هم خصائص البيانات الوصفية.

    • metadata_storage_path (افتراضي) المسار الكامل إلى الكائن أو الملف. سيتم ملء حقل المفتاح ("المعرف" في هذا المثال) بقيم من metadata_storage_path لأنه الافتراضي.

    • metadata_storage_name، لا يمكن استخدامها إلا إذا كانت الأسماء فريدة. إذا كنت تريد أن يكون هذا الحقل هو المفتاح، فانتقل "key": true إلى تعريف الحقل هذا.

    • خاصية بيانات تعريف مخصصة تضيفها إلى النقاط. يتطلب هذا الخيار أن تضيف عملية تحميل blob خاصية البيانات الوصفية هذه إلى جميع النقط. نظرا لأن المفتاح هو خاصية مطلوبة، فإن أي نقاط تفتقد قيمة ما ستفشل في فهرستها. إذا كنت تستخدم خاصية بيانات تعريف مخصصة كمفتاح، فتجنب إجراء تغييرات على هذه الخاصية. ستضيف المفهرسات مستندات مكررة لنفس النقطة إذا تغيرت الخاصية الرئيسية.

    غالبا ما تتضمن خصائص بيانات التعريف أحرفا، مثل / و -، غير صالحة لمفاتيح المستندات. نظرا لأن المفهرس يحتوي على خاصية "base64EncodeKeys" (صحيح بشكل افتراضي)، فإنه يقوم تلقائيا بتشفير خاصية بيانات التعريف، دون الحاجة إلى تكوين أو تعيين حقل.

  3. أضف حقل "محتوى" لتخزين النص المستخرج من كل ملف من خلال خاصية "المحتوى" الخاصة بالنقطة. لست مطالبا باستخدام هذا الاسم، ولكن القيام بذلك يتيح لك الاستفادة من تعيينات الحقول الضمنية.

  4. أضف حقولا لخصائص بيانات التعريف القياسية. يمكن للمفهرس قراءة خصائص بيانات التعريف المخصصة وخصائص بيانات التعريف القياسية وخصائص بيانات التعريف الخاصة بالمحتوى .

تكوين مفهرس blob وتشغيله

بمجرد إنشاء الفهرس ومصدر البيانات، تصبح جاهزا لإنشاء المفهرس. يحدد تكوين المفهرس المدخلات والمعلمات والخصائص التي تتحكم في سلوكيات وقت التشغيل. يمكنك أيضا تحديد أجزاء النقطة المراد فهرستها.

  1. إنشاء مفهرس أو تحديثه عن طريق إعطائه اسما والرجوع إلى مصدر البيانات والفهرس المستهدف:

    POST https://[service name].search.windows.net/indexers?api-version=2020-06-30
    {
      "name" : "my-blob-indexer,
      "dataSourceName" : "my-blob-datasource",
      "targetIndexName" : "my-search-index",
      "parameters": {
          "batchSize": null,
          "maxFailedItems": null,
          "maxFailedItemsPerBatch": null,
          "base64EncodeKeys": null,
          "configuration:" {
              "indexedFileNameExtensions" : ".pdf,.docx",
              "excludedFileNameExtensions" : ".png,.jpeg",
              "dataToExtract": "contentAndMetadata",
              "parsingMode": "default"
          }
      },
      "schedule" : { },
      "fieldMappings" : [ ]
    }
    
  2. قم بتعيين batchSize ما إذا كان الافتراضي (10 مستندات) إما غير مستغل أو غير مستغل للموارد المتاحة. أحجام الدفعات الافتراضية خاصة بمصدر البيانات. تحدد فهرسة Blob حجم الدفعة عند 10 مستندات تقديرا لمتوسط حجم المستند الأكبر.

  3. ضمن "التكوين"، يمكنك التحكم في النقاط التي تتم فهرستها استنادا إلى نوع الملف، أو اتركها غير محددة لاسترداد جميع النقط.

    ل "indexedFileNameExtensions"، قم بتوفير قائمة مفصولة بفواصل من امتدادات الملفات (مع نقطة بادئة). افعل الشيء نفسه "excludedFileNameExtensions" للإشارة إلى الامتدادات التي يجب تخطيها. إذا كان الامتداد نفسه موجودا في كلتا القائمتين، استبعاده من الفهرسة.

  4. ضمن "التكوين"، قم بتعيين "dataToExtract" للتحكم في أجزاء النقط التي تتم فهرستها:

  5. ضمن "التكوين"، قم بتعيين "parsingMode" إذا كان يجب تعيين النقاط إلى مستندات بحث متعددة، أو إذا كانت تتكون من نص عادي أو مستندات JSON أو ملفات CSV.

  6. حدد تعيينات الحقول إذا كانت هناك اختلافات في اسم الحقل أو نوعه، أو إذا كنت بحاجة إلى إصدارات متعددة من حقل مصدر في فهرس البحث.

    في فهرسة النقاط، يمكنك غالبا حذف تعيينات الحقول لأن المفهرس لديه دعم مضمن لتعيين خصائص "المحتوى" وبيانات التعريف إلى الحقول ذات الأسماء والكتابة المماثلة في الفهرس. بالنسبة لخصائص بيانات التعريف، سيقوم المفهرس تلقائيا باستبدال الواصلات - بشرطة سفلية في فهرس البحث.

  7. راجع إنشاء مفهرس لمزيد من المعلومات حول الخصائص الأخرى. للحصول على القائمة الكاملة لأوصاف المعلمات، راجع معلمات تكوين Blob في واجهة برمجة تطبيقات REST.

يتم تشغيل المفهرس تلقائيا عند إنشائه. يمكنك منع ذلك عن طريق تعيين "معطل" إلى true. للتحكم في تنفيذ المفهرس، قم بتشغيل مفهرس عند الطلب أو وضعه على جدول زمني.

التحقق من حالة المفهرس

لمراقبة حالة المفهرس ومحفوظات التنفيذ، أرسل طلب الحصول على حالة المفهرس :

GET https://myservice.search.windows.net/indexers/myindexer/status?api-version=2020-06-30
  Content-Type: application/json  
  api-key: [admin key]

تتضمن الاستجابة الحالة وعدد العناصر التي تمت معالجتها. يجب أن تبدو مشابهة للمثال التالي:

    {
        "status":"running",
        "lastResult": {
            "status":"success",
            "errorMessage":null,
            "startTime":"2022-02-21T00:23:24.957Z",
            "endTime":"2022-02-21T00:36:47.752Z",
            "errors":[],
            "itemsProcessed":1599501,
            "itemsFailed":0,
            "initialTrackingState":null,
            "finalTrackingState":null
        },
        "executionHistory":
        [
            {
                "status":"success",
                "errorMessage":null,
                "startTime":"2022-02-21T00:23:24.957Z",
                "endTime":"2022-02-21T00:36:47.752Z",
                "errors":[],
                "itemsProcessed":1599501,
                "itemsFailed":0,
                "initialTrackingState":null,
                "finalTrackingState":null
            },
            ... earlier history items
        ]
    }

يحتوي سجل التنفيذ على ما يصل إلى 50 من أحدث عمليات التنفيذ المكتملة، والتي يتم فرزها بترتيب زمني عكسي بحيث يأتي أحدث تنفيذ أولا.

معالجة الأخطاء

تتضمن الأخطاء التي تحدث عادة أثناء الفهرسة أنواع المحتوى غير المعتمدة أو المحتوى المفقود أو النقط كبيرة الحجم.

بشكل افتراضي، يتوقف مفهرس النقطة بمجرد أن يواجه نقطة بنوع محتوى غير مدعوم (على سبيل المثال، ملف صوتي). يمكنك استخدام المعلمة "مستبعدFileNameExtensions" لتخطي أنواع معينة من المحتوى. ومع ذلك، قد ترغب في الفهرسة للمتابعة حتى في حالة حدوث أخطاء، ثم تصحيح أخطاء المستندات الفردية لاحقا. لمزيد من المعلومات حول أخطاء المفهرس، راجع إرشادات استكشاف أخطاء المفهرس وإصلاحها وأخطاء المفهرس وتحذيراته.

هناك خمس خصائص مفهرس تتحكم في استجابة المفهرس عند حدوث أخطاء.

PUT /indexers/[indexer name]?api-version=2020-06-30
{
  "parameters" : { 
    "maxFailedItems" : 10, 
    "maxFailedItemsPerBatch" : 10,
    "configuration" : { 
        "failOnUnsupportedContentType" : false, 
        "failOnUnprocessableDocument" : false,
        "indexStorageMetadataOnlyForOversizedDocuments": false
  }
}
المعلمة قيم صحيحة الوصف
"maxFailedItems" -1، فارغ أو 0، عدد صحيح موجب استمر في الفهرسة في حالة حدوث أخطاء في أي نقطة من المعالجة، إما أثناء تحليل النقاط أو أثناء إضافة مستندات إلى فهرس. قم بتعيين هذه الخصائص إلى عدد حالات الفشل المقبولة. قيمة -1 تسمح بالمعالجة بغض النظر عن عدد الأخطاء التي تحدث. خلاف ذلك ، تكون القيمة عددا صحيحا موجبا.
"maxFailedItemsPerBatch" -1، فارغ أو 0، عدد صحيح موجب نفس الشيء أعلاه ، ولكن تستخدم لفهرسة الدفعات.
"failOnUnsupportedContentType" صواب أو خطأ إذا لم يتمكن المفهرس من تحديد نوع المحتوى، فحدد ما إذا كنت تريد متابعة المهمة أو فشلها.
"failOnUnprocessableDocument" صواب أو خطأ إذا كان المفهرس غير قادر على معالجة مستند من نوع محتوى مدعوم بخلاف ذلك، فحدد ما إذا كنت تريد متابعة المهمة أو فشلها.
"indexStorageMetadataOnlyForOversizedDocuments" صواب أو خطأ يتم التعامل مع النقط كبيرة الحجم على أنها أخطاء بشكل افتراضي. إذا قمت بتعيين هذه المعلمة إلى true، فسيحاول المفهرس فهرسة بيانات التعريف الخاصة به حتى إذا تعذر فهرسة المحتوى. للاطلاع على القيود المفروضة على حجم النقطة، راجع حدود الخدمة.

الخطوات التالية

يمكنك الآن التحكم في كيفية تشغيل المفهرس أو حالة الشاشة أو جدولة تنفيذ المفهرس. تنطبق المقالات التالية على المفهرسين الذين يسحبون المحتوى من Azure Storage: