فهرسة البيانات من مكتبات المستندات SharePoint

هام

SharePoint دعم المفهرس حاليا في المعاينة العامة ضمن شروط الاستخدام التكميلية. اطلب الوصول إلى هذه الميزة، وبعد تمكين الوصول، استخدم واجهة برمجة تطبيقات REST للمعاينة (معاينة 2020-06-30 أو إصدار أحدث) لفهرسة المحتوى الخاص بك. يوجد حاليا دعم محدود للبوابة الإلكترونية ولا يوجد دعم .NET SDK.

قم بتكوين مفهرس بحث لفهرسة المستندات المخزنة في مكتبات المستندات SharePoint للبحث عن النص الكامل في Azure Cognitive Search. تشرح هذه المقالة خطوات التكوين، متبوعة باستكشاف أعمق للسلوكيات والسيناريوهات التي من المحتمل أن تواجهها.

ملاحظة

يدعم SharePoint نموذج تفويض دقيق يحدد وصول كل مستخدم على مستوى المستند. لا يقوم مفهرس SharePoint بسحب هذه الأذونات إلى فهرس البحث، ولا يدعم البحث المعرفي التخويل على مستوى المستند. عندما تتم فهرسة مستند من SharePoint إلى خدمة بحث، يكون المحتوى متاحا لأي شخص لديه حق الوصول للقراءة إلى الفهرس. إذا كنت بحاجة إلى أذونات على مستوى المستند، فيجب عليك التحقق من عوامل تصفية الأمان لاقتطاع نتائج المحتوى غير المصرح به.

الوظيفة

المفهرس في Azure Cognitive Search هو زاحف يستخرج البيانات القابلة للبحث وبيانات التعريف من مصدر بيانات. سيتصل مفهرس SharePoint بموقع SharePoint وفهرسة المستندات من مكتبة مستندات واحدة أو أكثر. يوفر المفهرس الوظائف التالية:

  • فهرسة المحتوى وبيانات التعريف من مكتبة مستندات واحدة أو أكثر.
  • الفهرسة التدريجية، حيث يحدد المفهرس الملفات التي تم تغييرها ويفهرس المحتوى المحدث فقط. على سبيل المثال، إذا تمت فهرسة خمسة ملفات PDF في الأصل وتم تحديث ملف واحد، فهرسة PDF المحدث فقط.
  • الكشف عن الحذف مضمن. إذا تم حذف مستند من مكتبة مستندات، فسيكتشف المفهرس الحذف عند تشغيل المفهرس التالي ويزيل المستند من الفهرس.
  • سيتم استخراج النص والصور العادية بشكل افتراضي من المستندات التي تمت فهرستها. اختياريا يمكن إضافة مجموعة من المهارات إلى خط الأنابيب لإثراء الذكاء الاصطناعي.

المتطلبات الأساسية

تنسيقات المستندات المعتمدة

يمكن لمفهرس SharePoint استخراج النص من تنسيقات المستندات التالية:

  • CSV (راجع فهرسة نقاط CSV)
  • يمل
  • EPUB
  • جي زد
  • HTML
  • JSON (انظر فهرسة نقاط JSON)
  • KML (XML للتمثيلات الجغرافية)
  • تنسيقات Microsoft Office: DOCX / DOC / DOCM ، XLSX / XLS / XLSM ، PPTX / PPT / PPTM ، MSG (رسائل البريد الإلكتروني Outlook) ، XML (كل من 2003 و 2006 WORD XML)
  • تنسيقات المستندات المفتوحة: ODT و ODS و ODP
  • PDF
  • ملفات النص العادي (انظر أيضا فهرسة النص العادي)
  • آر تي إف
  • XML
  • ZIP

تكوين مفهرس SharePoint

لإعداد مفهرس SharePoint، ستحتاج إلى تنفيذ بعض المهام في مدخل Azure، ومهام أخرى من خلال واجهة برمجة تطبيقات REST للمعاينة.

يوضح الفيديو التالي كيفية إعداد مفهرس SharePoint.

الخطوة 1 (اختياري): تمكين الهوية المدارة المعينة للنظام

عند تمكين هوية مدارة معينة من قبل النظام، يقوم Azure بإنشاء هوية لخدمة البحث الخاصة بك والتي يمكن استخدامها بواسطة المفهرس. يتم استخدام هذه الهوية للكشف تلقائيا عن المستأجر الذي يتم توفير خدمة البحث فيه.

إذا كان موقع SharePoint في نفس المستأجر مثل خدمة البحث، فستحتاج إلى تمكين الهوية المدارة المعينة من قبل النظام لخدمة البحث في مدخل Azure. إذا كان موقع SharePoint في مستأجر مختلف عن خدمة البحث، فتخطى هذه الخطوة.

Enable system assigned managed identity

بعد تحديد حفظ ، سترى معرف كائن تم تعيينه لخدمة البحث الخاصة بك.

System assigned managed identity

الخطوة 2: تحديد الأذونات التي يتطلبها المفهرس

يدعم مفهرس SharePoint أذونات التفويض والتطبيق. اختر الأذونات التي تريد استخدامها استنادا إلى السيناريو الخاص بك:

  • الأذونات المفوضة، حيث يتم تشغيل المفهرس ضمن هوية المستخدم أو التطبيق الذي أرسل الطلب. يقتصر الوصول إلى البيانات على المواقع والملفات التي يمكن للمستخدم الوصول إليها. لدعم الأذونات المحذوفة، يتطلب المفهرس مطالبة برمز الجهاز لتسجيل الدخول نيابة عن المستخدم.

  • أذونات التطبيق، حيث يعمل المفهرس تحت هوية المستأجر SharePoint مع إمكانية الوصول إلى جميع المواقع والملفات داخل SharePoint المستأجر. يتطلب المفهرس سر عميل للوصول إلى مستأجر SharePoint. سيتطلب المفهرس أيضا موافقة مسؤول المستأجر قبل أن يتمكن من فهرسة أي محتوى.

الخطوة 3: إنشاء تطبيق Azure AD

سيستخدم مفهرس SharePoint تطبيق Azure Active Directory (Azure AD) هذا للمصادقة.

  1. سجل الدخول إلى مدخل Azure.

  2. ابحث عن Azure Active Directory أو انتقل إليه، ثم حدد تسجيلات التطبيقات.

  3. اختر + تسجيل جديد:

    1. أدخل اسما لتطبيقك.
    2. حدد مستأجر واحد.
    3. تخطي خطوة تعيين URI. لا حاجة لإعادة توجيه URI.
    4. اختر ⁧⁩تسجيل⁧⁩.
  4. على يمين الصفحة، حدد أذونات واجهة برمجة التطبيقات، ثم إضافة إذن، ثم Microsoft Graph.

    • إذا كان المفهرس يستخدم أذونات واجهة برمجة التطبيقات المفوضة، فحدد الأذونات المفوضة وأضف ما يلي:

      • مفوض - Files.Read.All
      • مفوض - Sites.Read.All
      • مفوض - User.Read

      Delegated API permissions

      تسمح الأذونات المفوضة لعميل البحث بالاتصال SharePoint ضمن هوية الأمان للمستخدم الحالي.

    • إذا كان المفهرس يستخدم أذونات واجهة برمجة تطبيقات التطبيق، فحدد أذونات التطبيق وأضف ما يلي:

      • التطبيق - Files.Read.All
      • التطبيق - Sites.Read.All

      Application API permissions

      يعني استخدام أذونات التطبيق أن المفهرس سيصل إلى موقع SharePoint في سياق خدمة. لذلك عند تشغيل المفهرس ، سيكون لديه حق الوصول إلى جميع المحتويات في SharePoint المستأجر ، مما يتطلب موافقة مسؤول المستأجر. مطلوب أيضا سر العميل للمصادقة. يتم وصف إعداد سر العميل لاحقا في هذه المقالة.

  5. امنح موافقة المسؤول.

    يلزم الحصول على موافقة المشرف المستأجر عند استخدام أذونات واجهة برمجة تطبيقات التطبيق. يتم تأمين بعض المستأجرين بطريقة تتطلب موافقة مشرف المستأجر للحصول على أذونات واجهة برمجة التطبيقات المفوضة أيضا. إذا كان أي من هذين الأمرين كذلك، فستحتاج إلى موافقة مسؤول مستأجر على تطبيق Azure AD هذا قبل إنشاء المفهرس.

    Azure AD app grant admin consent

  6. حدد علامة التبويب مصادقة .

  7. قم بتعيين السماح بتدفقات العميل العامة إلى نعم ثم حدد حفظ.

  8. حدد + إضافة نظام أساسي، ثم تطبيقات الجوال وسطح المكتب، ثم حدد https://login.microsoftonline.com/common/oauth2/nativeclient، ثم تكوين.

    Azure AD app authentication configuration

  9. (أذونات واجهة برمجة تطبيقات التطبيق فقط) للمصادقة إلى تطبيق Azure AD باستخدام أذونات التطبيق، يتطلب المفهرس سرا للعميل.

    • حدد أسرار الشهادات & من القائمة الموجودة على اليمين، ثم أسرار العميل، ثم سر العميل الجديد.

      New client secret

    • في القائمة المنبثقة، أدخل وصفا لسر العميل الجديد. اضبط تاريخ انتهاء الصلاحية إذا لزم الأمر. إذا انتهت صلاحية السر ، فستحتاج إلى إعادة إنشائه ويحتاج المفهرس إلى تحديث السر الجديد.

      Setup client secret

    • سيظهر سر العميل الجديد في القائمة السرية. بمجرد التنقل بعيدا عن الصفحة ، لن يكون السر مرئيا بعد الآن ، لذا انسخه باستخدام زر النسخ واحفظه في مكان آمن.

      Copy client secret

الخطوة 4: إنشاء مصدر بيانات

هام

بدءا من هذا القسم ، تحتاج إلى استخدام واجهة برمجة تطبيقات REST للمعاينة للخطوات المتبقية. إذا لم تكن على دراية بواجهة برمجة تطبيقات Azure Cognitive Search REST، نقترح عليك إلقاء نظرة على ميزة التشغيل السريع هذه.

يحدد مصدر البيانات البيانات التي يجب فهرستها وبيانات الاعتماد اللازمة للوصول إلى البيانات والسياسات لتحديد التغييرات في البيانات بكفاءة (الصفوف الجديدة أو المعدلة أو المحذوفة). يمكن استخدام مصدر بيانات بواسطة مفهرسين متعددين في نفس خدمة البحث.

للحصول على فهرسة SharePoint، يجب أن يحتوي مصدر البيانات على الخصائص المطلوبة التالية:

  • الاسم هو الاسم الفريد لمصدر البيانات داخل خدمة البحث.
  • يجب أن يكون النوع "sharepoint". هذه القيمة حساسة لحالة الأحرف.
  • توفر بيانات الاعتماد نقطة نهاية SharePoint ومعرف تطبيق (عميل) Azure AD. مثال SharePoint نقطة النهاية هو https://microsoft.sharepoint.com/teams/MySharePointSite. يمكنك الحصول على نقطة النهاية من خلال الانتقال إلى الصفحة الرئيسية لموقع SharePoint ونسخ عنوان URL من المتصفح.
  • تحدد الحاوية مكتبة المستندات التي يجب فهرستها. يمكن العثور على مزيد من المعلومات حول إنشاء الحاوية في قسم التحكم في المستندات المفهرسة من هذا المستند.

لإنشاء مصدر بيانات، اتصل بإنشاء مصدر بيانات باستخدام إصدار واجهة برمجة تطبيقات المعاينة أو إصدار 2020-06-30-Preview أحدث.

POST https://[service name].search.windows.net/datasources?api-version=2020-06-30-Preview
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-datasource",
    "type" : "sharepoint",
    "credentials" : { "connectionString" : "[connection-string]" },
    "container" : { "name" : "defaultSiteLibrary", "query" : null }
}

تنسيق سلسلة الاتصال

يتغير تنسيق سلسلة الاتصال استنادا إلى ما إذا كان المفهرس يستخدم أذونات واجهة برمجة التطبيقات المفوضة أو أذونات واجهة برمجة تطبيقات التطبيق

  • تنسيق سلسلة اتصال أذونات واجهة برمجة التطبيقات المفوضة

    SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];TenantId=[SharePoint site tenant id]

  • تنسيق سلسلة اتصال أذونات واجهة برمجة التطبيقات للتطبيق

    SharePointOnlineEndpoint=[SharePoint site url];ApplicationId=[Azure AD App ID];ApplicationSecret=[Azure AD App client secret];TenantId=[SharePoint site tenant id]

ملاحظة

إذا كان موقع SharePoint في نفس المستأجر مثل خدمة البحث وتم تمكين الهوية المدارة المعينة من قبل النظام، TenantId فلا يلزم تضمينه في سلسلة الاتصال. إذا كان موقع SharePoint في مستأجر مختلف عن خدمة البحث، TenantId فيجب تضمينه.

الخطوة 5: إنشاء فهرس

يحدد الفهرس الحقول الموجودة في مستند وسمات وتركيبات أخرى تشكل تجربة البحث.

لإنشاء فهرس، اتصل بإنشاء فهرس:

POST https://[service name].search.windows.net/indexes?api-version=2020-06-30
Content-Type: application/json
api-key: [admin key]

{
    "name" : "sharepoint-index",
    "fields": [
        { "name": "id", "type": "Edm.String", "key": true, "searchable": false },
        { "name": "metadata_spo_item_name", "type": "Edm.String", "key": false, "searchable": true, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_path", "type": "Edm.String", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "metadata_spo_item_content_type", "type": "Edm.String", "key": false, "searchable": false, "filterable": true, "sortable": false, "facetable": true },
        { "name": "metadata_spo_item_last_modified", "type": "Edm.DateTimeOffset", "key": false, "searchable": false, "filterable": false, "sortable": true, "facetable": false },
        { "name": "metadata_spo_item_size", "type": "Edm.Int64", "key": false, "searchable": false, "filterable": false, "sortable": false, "facetable": false },
        { "name": "content", "type": "Edm.String", "searchable": true, "filterable": false, "sortable": false, "facetable": false }
    ]
}

هام

يمكن استخدامه فقط metadata_spo_site_library_item_id كحقل مفتاح في فهرس يشغله مفهرس SharePoint. إذا لم يكن حقل مفتاح موجودا في مصدر البيانات، metadata_spo_site_library_item_id تعيينه تلقائيا إلى حقل المفتاح.

الخطوة 6: إنشاء مفهرس

يربط المفهرس مصدر بيانات بفهرس بحث مستهدف ويوفر جدولا زمنيا لأتمتة تحديث البيانات. بمجرد إنشاء الفهرس ومصدر البيانات، تصبح جاهزا لإنشاء المفهرس.

خلال هذا القسم، سيطلب منك تسجيل الدخول باستخدام بيانات اعتماد مؤسستك التي يمكنها الوصول إلى موقع SharePoint. إذا كان ذلك ممكنا، نوصي بإنشاء حساب مستخدم مؤسسي جديد ومنح هذا المستخدم الجديد الأذونات الدقيقة التي تريد أن يحصل عليها المفهرس.

هناك بعض الخطوات لإنشاء المفهرس:

  1. إرسال طلب إنشاء مفهرس :

    POST https://[service name].search.windows.net/indexers?api-version=2020-06-30-Preview
    Content-Type: application/json
    api-key: [admin key]
    
    {
        "name" : "sharepoint-indexer",
        "dataSourceName" : "sharepoint-datasource",
        "targetIndexName" : "sharepoint-index",
        "parameters": {
        "batchSize": null,
        "maxFailedItems": null,
        "maxFailedItemsPerBatch": null,
        "base64EncodeKeys": null,
        "configuration": {
            "indexedFileNameExtensions" : ".pdf, .docx",
            "excludedFileNameExtensions" : ".png, .jpg",
            "dataToExtract": "contentAndMetadata"
          }
        },
        "schedule" : { },
        "fieldMappings" : [
            { 
              "sourceFieldName" : "metadata_spo_site_library_item_id", 
              "targetFieldName" : "id", 
              "mappingFunction" : { 
                "name" : "base64Encode" 
              } 
          }
    }
    
  2. عند إنشاء المفهرس لأول مرة ، سيفشل وسترى الخطأ التالي. انتقل إلى الرابط الموجود في رسالة الخطأ. إذا لم تنتقل إلى الرابط في غضون 10 دقائق ، فستنتهي صلاحية الرمز وستحتاج إلى إعادة إنشاء مصدر البيانات.

    {
        "error": {
            "code": "",
            "message": "Error with data source: To sign in, use a web browser to open the page https://microsoft.com/devicelogin and enter the code <CODE> to authenticate.  Please adjust your data source definition in order to proceed."
        }
    }
    
  3. قم بتوفير التعليمة البرمجية التي تم توفيرها في رسالة الخطأ.

    Enter device code

  4. سيصل مفهرس SharePoint إلى المحتوى SharePoint كمستخدم مسجل الدخول. سيكون المستخدم الذي يقوم بتسجيل الدخول أثناء هذه الخطوة هو المستخدم الذي قام بتسجيل الدخول. لذلك، إذا قمت بتسجيل الدخول باستخدام حساب مستخدم ليس لديه حق الوصول إلى مستند في مكتبة المستندات التي تريد فهرستها، فلن يتمكن المفهرس من الوصول إلى هذا المستند.

    إذا كان ذلك ممكنا، نوصي بإنشاء حساب مستخدم جديد ومنح هذا المستخدم الجديد الأذونات الدقيقة التي تريد أن يحصل عليها المفهرس.

  5. الموافقة على الأذونات التي يتم طلبها.

    Approve API permissions

  6. إعادة إرسال طلب إنشاء المفهرس. هذه المرة يجب أن ينجح الطلب.

    POST https://[service name].search.windows.net/indexers?api-version=2020-06-30-Preview
    Content-Type: application/json
    api-key: [admin key]
    
    {
        "name" : "sharepoint-indexer",
        "dataSourceName" : "sharepoint-datasource",
        "targetIndexName" : "sharepoint-index",
        "parameters": {
        "batchSize": null,
        "maxFailedItems": null,
        "maxFailedItemsPerBatch": null,
        "base64EncodeKeys": null,
        "configuration:" {
            "indexedFileNameExtensions" : null,
            "excludedFileNameExtensions" : null,
            "dataToExtract": "contentAndMetadata"
          }
        },
        "schedule" : { },
        "fieldMappings" : [
            { 
              "sourceFieldName" : "metadata_spo_site_library_item_id", 
              "targetFieldName" : "id", 
              "mappingFunction" : { 
                "name" : "base64Encode" 
              } 
          }
    }
    

ملاحظة

إذا كان تطبيق Azure AD يتطلب موافقة المسؤول ولم تتم الموافقة عليه قبل تسجيل الدخول، فقد ترى الشاشة التالية. يلزم الحصول على موافقة المسؤول للمتابعة. Admin approval required

الخطوة 7: التحقق من حالة المفهرس

بعد إنشاء المفهرس، يمكنك الاتصال بالحصول على حالة المفهرس:

GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2020-06-30-Preview
Content-Type: application/json
api-key: [admin key]

تحديث مصدر البيانات

إذا لم تكن هناك تحديثات لكائن مصدر البيانات، يمكن تشغيل المفهرس وفقا لجدول زمني دون أي تفاعل من المستخدم. ومع ذلك، في كل مرة يتم فيها تحديث كائن مصدر بيانات Azure Cognitive Search، ستحتاج إلى تسجيل الدخول مرة أخرى حتى يتم تشغيل المفهرس. على سبيل المثال، إذا قمت بتغيير استعلام مصدر البيانات، فقم بتسجيل https://microsoft.com/devicelogin الدخول مرة أخرى باستخدام التعليمة البرمجية ورمز جديد.

بمجرد تحديث مصدر البيانات، اتبع الخطوات التالية:

  1. اتصل ب Run Indexer لبدء تنفيذ المفهرس يدويا.

    POST https://[service name].search.windows.net/indexers/sharepoint-indexer/run?api-version=2020-06-30-Preview  
    Content-Type: application/json
    api-key: [admin key]
    
  2. تحقق من حالة المفهرس. إذا كان آخر تشغيل للمفهرس يحتوي على خطأ يخبرك بالانتقال إلى https://microsoft.com/devicelogin، فانتقل إلى تلك الصفحة وقدم الرمز الجديد.

    GET https://[service name].search.windows.net/indexers/sharepoint-indexer/status?api-version=2020-06-30-Preview
    Content-Type: application/json
    api-key: [admin key]
    
  3. تسجيل الدخول.

  4. قم بتشغيل المفهرس يدويا مرة أخرى وتحقق من حالة المفهرس. هذه المرة يجب أن يبدأ تشغيل المفهرس بنجاح.

فهرسة البيانات الأولية للوثيقة

إذا قمت بتعيين المفهرس لفهرسة البيانات الأولية للمستند ("dataToExtract": "contentAndMetadata")، فستكون البيانات الأولية التالية متاحة للفهرسة.

المعرّف النوع الوصف
metadata_spo_site_library_item_id Edm.String مفتاح الجمع بين معرف الموقع ومعرف المكتبة ومعرف العنصر الذي يحدد بشكل فريد عنصرا في مكتبة مستندات لموقع.
metadata_spo_site_id Edm.String معرف موقع SharePoint.
metadata_spo_library_id Edm.String معرف مكتبة المستندات.
metadata_spo_item_id Edm.String معرف العنصر (المستند) في المكتبة.
metadata_spo_item_last_modified Edm.DateTimeOffset آخر تاريخ/وقت معدل (UTC) للعنصر.
metadata_spo_item_name Edm.String اسم العنصر.
metadata_spo_item_size Edm.Int64 حجم (بالبايت) للعنصر.
metadata_spo_item_content_type Edm.String نوع محتوى العنصر.
metadata_spo_item_extension Edm.String تمديد العنصر.
metadata_spo_item_weburi Edm.String عنوان URI للعنصر.
metadata_spo_item_path Edm.String الجمع بين المسار الأصل واسم العنصر.

يدعم مفهرس SharePoint أيضا بيانات التعريف الخاصة بكل نوع مستند. يمكن العثور على مزيد من المعلومات في خصائص بيانات تعريف المحتوى المستخدمة في البحث المعرفي في Azure.

ملاحظة

لفهرسة بيانات التعريف المخصصة، يجب تحديد "الأعمدة الإضافية" في معلمة الاستعلام الخاصة بمصدر البيانات.

تضمين أو استبعاد حسب نوع الملف

يمكنك التحكم في الملفات التي تتم فهرستها عن طريق تعيين معايير التضمين والاستبعاد في قسم "المعلمات" من تعريف المفهرس.

قم بتضمين امتدادات ملفات محددة عن طريق الإعداد "indexedFileNameExtensions" إلى قائمة مفصولة بفواصل من امتدادات الملفات (مع نقطة بادئة). استبعاد ملحقات ملفات معينة عن طريق التعيين إلى الملحقات "excludedFileNameExtensions" التي يجب تخطيها. إذا كان الامتداد نفسه موجودا في كلتا القائمتين، استبعاده من الفهرسة.

PUT /indexers/[indexer name]?api-version=2020-06-30
{
    "parameters" : { 
        "configuration" : { 
            "indexedFileNameExtensions" : ".pdf, .docx",
            "excludedFileNameExtensions" : ".png, .jpeg" 
        } 
    }
}

التحكم في المستندات التي تمت فهرستها

يمكن لمفهرس SharePoint واحد فهرسة المحتوى من مكتبة مستندات واحدة أو أكثر. استخدم معلمة "الحاوية" في تعريف مصدر البيانات للإشارة إلى المواقع ومكتبات المستندات التي تريد الفهرسة منها. T يحتوي قسم "حاوية" مصدر البيانات على خاصيتين لهذه المهمة: "الاسم" و "الاستعلام".

الاسم

الخاصية "الاسم" مطلوبة ويجب أن تكون واحدة من ثلاث قيم:

القيمة الوصف
defaultSiteLibrary فهرسة كافة المحتويات من مكتبة المستندات الافتراضية للمواقع.
الكلالموقعمكتبات فهرسة كافة المحتويات من كافة مكتبات المستندات في موقع. لن يؤدي ذلك إلى فهرسة مكتبات المستندات من موقع فرعي. يمكن تحديدها في "الاستعلام" على الرغم من ذلك.
useQuery محتوى الفهرس المعرف في "الاستعلام" فقط.

الاستعلام

تتكون معلمة "الاستعلام" الخاصة بمصدر البيانات من أزواج الكلمات الرئيسية/القيم. فيما يلي الكلمات الرئيسية التي يمكن استخدامها. القيم هي إما عناوين URL للموقع أو عناوين URL لمكتبة المستندات.

ملاحظة

للحصول على قيمة كلمة رئيسية معينة، نوصي بالانتقال إلى مكتبة المستندات التي تحاول تضمينها/استبعادها ونسخ عنوان URI من المستعرض. هذه هي أسهل طريقة للحصول على القيمة لاستخدامها مع كلمة رئيسية في طلب البحث.

‏‏الكلمة الأساسية وصف القيمة والأمثلة
خالٍ إذا كانت فارغة أو فارغة، فقم بفهرسة مكتبة المستندات الافتراضية أو كافة مكتبات المستندات اعتمادا على اسم الحاوية.

مثال:

"container" : { "name" : "defaultSiteLibrary", "query" : null }
تضمينالمكتباتفي الموقع فهرسة المحتوى من كافة المكتبات ضمن الموقع المحدد في سلسلة الاتصال. وتقتصر هذه على المواقع الفرعية لموقعك. يجب أن تكون القيمة هي عنوان URI للموقع أو الموقع الفرعي.

مثال:

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/mysite" }
تضمينالمكتبة فهرسة كافة المحتويات من هذه المكتبة. القيمة هي المسار المؤهل بالكامل إلى المكتبة، والذي يمكن نسخه من المستعرض الخاص بك:

مثال 1 (مسار مؤهل بالكامل):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary" }

مثال 2 (عنوان URI منسوخ من متصفحك):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }
استبعادالمكتبة لا تقم بفهرسة المحتوى من هذه المكتبة. القيمة هي المسار المؤهل بالكامل إلى المكتبة، والذي يمكن نسخه من المستعرض الخاص بك:

مثال 1 (مسار مؤهل بالكامل):

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mysite.sharepoint.com/subsite1; excludeLibrary=https://mysite.sharepoint.com/subsite1/MyDocumentLibrary" }

مثال 2 (عنوان URI منسوخ من متصفحك):

"container" : { "name" : "useQuery", "query" : "includeLibrariesInSite=https://mycompany.sharepoint.com/teams/mysite; excludeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx" }
additionalColumns أعمدة الفهرس من مكتبة المستندات. القيمة عبارة عن قائمة مفصولة بفواصل من أسماء الأعمدة التي تريد فهرستها. استخدم شرطة مائلة مزدوجة للخلف من الفواصل المنقوطة والفواصل في أسماء الأعمدة:

مثال 1 (الأعمدة الإضافية = MyCustomColumn، MyCustomColumn2):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/mysite/MyDocumentLibrary;additionalColumns=MyCustomColumn,MyCustomColumn2" }

مثال 2 (أحرف الهروب باستخدام شرطة مائلة مزدوجة للخلف):

"container" : { "name" : "useQuery", "query" : "includeLibrary=https://mycompany.sharepoint.com/teams/mysite/MyDocumentLibrary/Forms/AllItems.aspx;additionalColumns=MyCustomColumnWith\\,,MyCustomColumnWith\\;" }

معالجة الأخطاء

بشكل افتراضي، يتوقف مفهرس SharePoint بمجرد أن يواجه مستندا بنوع محتوى غير معتمد (على سبيل المثال، صورة). يمكنك بالطبع استخدام المعلمة excludedFileNameExtensions لتخطي أنواع معينة من المحتوى. ومع ذلك، قد تحتاج إلى فهرسة المستندات دون معرفة جميع أنواع المحتوى المحتملة مقدما. لمتابعة الفهرسة عند مواجهة نوع محتوى غير معتمد، قم بتعيين معلمة التكوين failOnUnsupportedContentType إلى false:

PUT https://[service name].search.windows.net/indexers/[indexer name]?api-version=2020-06-30-Preview
Content-Type: application/json
api-key: [admin key]

{
    ... other parts of indexer definition
    "parameters" : { "configuration" : { "failOnUnsupportedContentType" : false } }
}

بالنسبة لبعض المستندات، يتعذر على Azure Cognitive Search تحديد نوع المحتوى، أو يتعذر عليه معالجة مستند من نوع المحتوى المدعوم بطريقة أخرى. لتجاهل وضع الفشل هذا، قم بتعيين معلمة التكوين failOnUnprocessableDocument إلى false:

"parameters" : { "configuration" : { "failOnUnprocessableDocument" : false } }

يحد Azure Cognitive Search من حجم المستندات التي تمت فهرستها. يتم توثيق هذه الحدود في حدود الخدمة في البحث المعرفي في Azure. يتم التعامل مع المستندات كبيرة الحجم على أنها أخطاء بشكل افتراضي. ومع ذلك، لا يزال بإمكانك فهرسة بيانات تعريف التخزين للمستندات كبيرة الحجم إذا قمت بتعيين indexStorageMetadataOnlyForOversizedDocuments معلمة التكوين إلى true:

"parameters" : { "configuration" : { "indexStorageMetadataOnlyForOversizedDocuments" : true } }

يمكنك أيضا متابعة الفهرسة في حالة حدوث أخطاء في أي مرحلة من مراحل المعالجة، إما أثناء تحليل المستندات أو أثناء إضافة مستندات إلى فهرس. لتجاهل عدد محدد من الأخطاء، قم بتعيين معلمات التكوين maxFailedItems والتكوين maxFailedItemsPerBatch إلى القيم المطلوبة. على سبيل المثال:

{
    ... other parts of indexer definition
    "parameters" : { "maxFailedItems" : 10, "maxFailedItemsPerBatch" : 10 }
}

راجع أيضًا