التشغيل السريع: إنشاء فهرس بحث في مدخل Azure

في التشغيل السريع ل Azure الذكاء الاصطناعي Search، أنشئ فهرس البحث الأول باستخدام معالج استيراد البيانات ومصدر بيانات نموذجي مضمن يتكون من بيانات فندق وهمية تستضيفها Microsoft. يرشدك المعالج خلال إنشاء فهرس بحث بدون تعليمات برمجية لمساعدتك في كتابة استعلامات مثيرة للاهتمام في غضون دقائق.

ينشئ المعالج كائنات متعددة على خدمة البحث - فهرس قابل للبحث - ولكن أيضا مفهرس واتصال مصدر بيانات لاسترداد البيانات تلقائيا. في نهاية هذا التشغيل السريع، نراجع كل كائن.

إشعار

يتضمن معالج استيراد البيانات خيارات التعرف البصري على الحروف وترجمة النص وإثراء الذكاء الاصطناعي الأخرى غير المشمولة في هذا التشغيل السريع. للحصول على معاينة مماثلة تركز على الإثراء الذكاء الاصطناعي، راجع التشغيل السريع: إنشاء مجموعة مهارات في مدخل Microsoft Azure.

المتطلبات الأساسية

التحقق من وجود مساحة

يبدأ العديد من العملاء بالخدمة المجانية. يقتصر المستوى الحر على ثلاثة فهارس وثلاثة مصادر للبيانات وثلاثة مفهرسات. تأكد من أن لديك مساحة للعناصر الإضافية قبل أن تبدأ. ينشئ هذا التشغيل السريع أحد كل كائن.

تحقق من علامة التبويب استخدام النظرة العامة > للخدمة لمعرفة عدد الفهارس والمفهرسات ومصادر البيانات الموجودة لديك بالفعل.

Screenshot of the Overview page for an Azure AI Search service instance in the Azure portal, showing the number of indexes, indexers, and data sources.

بدء تشغيل المعالج

  1. سجل الدخول إلى مدخل Microsoft Azure باستخدام حساب Azure الخاص بك، وانتقل إلى Azure الذكاء الاصطناعي خدمة البحث.

  2. في صفحة Overview ، حدد Import data لبدء تشغيل المعالج.

    Screenshot that shows how to open the Import data wizard in the Azure portal.

إنشاء فهرس وتحميله

في هذا القسم، قم بإنشاء فهرس وتحميله في أربع خطوات.

الاتصال بمصدر البيانات

ينشئ المعالج اتصال مصدر بيانات لعينة من البيانات التي تستضيفها Microsoft على Azure Cosmos DB. يتم استرداد البيانات النموذجية هذه التي يتم الوصول إليها عبر اتصال داخلي. لا تحتاج إلى حساب Azure Cosmos DB الخاص بك أو ملفات المصدر لتشغيل هذا التشغيل السريع.

  1. في الاتصال إلى بياناتك، قم بتوسيع القائمة المنسدلة مصدر البيانات وحدد عينات.

  2. في قائمة العينات المضمنة، حدد hotels-sample.

    Screenshot that shows how to select the hotels-sample data source in the Import data wizard.

  3. حدد التالي: إضافة المهارات المعرفية (اختياري) للمتابعة.

تخطي التكوين للمهارات المعرفية

يدعم معالج استيراد البيانات إنشاء مجموعة مهارات وإثراء الذكاء الاصطناعي في الفهرسة.

  1. بالنسبة لهذا التشغيل السريع، تجاهل خيارات تكوين الإثراء الذكاء الاصطناعي في علامة التبويب Add cognitive skills .

  2. حدد تخطي إلى: تخصيص الفهرس الهدف للمتابعة.

    Screenshot that shows how to Skip to the Customize target index tab in the Import data wizard.

تلميح

هل أنت مهتم بالإثراء الذكاء الاصطناعي؟ جرب هذا التشغيل السريع: إنشاء مجموعة مهارات في مدخل Microsoft Azure

تكوين الفهرس

يستنتج المعالج مخططا لمؤشر نموذج الفنادق المضمن. اتبع هذه الخطوات لتكوين الفهرس:

  1. اقبل القيم التي أنشأها النظام لاسم الفهرس (hotels-sample-index) وحقل المفتاح (HotelId).

  2. اقبل القيم التي أنشأها النظام لكافة سمات الحقول.

    هام

    إذا قمت بإعادة تشغيل المعالج واستخدام مصدر بيانات نموذج فنادق موجود، فلن يتم تكوين الفهرس باستخدام السمات الافتراضية. يجب عليك تحديد السمات يدويا على عمليات الاستيراد المستقبلية.

  3. حدد التالي: إنشاء مفهرس للمتابعة.

Screenshot that shows the generated index definition for the hotels-sample data source in the Import data wizard.

كحد أدنى، يتطلب الفهرس اسم فهرس ومجموعة من الحقول. يجب وضع علامة على حقل واحد كمفتاح مستند لتعريف كل مستند بشكل فريد. القيمة هي دائما سلسلة. يقوم المعالج بالفحص بحثا عن حقول سلسلة فريدة ويختار حقلا للمفتاح.

يحتوي كل حقل على اسم ونوع بيانات وسمات تتحكم في كيفية استخدام الحقل في فهرس البحث. تمكن خانات الاختيار السمات التالية أو تعطلها:

  • قابل للاسترداد: الحقول التي تم إرجاعها في استجابة استعلام.
  • قابل للتصفية: الحقول التي تقبل تعبير عامل تصفية.
  • قابل للفرز: الحقول التي تقبل تعبير orderby.
  • Facetable: الحقول المستخدمة في بنية تنقل ذات واجهة.
  • قابل للبحث: الحقول المستخدمة في البحث عن النص الكامل. سلاسل قابلة للبحث. غالبًا ما يتم تحديد الحقول الرقمية والحقول المنطقية على أنها حقول غير قابلة للبحث.

يتم إسناد السلاسل على أنها قابلة للاسترداد وقابلة للبحث. تنسب الأعداد الصحيحة على أنها قابلة للاسترداد، وقابلة للتصفية، وقابلة للفرز، وقابلة للواجهة.

تؤثر السمات على التخزين. تستهلك الحقول القابلة للتصفية مساحة تخزين إضافية، ولكن لا تستهلك القابلة للاسترداد . لمزيد من المعلومات، راجع مثال يوضح الآثار المترتبة على التخزين للسمات والمقترحين.

إذا كنت تريد الإكمال التلقائي أو الاستعلامات المقترحة، فحدد محللات اللغة أو المقترحات.

تكوين المفهرس وتشغيله

تقوم الخطوة الأخيرة بتكوين المفهرس وتشغيله. يعرف هذا الكائن عملية قابلة للتنفيذ. يتم إنشاء مصدر البيانات والفهرس والمفهرس في هذه الخطوة.

  1. اقبل القيمة التي أنشأها النظام لاسم المفهرس (hotels-sample-indexer).

  2. لهذا التشغيل السريع، استخدم الخيار الافتراضي لتشغيل المفهرس مرة واحدة، على الفور. البيانات المستضافة ثابتة لذلك لا يتم تمكين تعقب التغييرات لها.

  3. حدد إرسال لإنشاء المفهرس وتشغيله في وقت واحد.

    Screenshot that shows how to configure the indexer for the hotels-sample data source in the Import data wizard.

مراقبة تقدم المفهرس

يمكنك مراقبة إنشاء المفهرس أو الفهرس في المدخل. توفر صفحة نظرة عامة على الخدمة ارتباطات إلى الموارد التي تم إنشاؤها في الذكاء الاصطناعي خدمة البحث Azure.

  1. على اليسار، حدد Indexers.

    Screenshot that shows the creation of the indexer in progress in the Azure portal.

    قد يستغرق تحديث نتائج الصفحة في مدخل Microsoft Azure بضع دقائق. يجب أن تشاهد المفهرس الذي تم إنشاؤه حديثا في القائمة بحالة قيد التقدم أو Success. تعرض القائمة أيضا عدد المستندات المفهرسة.

التحقق من نتائج فهرس البحث

  1. على اليسار، حدد فهارس.

  2. حدد hotels-sample-index.

    انتظر حتى يتم تحديث صفحة مدخل Microsoft Azure. يجب أن تشاهد الفهرس مع عدد المستندات وحجم التخزين.

    Screenshot of the Indexes list on the Azure AI Search service dashboard in the Azure portal.

  3. حدد علامة التبويب Fields لعرض مخطط الفهرس.

    تحقق لمعرفة الحقول القابلة للتصفية أو الفرز بحيث تعرف الاستعلامات التي يجب كتابتها.

    Screenshot that shows the schema definition for an index in the Azure AI Search service in the Azure portal.

إضافة حقول أو تغييرها

في علامة التبويب حقول ، يمكنك إنشاء حقل جديد باستخدام إضافة حقل باسم ونوع بيانات معتمد وإسنادات.

من الصعب تغيير الحقول الموجودة. الحقول الموجودة لها تمثيل فعلي في الفهرس بحيث لا تكون قابلة للتعديل، ولا حتى في التعليمات البرمجية. لتغيير حقل موجود بشكل أساسي، تحتاج إلى إنشاء حقل جديد يحل محل الحقل الأصلي. يمكن إضافة بنيات أخرى، مثل ملفات تعريف النقاط وخيارات CORS، إلى فهرس في أي وقت.

لفهم ما يمكنك تحريره وما لا يمكنك تحريره بوضوح أثناء تصميم الفهرس، خذ دقيقة لعرض خيارات تعريف الفهرس. تشير الخيارات الرمادية في قائمة الحقول إلى القيم التي لا يمكن تعديلها أو حذفها.

الاستعلام باستخدام مستكشف Search

لديك الآن فهرس بحث يمكن الاستعلام فيه باستخدام مستكشف البحث. يرسل مستكشف البحث استدعاءات REST التي تتوافق مع Search POST REST API. تدعم الأداة بناء جملة استعلام بسيط وبناء جملة استعلام Lucene الكامل.

  1. في علامة التبويب مستكشف البحث، أدخل نصا للبحث فيه.

    Screenshot that shows how to enter and run a query in the Search Explorer tool.

  2. استخدم الخريطة المصغرة للانتقال بسرعة إلى مناطق غير مرئية من الإخراج.

    Screenshot that shows long results for a query in the Search Explorer tool and the mini-map.

  3. لتحديد بناء الجملة، قم بالتبديل إلى طريقة عرض JSON.

    Screenshot of the JSON view selector.

مثال على استعلامات لفهرس عينة الفنادق

تفترض الأمثلة التالية طريقة عرض JSON وإصدار واجهة برمجة تطبيقات REST 2023-11-01.

أمثلة التصفية

يمكن تصفية مواقف السيارات والعلامات وتاريخ التجديد والتصنيف والموقع.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "Rating gt 4"
}

تفترض عوامل التصفية المنطقية "صواب" بشكل افتراضي.

{
    "search": "beach OR spa",
    "select": "HotelId, HotelName, Description, Rating",
    "count": true,
    "top": 10,
    "filter": "ParkingIncluded"
}

يستند البحث الجغرافي المكاني إلى عامل تصفية. تقوم geo.distance الدالة بتصفية جميع النتائج للبيانات الموضعية استنادا إلى الإحداثيات و geography'POINT المحددةLocation. يبحث الاستعلام عن الفنادق التي تقع على بعد 5 كيلومترات من إحداثيات -122.12 47.67خط الطول العرضي ، وهي "ريدموند، واشنطن، الولايات المتحدة الأمريكية". يعرض الاستعلام العدد الإجمالي للمطابقات &$count=true مع أسماء الفنادق ومواقع العناوين.

{
    "search": "*",
    "select": "HotelName, Address/City, Address/StateProvince",
    "count": true,
    "top": 10,
    "filter": "geo.distance(Location, geography'POINT(-122.12 47.67)') le 5"
}

أمثلة على بناء جملة Lucene الكامل

بناء الجملة الافتراضي هو بناء جملة بسيط، ولكن إذا كنت تريد البحث الغامض أو تعزيز المصطلح أو التعبيرات العادية، فحدد بناء الجملة الكامل.

{
    "queryType": "full",
    "search": "seatle~",
    "select": "HotelId, HotelName,Address/City, Address/StateProvince",
    "count": true
}

بشكل افتراضي، تفشل مصطلحات الاستعلام التي بها أخطاء إملائية Seattle مثل seatle إرجاع التطابقات في بحث نموذجي. queryType=full تستدعي المعلمة محلل استعلام Lucene الكامل، والذي يدعم معامل tilde~. عند وجود هذه المعلمات، يقوم الاستعلام بإجراء بحث غامض عن الكلمة الأساسية المحددة. يبحث الاستعلام عن نتائج مطابقة مع نتائج مشابهة للكلمة الأساسية ولكنها ليست مطابقة تماما لها.

خذ دقيقة لتجربة بعض هذه الاستعلامات النموذجية للفهرس الخاص بك. لمعرفة المزيد حول الاستعلامات، راجع الاستعلام في Azure الذكاء الاصطناعي Search.

تنظيف الموارد

عند العمل في اشتراكك الخاص، من الجيد في نهاية المشروع تحديد ما إذا كنت لا تزال بحاجة إلى الموارد التي أنشأتها. الموارد المتبقية قيد التشغيل يمكن أن تكلفك المال. يمكنك حذف الموارد بشكل فردي أو حذف مجموعة الموارد لحذف تشكيلة الموارد بأكملها.

يمكنك العثور على الموارد وإدارتها للخدمة في مدخل Microsoft Azure ضمن All resources أو Resource groups في الجزء الأيمن.

إذا كنت تستخدم خدمة مجانية، فتذكر أن الحد هو ثلاثة فهارس ومفهرسات ومصادر بيانات. يمكنك حذف العناصر الفردية في مدخل Microsoft Azure للبقاء تحت الحد.

الخطوات التالية

جرب معالج مدخل Microsoft Azure لإنشاء تطبيق ويب جاهز للاستخدام يتم تشغيله في مستعرض. استخدم هذا المعالج على الفهرس الصغير الذي أنشأته في هذا التشغيل السريع، أو استخدم إحدى مجموعات البيانات النموذجية المضمنة للحصول على تجربة بحث أكثر ثراء.