فهم مكونات البحث

مكتمل

يتكون حل الذكاء الاصطناعي Search من مكونات متعددة، يلعب كل منها دورا مهما في عملية استخراج البيانات وإثراءها وفهرستها والبحث فيها.

Data source

A diagram showing a conceptual illustration of a data source.

تبدأ معظم حلول البحث بمصدر بيانات يحتوي على البيانات التي ترغب في البحث عنها. يدعم Azure الذكاء الاصطناعي Search أنواعا متعددة من مصدر البيانات، بما في ذلك:

  • الملفات غير المنظمة في حاويات تخزين الكائن الثنائي كبير الحجم في Azure.
  • جداول في Azure SQL Database.
  • مستندات في Cosmos DB.

يمكن ل Azure الذكاء الاصطناعي Search سحب البيانات من مصادر البيانات هذه للفهرسة.

بدلاً من ذلك، يمكن للتطبيقات دفع بيانات JSON مباشرة إلى فهرس، دون سحبها من مخزن بيانات حالي.

مجموعة المهارات

A diagram a conceptual illustration of a skillset.

في حل البحث الأساسي، يمكنك فهرسة البيانات المستخرجة من مصدر البيانات. وتعتمد المعلومات التي يمكن استخراجها على مصدر البيانات. على سبيل المثال، عند فهرسة البيانات في قاعدة بيانات، قد يتم استخراج الحقول في جداول قاعدة البيانات؛ أو عند فهرسة مجموعة من المستندات، قد يتم استخراج بيانات تعريف الملف مثل اسم الملف وتاريخ التعديل والحجم والكاتب مع المحتوى النصي للمستند.

في الوقت الذي قد يكون فيه الحل الأساسي الذي يُفهرس قيم البيانات المُستخرجة مباشرة من مصدر البيانات مفيداً، عززت توقعات مستخدمي التطبيق الحديث الحاجة إلى رؤى أكثر ثراءً في البيانات. في Azure الذكاء الاصطناعي Search، يمكنك تطبيق مهارات الذكاء الاصطناعي (الذكاء الاصطناعي) كجزء من عملية الفهرسة لإثراء بيانات المصدر بمعلومات جديدة، والتي يمكن تعيينها إلى حقول الفهرسة. تُغلف المهارات التي يستخدمها مُفهرس في مجموعة المهارات التي تحدد مسار الإثراء في كل خطوة يتم فيها تعزيز بيانات المصدر مع الرؤى التي تم الحصول عليها من خلال مهارة ذكاء اصطناعي محددة. أمثلة على نوع المعلومات التي يمكن استخراجها من قبل مهارة الذكاء الاصطناعي:

  • اللغة التي تتم كتابة المستند بها.
  • العبارات الرئيسية التي قد تساعد في تحديد الموضوعات أو المحاور الرئيسية التي تمت مناقشتها في المستند.
  • درجة التوجه التي تحدد مدى إيجابية أو سلبية المستند.
  • مواقع أو أشخاص أو مؤسسات أو معالم محددة مذكورة في المحتوى.
  • التوصيفات التي تم إنشاؤها من خلال الذكاء الاصطناعي للصور أو نص صورة مستخرج بواسطة التعرف البصري على الأحرف.
  • المهارات المخصصة التي تُطورها لتلبية متطلبات محددة.

المُفهرس

A diagram showing a conceputal illustration of an indexer.

المُفهرس هو المحرك الذي يقود عملية الفهرسة بأكملها. إذ يأخذ النواتج المُستخرجة باستخدام المهارات في مجموعة المهارات، إلى جانب البيانات وقيم بيانات التعريف المُستخرجة من مصدر البيانات الأصلي، ويُعينها إلى الحقول في الفهرس.

يُشغّل المُفهرس تلقائياً بمجرد إنشائه، ويمكن جدولته ليعمل على فترات منتظمة أو عند الطلب لإضافة المزيد من المستندات إلى الفهرس. في بعض الحالات، مثل تلك التي تُضيف فيها حقولاً جديدة إلى فهرس أو مهارات جديدة إلى مجموعة مهارات، قد تحتاج إلى إعادة ضبط الفهرس قبل إعادة تشغيل المُفهرس.

الفهرس

A diagram showing a conceputal illustration of an index.

الفهرس هو النتيجة القابلة للبحث من عملية الفهرسة. وهو يتألف من مجموعة من مستندات JSON، مع الحقول التي تحتوي على القيم المُستخرجة أثناء الفهرسة. يمكن لتطبيقات العميل استعلام الفهرس لاسترداد المعلومات وتصفيتها وفرزها.

يمكن تكوين كل حقل فهرس مع السمات التالية:

  • key: الحقول التي تحدد مفتاحًا فريدًا لسجلات الفهرس.
  • searchable:الحقول التي يمكن الاستعلام عنها باستخدام البحث عن نص كامل.
  • filterable: الحقول التي يمكن تضمينها في تعبيرات عامل التصفية لإرجاع المستندات التي تطابق القيود المحددة فقط.
  • sortable:الحقول التي يمكن استخدامها لترتيب النتائج.
  • facetable:الحقول التي يمكن استخدامها لتحديد القيم للبيانات الوصفية (عناصر واجهة المستخدم المستخدمة لتصفية النتائج بناءً على قائمة بقيم الحقول المعروفة).
  • قابلية الاسترداد: الحقول التي يمكن تضمينها في نتائج البحث (جميع الملفات قابلة للاسترداد افتراضياً ما لم تُزل هذه السمة بوضوح).