متى تستخدم ضبط Azure OpenAI

عند تحديد ما إذا كان الضبط الدقيق هو الحل الصحيح لاستكشاف حالة استخدام معينة أم لا، هناك بعض المصطلحات الرئيسية التي من المفيد أن تكون على دراية بها:

  • هندسة المطالبة هي تقنية تتضمن تصميم مطالبات لنماذج معالجة اللغة الطبيعية. تعمل هذه العملية على تحسين الدقة والأهمية في الاستجابات، وتحسين أداء النموذج.
  • يحسن استرداد الجيل المعزز (RAG) أداء نموذج اللغة الكبيرة (LLM) من خلال استرداد البيانات من مصادر خارجية ودمجها في مطالبة. تسمح RAG للشركات بتحقيق حلول مخصصة مع الحفاظ على أهمية البيانات وتحسين التكاليف.
  • تعمل الضبط الدقيق على إعادة تدريب نموذج لغة كبيرة موجود باستخدام بيانات نموذجية، ما يؤدي إلى نموذج لغة كبيرة جديد "مخصص" تم تحسينه باستخدام الأمثلة المتوفرة.

ما هو الضبط الدقيق مع Azure OpenAI؟

عندما نتحدث عن الضبط الدقيق، فإننا نعني حقا الضبط الدقيق الخاضع للإشراف وليس التدريب المسبق المستمر أو التعلم المعزز من خلال الملاحظات البشرية (RLHF). يشير الضبط الدقيق الخاضع للإشراف إلى عملية إعادة تدريب النماذج المدربة مسبقا على مجموعات بيانات محددة، عادة لتحسين أداء النموذج على مهام محددة أو تقديم معلومات لم يتم تمثيلها بشكل جيد عندما تم تدريب النموذج الأساسي في الأصل.

الضبط الدقيق هو تقنية متقدمة تتطلب خبرة لاستخدامها بشكل مناسب. ستساعدك الأسئلة أدناه على تقييم ما إذا كنت مستعدا للضبط الدقيق، ومدى تفكيرك في العملية. يمكنك استخدام هذه الخطوات لتوجيه خطواتك التالية أو تحديد نهج أخرى قد تكون أكثر ملاءمة.

لماذا تريد ضبط نموذج؟

  • يجب أن تكون قادرا على توضيح حالة استخدام محددة بوضوح لضبط وتحديد النموذج الذي تأمل في ضبطه.
  • تتضمن حالات الاستخدام الجيدة للضبط الدقيق توجيه النموذج لإخراج المحتوى بأسلوب أو نغمة أو تنسيق معين ومخصص أو سيناريوهات تكون فيها المعلومات المطلوبة لتوجيه النموذج طويلة جدا أو معقدة بحيث لا يمكن احتواؤها في نافذة المطالبة.

العلامات الشائعة التي قد لا تكون جاهزا للضبط الدقيق حتى الآن:

  • لا توجد حالة استخدام واضحة للضبط الدقيق، أو عدم القدرة على التعبير عن أكثر بكثير من "أريد تحسين النموذج".
  • إذا قمت بتحديد التكلفة كمحفز أساسي، فتابع بحذر. قد يؤدي الضبط الدقيق إلى تقليل التكاليف لبعض حالات الاستخدام عن طريق تقصير المطالبات أو السماح لك باستخدام نموذج أصغر ولكن هناك تكلفة مقدمة أعلى للتدريب وسيتعين عليك الدفع مقابل استضافة النموذج المخصص الخاص بك. راجع صفحة التسعير لمزيد من المعلومات حول تكاليف ضبط Azure OpenAI.
  • إذا كنت ترغب في إضافة معرفة بالمجال إلى النموذج، يجب أن تبدأ بالجيل المعزز المسترد (RAG) بميزات مثل Azure OpenAI على بياناتك أو عمليات التضمين. غالبا ما يكون هذا الخيار أرخص وأكثر قابلية للتكيف وربما أكثر فعالية اعتمادا على حالة الاستخدام والبيانات.

ما الذي جربته حتى الآن؟

الضبط الدقيق هو قدرة متقدمة، وليس نقطة البداية لرحلة الذكاء الاصطناعي التوليدية. يجب أن تكون على دراية بأساسيات استخدام نماذج اللغات الكبيرة (LLMs). يجب أن تبدأ بتقييم أداء نموذج أساسي مع الهندسة الفورية و/أو استرداد الجيل المعزز (RAG) للحصول على أساس للأداء.

يعد وجود أساس للأداء دون ضبط أمرا ضروريا لمعرفة ما إذا كان الضبط الدقيق قد أدى إلى تحسين أداء النموذج أم لا. إن الضبط الدقيق للبيانات السيئة يجعل النموذج الأساسي أسوأ، ولكن بدون خط أساسي، من الصعب اكتشاف التراجعات.

إذا كنت جاهزا لضبطك:

  • يجب أن تكون قادرة على إظهار الأدلة والمعرفة بالهندسة السريعة والنهج القائمة على RAG.
  • كن قادرا على مشاركة تجارب وتحديات محددة مع تقنيات أخرى غير الضبط الدقيق الذي تمت تجربته بالفعل لحالة الاستخدام الخاصة بك.
  • وينبغي إجراء تقييمات كمية لأداء خط الأساس كلما أمكن ذلك.

العلامات الشائعة التي قد لا تكون جاهزا للضبط الدقيق حتى الآن:

  • بدءا من الضبط الدقيق دون اختبار أي تقنيات أخرى.
  • معرفة أو فهم غير كافين حول كيفية تطبيق الضبط الدقيق على نماذج اللغات الكبيرة (LLMs).
  • لا توجد قياسات معيارية لتقييم الضبط الدقيق مقابلها.

ما الذي لا يعمل مع الأساليب البديلة؟

يجب أن يوفر فهم مكان قصر الهندسة الفورية إرشادات حول الضبط الدقيق الخاص بك. هل فشل النموذج الأساسي في حالات الحافة أو الاستثناءات؟ هل لا يوفر النموذج الأساسي الإخراج بالتنسيق الصحيح باستمرار، ولا يمكنك احتواء أمثلة كافية في نافذة السياق لإصلاحه؟

ستساعدك أمثلة الفشل مع النموذج الأساسي والهندسة الفورية على تحديد البيانات التي يحتاجون إلى جمعها للضبط الدقيق، وكيف يجب تقييم النموذج المضبط.

فيما يلي مثال: أراد العميل استخدام GPT-3.5-Turbo لتحويل أسئلة اللغة الطبيعية إلى استعلامات بلغة استعلام محددة غير قياسية. وقدموا إرشادات في المطالبة ("إرجاع دائما GQL") واستخدموا RAG لاسترداد مخطط قاعدة البيانات. ومع ذلك، لم يكن بناء الجملة صحيحا دائما وغالبا ما فشل لحالات الحافة. جمعوا الآلاف من الأمثلة على أسئلة اللغة الطبيعية والاستعلامات المكافئة لقاعدة البيانات الخاصة بهم، بما في ذلك الحالات التي فشل فيها النموذج من قبل - واستخدموا تلك البيانات لضبط النموذج. جلب الجمع بين نموذجهم الجديد المضبط مع المطالبة الهندسية والاسترداد دقة مخرجات النموذج حتى المعايير المقبولة للاستخدام.

إذا كنت جاهزا لضبطك:

  • لديك أمثلة واضحة حول كيفية التعامل مع التحديات في النهج البديلة وما تم اختباره كحلول ممكنة لتحسين الأداء.
  • لقد حددت أوجه القصور باستخدام نموذج أساسي، مثل الأداء غير المتسق على حالات الحافة، وعدم القدرة على احتواء عدد قليل من مطالبات اللقطات في نافذة السياق لتوجيه النموذج، وزمن الانتقال العالي، وما إلى ذلك.

العلامات الشائعة التي قد لا تكون جاهزا للضبط الدقيق حتى الآن:

  • معرفة غير كافية من النموذج أو مصدر البيانات.
  • عدم القدرة على العثور على البيانات المناسبة لخدمة النموذج.

ما هي البيانات التي ستستخدمها للضبط الدقيق؟

حتى مع وجود حالة استخدام رائعة، لا يعد الضبط الدقيق جيدا إلا بجودة البيانات التي يمكنك توفيرها. تحتاج إلى أن تكون على استعداد لاستثمار الوقت والجهد للقيام بعمل الضبط الدقيق. تتطلب النماذج المختلفة وحدات تخزين بيانات مختلفة ولكن غالبا ما تحتاج إلى أن تكون قادرا على توفير كميات كبيرة إلى حد ما من البيانات المنسقة عالية الجودة.

نقطة مهمة أخرى حتى مع البيانات عالية الجودة إذا لم تكن بياناتك بالتنسيق اللازم لضبط ستحتاج إلى الالتزام بالموارد الهندسية من أجل تنسيق البيانات بشكل صحيح.

بيانات Babbage-002 وDvinci-002 GPT-3.5-Turbo
الحجم آلاف الأمثلة آلاف الأمثلة
Format المطالبة/الإكمال دردشة محادثة

إذا كنت جاهزا لضبطك:

  • تحديد مجموعة بيانات للضبط الدقيق.
  • مجموعة البيانات بالتنسيق المناسب للتدريب.
  • تم استخدام مستوى معين من التنسيق لضمان جودة مجموعة البيانات.

العلامات الشائعة التي قد لا تكون جاهزا للضبط الدقيق حتى الآن:

  • لم يتم تحديد مجموعة البيانات بعد.
  • لا يتطابق تنسيق مجموعة البيانات مع النموذج الذي ترغب في ضبطه.

كيف تقيس جودة نموذجك الدقيق؟

لا توجد إجابة واحدة صحيحة على هذا السؤال، ولكن يجب أن يكون لديك أهداف محددة بوضوح لما يبدو عليه النجاح مع الضبط الدقيق. من الناحية المثالية، لا ينبغي أن يكون هذا نوعيا فحسب، بل يجب أن يتضمن مقاييس كمية للنجاح مثل استخدام مجموعة معمدة من البيانات للتحقق من الصحة، بالإضافة إلى اختبار قبول المستخدم أو اختبار A/B للنموذج الدقيق مقابل نموذج أساسي.

الخطوات التالية