مقدمة في الهندسة الفورية

تستند نماذج GPT-3 وGPT-3.5 وGPT-4 من OpenAI إلى المطالبة. باستخدام النماذج المستندة إلى المطالبة، يتفاعل المستخدم مع النموذج عن طريق إدخال مطالبة نصية، يستجيب لها النموذج بإكمال النص. هذا الإكمال هو استمرار النموذج لنص الإدخال.

في حين أن هذه النماذج قوية للغاية، فإن سلوكها حساس جدا أيضا للمطالبة. وهذا يجعل البناء السريع مهارة مهمة للتطوير.

يمكن أن يكون البناء الفوري صعبا. في الممارسة العملية، تعمل المطالبة على تكوين أوزان النموذج لإكمال المهمة المطلوبة، ولكنها فن أكثر من علم، غالبا ما تتطلب خبرة والحدس لصياغة مطالبة ناجحة. الهدف من هذه المقالة هو مساعدتك على البدء في عملية التعلم هذه. يحاول تسجيل المفاهيم والأنماط العامة التي تنطبق على جميع نماذج GPT. ومع ذلك، من المهم أن نفهم أن كل نموذج يتصرف بشكل مختلف، لذلك قد لا تنطبق التعلمات بشكل متساو على جميع النماذج.

أساسيات

يغطي هذا القسم المفاهيم والعناصر الأساسية لمطالبات GPT.

المطالبات النصية هي كيفية تفاعل المستخدمين مع نماذج GPT. كما هو الحال مع جميع نماذج اللغات التوليدية، تحاول نماذج GPT إنتاج السلسلة التالية من الكلمات التي من المرجح أن تتبع من النص السابق. كما لو أننا نقول ما هو أول شيء يأتي إلى عقلك عندما أقول <prompt>؟. توضح الأمثلة أدناه هذا السلوك. نظرا للكلمات الأولى للمحتوى الشهير، فإن النموذج قادر على متابعة النص بدقة.

المطالبة الاكتمال
أربع نقاط وقبل سبع سنوات لدينا الآباء جلبوا في هذه القارة، أمة جديدة، تصور في الحرية، ومكرسة لاقتراح أن يتم خلق جميع الرجال على قدم المساواة. [...]
"اتصل بي اسماعيل" "قبل بضع سنوات - لا يهم كم من الوقت على وجه التحديد - وجود القليل o لا مال في حقيبتي، ولا شيء خاص لاهتمامي بي على الشاطئ، ظننت أنني سأبحر قليلا وأرى الجزء المائي من العالم." [...]

أثناء تطوير مطالبات أكثر تعقيدا، من المفيد وضع هذا السلوك الأساسي في الاعتبار. بغض النظر عن المطالبة المقدمة، فإن النموذج يستجيب ببساطة بما يحدده على الأرجح (نظرا لبيانات التدريب وأهداف التدريب الخاصة به). إذا كنت تطرح سؤالا في مطالبتك، فإن النموذج لا يتبع مسار تعليمة برمجية منفصل "Q&A"، ولكن بدلا من ذلك يبدو أنه يجيب على السؤال لأن الإجابة هي النوع الأكثر احتمالا من الاستجابة للسؤال المحدد كمدخل.

المطالبة بالمكونات

عند استخدام واجهة برمجة تطبيقات الإكمال بينما لا يوجد تمييز بين أجزاء مختلفة من المطالبة، يمكن أن يظل من المفيد للتعلم والمناقشة تحديد مكونات المطالبة الأساسية. باستخدام واجهة برمجة تطبيقات إكمال الدردشة، هناك أقسام مميزة من المطالبة التي يتم إرسالها إلى واجهة برمجة التطبيقات في شكل صفيف من القواميس ذات الأدوار المقترنة: النظام والمستخدم والمساعد. يركز هذا التوجيه بشكل عام على كيفية التفكير في البناء السريع بدلا من توفير إرشادات توجيهية خاصة بواجهة برمجة تطبيقات واحدة على أخرى.

من المهم أيضا أن نفهم أنه في حين يمكن أن تكون هناك طرق صالحة أخرى لتفكيك المطالبات، فإن الهدف من هذا التصنيف هو توفير طريقة بسيطة نسبيا للتفكير في البناء السريع. مع واجهة برمجة تطبيقات الإكمال، تكون جميع المكونات اختيارية، ولكن يجب أن يكون واحد على الأقل موجودا وأن تتضمن معظم المطالبات أكثر من مكون واحد. يمكن أن تكون هناك منطقة رمادية بين المكونات أيضا. يتوافق الترتيب المقدم أدناه تقريبا مع كيفية استخدام كل مكون بشكل شائع، من الأكثر إلى الأقل.

الإرشادات

من المحتمل أن تكون الإرشادات مكون المطالبة الأكثر استخداما. التعليمات هي ببساطة ما يلي: تعليمات للنموذج حول ما يجب القيام به. على الرغم من أنها بسيطة في المفهوم، فإنها يمكن أن تكون معقدة في الممارسة العملية. يوضح الجدول التالي ذلك من خلال إظهار التعليمات البسيطة والأكثر تعقيدا، في شكلين مختلفين.

نوع التعليمات المطالبة الاكتمال
تعليمات بسيطة اكتب مقدمة لرسالة إخبارية أسبوعية. مرحبا بكم في رسالتنا الإخبارية الأسبوعية. هذا الأسبوع لدينا تركيز خاص على الإنتاجية. سنشارك نصائح ونصائح حول كيفية أن تكون منتجا في جميع مجالات حياتك. نأمل أن تستمتع ويرجى المشاركة مع أصدقائك!
تعليمات معقدة اكتب مقدمة لرسالة إخبارية أسبوعية إلى شركتي باسم Contoso. وينبغي أن يذكر هذا الاجتماع العظيم الذي عقدناه الأسبوع الماضي، ويشكر الفريق على كل ما بذلوه من عمل شاق خلال الأشهر القليلة الماضية الصعبة. مرحبا بكم في الرسالة الإخبارية الأسبوعية لمجموعة Contoso! لقد عقدنا اجتماعا رائعا في الأسبوع الماضي وأود أن أشكر الفريق على كل ما بذله من عمل شاق خلال الأشهر القليلة الماضية الصعبة. نحن نتطلع إلى مستقبل مشرق وأنا واثق من أننا سنحقق أشياء عظيمة من خلال تفاني فريقنا والتزامه. شكرا لك لكونك جزءا من فريقنا وأتطلع إلى العمل معكم جميعا في الأسابيع والأشهر القادمة. بإخلاص، [اسمك].
تعليمات معقدة اكتب مقدمة لرسالة إخبارية أسبوعية، بما في ذلك ما يلي:
- تسمى شركتي contoso
- تحية مبهجة
- شكر الفريق على عملهم الشاق خلال شهرين صعبين
- توقعات إيجابية للربع القادم
- موقع من قبل SLT
مرحبا بفريق Contoso! أردت أن أستغرق لحظة لأشكرك على كل أعمالك الشاقة خلال الأشهر القليلة الماضية. لقد كانت بضعة أشهر صعبة ، ولكن كنت قد سحبت جميعا معا وفعلت وظيفة مذهلة. أنا حقا فخور بكم جميعا. بالنظر إلى الربع القادم، أشعر بالإيجابية حقا. أعتقد أننا سنحقق بعض الأشياء العظيمة. شكرا مرة أخرى، فريق القيادة العليا.

المحتوى الأساسي

يشير المحتوى الأساسي إلى نوع من النص الذي تتم معالجته أو تحويله بواسطة النموذج. عادة ما يتم استخدام المحتوى الأساسي بالاقتران مع الإرشادات. ومن الأمثلة البسيطة على ذلك ترجمة اللغة. في المثال أدناه، سيتم اعتبار النص الإنجليزي المحتوى الأساسي بينما "الترجمة إلى الفرنسية:" هي تعليمات.

المطالبة الاكتمال
هل يمكنك رجاء إخباري كيف يمكنني الوصول إلى المتحف؟
الترجمة إلى الفرنسية:
Pouvez-vous s'il vous plaît me dire comment aller au musée?

يمكن أن يكون المحتوى الأساسي أيضا أطول بكثير. في المثال التالي، المحتوى الأساسي هو قسم المقدمة من إدخال ويكيبيديا حول تعقيد الوقت، والذي يبلغ طوله حوالي 300 كلمة. تم اختصار هذا المحتوى في جدولنا لسهولة العرض.

المطالبة الاكتمال
في علوم الكمبيوتر، تعقيد الوقت هو التعقيد الحسابي الذي يصف مقدار وقت الكمبيوتر الذي يستغرقه تشغيل الخوارزمية. يتم تقدير تعقيد الوقت عادة من قبل [...]
تلخيص النص السابق في بضع جمل:
تعقيد الوقت هو مقياس للمدة التي تستغرقها الخوارزمية للتشغيل. يتم التعبير عنه عادة كدالة لحجم الإدخال. المقياس الأكثر شيوعا هو تعقيد الوقت في أسوأ الحالات، وهو الحد الأقصى للوقت المطلوب للمدخلات ذات الحجم المحدد.
في علوم الكمبيوتر، تعقيد الوقت هو التعقيد الحسابي الذي يصف مقدار وقت الكمبيوتر الذي يستغرقه تشغيل الخوارزمية. يتم تقدير تعقيد الوقت عادة من قبل [...]
TL;DR (لم تتم قراءة مدة طويلة جدا)
تعقيد الوقت للخوارزمية هو مقدار الوقت الذي يستغرقه تشغيل الخوارزمية. عادة ما يتم تقدير تعقيد الوقت عن طريق حساب عدد العمليات الأولية التي تقوم بها الخوارزمية، ما يعني أن كل عملية أولية تستغرق وقتا ثابتا لتنفيذها. يتم التعبير عن تعقيد الوقت بشكل عام كدالة لحجم الإدخال.

يمكن لنماذج GPT أيضا معالجة المحتوى الأساسي المنظم. في المثال أدناه، يتم تمرير TSV حول البيرة في بلجيكا (مختصر للعرض في هذه المقالة) إلى النموذج كجزء من المطالبة. وهي قادرة على تفسير المحتوى بشكل صحيح والإجابة على الأسئلة حول البيانات.

المطالبة الاكتمال
Belgian Beer Brands
Beer name Beer style color ABV Brewery
"Chimay Gold: ""Doree""" trappist pale ale gold 4.80% Chimay Brewery (official trappist)
"Chimay Blue: ""Grande Reserve""" trappist dark ale dark 9.00%
[...]
بالرجوع إلى الجدول أعلاه، كم عدد البيرة أقل من 6٪ ABV؟
هناك 10 البيرة في الجدول التي هي أقل من 6٪ ABV.

الأمثلة

غالبا ما تعتمد المطالبات الناجحة على ممارسة التعلم "طلقة واحدة" أو "لقطة قليلة". يشير هذا إلى تضمين مثال واحد أو أكثر من السلوك المطلوب للنموذج، عادة عن طريق تضمين أزواج الإدخال والإخراج. هذا لا يتعلم بمعنى أن النموذج يتغير بشكل دائم، ولكن بدلا من ذلك فإن الأمثلة شرط أفضل للنموذج للاستجابة كما هو مطلوب للاستدلال الحالي فقط. يشار أحيانا إلى استخدام المطالبات بدون أمثلة باسم التعلم "بدون لقطة". لاحظ أنه مع واجهة برمجة تطبيقات إكمال الدردشة، عادة ما تتم إضافة أمثلة التعلم ذات اللقطات القليلة إلى صفيف الرسائل في شكل مثال تفاعلات المستخدم/المساعد بعد رسالة النظام الأولية.

نوع التعليم المطالبة الاكتمال
لقطة صفرية العنوان الرئيسي: إصابة المدرب الواثقة لن تحرف المحاربين عن العمل
Topic:
المدرب واثق من أن الإصابة لن تحرف موسم المحاربين. ولا يزال الفريق يركز على أهدافه وسيواصل العمل بجد لتحقيقها.
لقطة قليلة العنوان الرئيسي: Correa للتوائم لاستخدام إلغاء الاشتراك واختبار الوكالة المجانية
الموضوع: البيسبول
العنوان الرئيسي: كأس العالم لكرة القدم قطر لديها مناطق للرصانة
الموضوع: كرة القدم
العنوان: Yates: Fantasy football intel for Week 6
الموضوع: كرة القدم
العنوان الرئيسي: إصابة المدرب الواثقة لن تحرف المحاربين عن العمل
Topic:
كره السله

يوضح المثال أعلاه فائدة التعلم ذي اللقطات القليلة. بدون الأمثلة، يبدو أن النموذج يخمن السلوك المطلوب، بينما توضح الأمثلة بوضوح كيفية العمل. وهذا يوضح أيضا قوة النموذج، فإنه يمكن استنتاج فئة التسمية المطلوبة، حتى بدون تسمية "كرة السلة" في الأمثلة.

إشارة

تعمل الإشارات ك "بداية سريعة" لإخراج النموذج، مما يساعد على توجيه النموذج إلى الإخراج المطلوب. غالبا ما تكون البادئة التي يمكن للنموذج البناء عليها. في المثال أدناه، نعرض إشارة توجيه القصة لتضمين العناصر الرئيسية. غالبا ما تستخدم الإشارات مع التعليمات، ولكن ليس دائما. في الأمثلة أدناه، يتم استخدام النموذج لتلخيص رسالة بريد إلكتروني طويلة للإعلان. يتم استخدام إشارة في حالة واحدة للمساعدة في تركيز إخراج النموذج واقتراح تنسيق إخراج معين (نقاط تعداد نقطي) في الحالة الأخرى.

في سياق إرشادات واجهة برمجة تطبيقات إكمال الدردشة تأخذ شكل رسالة النظام، وتتم الإشارة إلى أمثلة قليلة اللقطات من خلال توفير سلسلة من تفاعلات المستخدم/المساعد النموذجية للمساعدة في بناء النموذج.

عدد الإشارات المطالبة الاكتمال
0 تعد مراجعات الأداء مكونا أساسيا لنهج الأداء والتطوير في Contoso. [...]
تلخيص رسالة البريد الإلكتروني أعلاه:
الغرض من هذا البريد الإلكتروني هو إعلام الموظفين بالتغييرات الأخيرة في تجربة مراجعة الأداء، والتي تعد جزءا من نهج الأداء والتطوير في Contoso. تتضمن التغييرات بنية محسنة، وتجربة مستخدم تمت ترقيتها داخل الأداة، ومطالبات مركزة. بالإضافة إلى ذلك، يوجد الآن قسم "بدء المحادثة" الاختياري للموظفين لوضع علامة على الموضوعات التي يرغبون في مناقشتها مع مديريهم.
1 تعد مراجعات الأداء مكونا أساسيا لنهج الأداء والتطوير في Contoso. [...]
تلخيص رسالة البريد الإلكتروني أعلاه:
الوجبات الجاهزة الرئيسية للرسالة هي
أن شركة Contoso تعمل على تحسين تجربة مراجعة الأداء من خلال جعلها أكثر تركيزا على الأولويات والتوقعات والتأثيرات الأساسية. بالإضافة إلى ذلك، يقومون بترقية تجربة المستخدم في الأداة باستخدام التلميحات والموارد والإرشادات. وأخيرا، يضيفون إرشادات حول كيفية تنشيط الأولويات الأساسية على مستوى الشركة.
2 تعد مراجعات الأداء مكونا أساسيا لنهج الأداء والتطوير في Contoso. [...]
تلخيص رسالة البريد الإلكتروني أعلاه:
النقاط الرئيسية:
تقدم شركة Contoso تغييرات على تجربة مراجعة الأداء، استنادا إلى ملاحظات الموظفين.
• تشمل التغييرات تركيزا جديدا على الأولويات والتوقعات والتأثيرات الأساسية؛ تجربة مستخدم تمت ترقيتها؛ وإرشادات جديدة حول الأولويات الأساسية على مستوى الشركة.
• استعراضات الأداء هي وقت للتفكير في الأداء والتعلم الماضيين، فضلا عن التخطيط للأولويات المستقبلية وفرص النمو.
• يجب على الموظفين والمديرين كتابة تعليقات قبل اجتماع مراجعة الأداء.
• ينبغي أن يكون هناك استعراضان للأداء على الأقل في السنة.
• ينبغي أن يظل الاستثمار في الوقت لكل استعراض كما هو تقريبا.

دعم المحتوى

المحتوى الداعم هو المعلومات التي يمكن للنموذج استخدامها للتأثير على الإخراج بطريقة ما. وهو يختلف عن المحتوى الأساسي من حيث أنه ليس الهدف الرئيسي للمهمة، ولكنه يستخدم عادة مع المحتوى الأساسي. تتضمن الأمثلة الشائعة معلومات سياقية مثل التاريخ الحالي واسم المستخدم وتفضيلات المستخدم وما إلى ذلك. يستخدم المثال أدناه محتوى الدعم للمساعدة في تنظيم مجموعة من ورش العمل المخطط لها للمستخدم. دون دعم (المواضيع الهامة) النموذج يسرد ببساطة خارج ورش العمل (اقتطعت للعرض)، عندما يتم إعلامه من المواضيع الهامة الخاصة بي، النموذج قادر على تجميع الاجتماعات بدقة.

محتوى الدعم المطالبة الاكتمال
دون قائمة ورش العمل:
وصف العنوان
بدء ورشة عمل التخطيط يرجى الانضمام إلينا لبدء ورشة العمل الخاصة بنا! استمع من قادتنا حول الأولويات والتعلم عبر المجموعات للعام المقبل. وقد تم بالفعل إرسال الدعوة إلى هذا الحدث إلى الجميع في [...]
تلخيص ورش العمل أعلاه، مجمعة حسب الموضوع:
قائمة ورش العمل:
بدء ورشة عمل التخطيط
-ختام ورشة عمل التخطيط
- Core MeetUp
- وجهات نظر تستند إلى العملاء
-مناطق التأثير والتركيز الرئيسية
-أفضل الممارسات
-تسريع اعتماد التطبيق [...]
With قائمة ورش العمل:
وصف العنوان
بدء ورشة عمل التخطيط يرجى الانضمام إلينا لبدء ورشة العمل الخاصة بنا! استمع من قادتنا حول الأولويات والتعلم عبر المجموعات للعام المقبل. وقد تم بالفعل إرسال الدعوة إلى هذا الحدث إلى الجميع في [...]
مواضيعي المهمة: الهندسة السريعة والبحث ونماذج GPT
لخص ورش العمل المذكورة أعلاه، مجمعة حسب مواضيعي الهامة:
1. الهندسة الفورية:
- نصائح هندسة المطالبة الجديدة
- فن الهندسة الفورية
2. البحث:
-مقدمة للبحث عن المتجهات مع التضمين
3. نماذج GPT:
- مقدمة إلى GPT-4
- GPT-35-توربو في العمق.

أفضل الممارسات

  • كن محددا. اترك أقل قدر ممكن من التفسير. تقييد المساحة التشغيلية.
  • كن وصفيا. استخدام التشبيهات.
  • مزدوج لأسفل. في بعض الأحيان قد تحتاج إلى تكرار نفسك إلى النموذج. قدم الإرشادات قبل المحتوى الأساسي وبعده، واستخدم إرشادات وإشارة، وما إلى ذلك.
  • أمر مهم. قد يؤثر الترتيب الذي تقدم به المعلومات إلى النموذج على الإخراج. سواء وضعت إرشادات قبل المحتوى الخاص بك ("تلخيص ما يلي...") أو بعد ("تلخيص أعلاه...") يمكن أن يحدث فرقا في الإخراج. حتى ترتيب الأمثلة قليلة اللقطات يمكن أن يهم. ويشار إلى هذا باسم تحيز النحية.
  • امنح النموذج كلمة "خارج". قد يكون من المفيد أحيانا إعطاء النموذج مسارا بديلا إذا كان غير قادر على إكمال المهمة المعينة. على سبيل المثال، عند طرح سؤال على جزء من النص، قد تتضمن شيئا مثل "الرد ب "لم يتم العثور عليه" إذا لم تكن الإجابة موجودة. يمكن أن يساعد هذا النموذج على تجنب إنشاء استجابات خاطئة.

كفاءة المساحة

بينما يزيد حجم الإدخال مع كل جيل جديد من نماذج GPT، ستظل هناك سيناريوهات توفر بيانات أكثر مما يمكن للنموذج التعامل معه. تقسم نماذج GPT الكلمات إلى "رموز مميزة". في حين أن الكلمات الشائعة متعددة المقاطع غالبا ما تكون رمزا مميزا واحدا، يتم كسر الكلمات الأقل شيوعا في المقاطع. يمكن أن تكون الرموز المميزة أحيانا غير بديهية، كما هو موضح في المثال أدناه الذي يوضح حدود الرمز المميز لتنسيقات التاريخ المختلفة. في هذه الحالة، يعد التدقيق الإملائي للشهر بأكمله أكثر كفاءة في المساحة من التاريخ الرقمي بالكامل. يتراوح النطاق الحالي لدعم الرمز المميز من 2000 رمز مميز مع نماذج GPT-3 السابقة إلى ما يصل إلى 32768 رمزا مميزا مع الإصدار 32k من أحدث طراز GPT-4.

لقطة شاشة لسلسلة نص مع ألوان مميزة تحدد حدود الرمز المميز.

وبالنظر إلى هذه المساحة المحدودة، من المهم استخدامها بأكبر قدر ممكن من الكفاءة.

  • الجداول - كما هو موضح في الأمثلة في القسم السابق، يمكن لنماذج GPT فهم البيانات المنسقة جدوليا بسهولة تامة. يمكن أن تكون هذه طريقة فعالة للمساحة لتضمين البيانات، بدلا من أن تسبق كل حقل باسم (مثل JSON).
  • المسافة البيضاء – يتم التعامل مع المسافات البيضاء المتتالية على أنها رموز مميزة منفصلة يمكن أن تكون طريقة سهلة لإضاعة المساحة. من ناحية أخرى، عادة ما يتم التعامل مع المسافات التي تسبق الكلمة كجزء من نفس الرمز المميز للكلمة. شاهد بعناية استخدامك للمسافة البيضاء ولا تستخدم علامات الترقيم عندما تفعل المساحة وحدها.

الخطوات التالية

تعرف على المزيد حول Azure OpenAI.