تعرف على كيفية إنشاء تضمينات باستخدامAzure OpenAI

التضمين هو تنسيق خاص لتمثيل البيانات يمكن استخدامه بسهولة من قبل نماذج وخوارزميات التعلم الآلي. التضمين هو تمثيل كثيف للمعلومات للمعنى الدلالي لجزء من النص. كل تضمين هو متجه من أرقام النقاط العائمة، بحيث ترتبط المسافة بين تضمينين في مساحة المتجه بالتشابه الدلالي بين إدخالين بالتنسيق الأصلي. على سبيل المثال، إذا كان نصان متشابهين، يجب أن تكون تمثيلات المتجهات متشابهة أيضاً. تضمين البحث عن تشابه متجه الطاقة في قواعد بيانات Azure مثل Azure Cosmos DB ل MongoDB vCore أو قاعدة بيانات Azure SQL أو قاعدة بيانات Azure ل PostgreSQL - الخادم المرن.

كيفية الحصول على التضمينات

للحصول على متجه تضمين لجزء من النص، نقدم طلبًا إلى نقطة نهاية التضمينات كما هو مُوضح في قصاصات التعليمات البرمجية التالية:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

أفضل الممارسات

تحقق من أن المدخلات لا تتجاوز الحد الأقصى للطول

  • الحد الأقصى لطول نص الإدخال لأحدث نماذج التضمين لدينا هو 8192 رمزا مميزا. يجب أن تتحقق من أن مدخلاتك لا تتجاوز هذا الحد قبل تقديم طلب.
  • إذا كان إرسال صفيف من المدخلات في طلب تضمين واحد هو الحد الأقصى لحجم الصفيف هو 2048.

القيود والمخاطر

قد تكون نماذج التضمين الخاصة بنا غير موثوق بها أو قد تشكل مخاطر اجتماعية في حالات مُعينة، وقد تسبب ضرراً في غياب عوامل التخفيف من المخاطر. راجع محتوى الذكاء الاصطناعي المسؤول للحصول على مزيد من المعلومات بشأن كيفية التعامل مع استخدامه بمسؤولية.

الخطوات التالية