تعرف على كيفية إنشاء تضمينات باستخدامAzure OpenAI
التضمين هو تنسيق خاص لتمثيل البيانات يمكن استخدامه بسهولة من قبل نماذج وخوارزميات التعلم الآلي. التضمين هو تمثيل كثيف للمعلومات للمعنى الدلالي لجزء من النص. كل تضمين هو متجه من أرقام النقاط العائمة، بحيث ترتبط المسافة بين تضمينين في مساحة المتجه بالتشابه الدلالي بين إدخالين بالتنسيق الأصلي. على سبيل المثال، إذا كان نصان متشابهين، يجب أن تكون تمثيلات المتجهات متشابهة أيضاً. تضمين البحث عن تشابه متجه الطاقة في قواعد بيانات Azure مثل Azure Cosmos DB ل MongoDB vCore أو قاعدة بيانات Azure SQL أو قاعدة بيانات Azure ل PostgreSQL - الخادم المرن.
كيفية الحصول على التضمينات
للحصول على متجه تضمين لجزء من النص، نقدم طلبًا إلى نقطة نهاية التضمينات كما هو مُوضح في قصاصات التعليمات البرمجية التالية:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
أفضل الممارسات
تحقق من أن المدخلات لا تتجاوز الحد الأقصى للطول
- الحد الأقصى لطول نص الإدخال لأحدث نماذج التضمين لدينا هو 8192 رمزا مميزا. يجب أن تتحقق من أن مدخلاتك لا تتجاوز هذا الحد قبل تقديم طلب.
- إذا كان إرسال صفيف من المدخلات في طلب تضمين واحد هو الحد الأقصى لحجم الصفيف هو 2048.
القيود والمخاطر
قد تكون نماذج التضمين الخاصة بنا غير موثوق بها أو قد تشكل مخاطر اجتماعية في حالات مُعينة، وقد تسبب ضرراً في غياب عوامل التخفيف من المخاطر. راجع محتوى الذكاء الاصطناعي المسؤول للحصول على مزيد من المعلومات بشأن كيفية التعامل مع استخدامه بمسؤولية.
الخطوات التالية
- تعرف على المزيد حول استخدام Azure OpenAI والتضمينات لإجراء البحث في المستندات باستخدام البرنامج التعليمي للتضمينات.
- تعرف على المزيد حول النماذج الأساس التي تعمل على تشغيل Azure OpenAI.
- قم بتخزين التضمينات وإجراء بحث متجه (تشابه) باستخدام اختيارك لخدمة Azure: