التشغيل السريع: استخدام الصور في دردشاتك الذكاء الاصطناعي

ابدأ في استخدام GPT-4 Turbo مع الصور باستخدام خدمة Azure OpenAI.

ترقية طراز GPT-4 Turbo

أحدث إصدار GA من GPT-4 Turbo هو:

  • gpt-4الإصدار:turbo-2024-04-09

هذا هو البديل لنماذج المعاينة التالية:

  • gpt-4الإصدار:1106-Preview
  • gpt-4الإصدار:0125-Preview
  • gpt-4الإصدار:vision-preview

الاختلافات بين OpenAI وAzure OpenAI GPT-4 Turbo GA Models

  • يدعم إصدار OpenAI من أحدث 0409 طراز توربو وضع JSON واستدعاء الوظيفة لجميع طلبات الاستدلال.
  • لا يدعم إصدار Azure OpenAI الأحدث turbo-2024-04-09 حاليا استخدام وضع JSON واستدعاء الدالة عند تقديم طلبات الاستدلال مع إدخال الصورة (الرؤية). تدعم طلبات الإدخال المستندة إلى النص (الطلبات بدون image_url الصور المضمنة) وضع JSON واستدعاء الدالة.

الاختلافات من معاينة رؤية gpt-4

  • لا يدعم Azure الذكاء الاصطناعي تكامل تحسينات رؤية محددة مع GPT-4 Turbo مع Vision للإصدار gpt-4:turbo-2024-04-09. يتضمن ذلك التعرف البصري على الحروف (OCR)، وتؤسس الكائنات، ومطالبات الفيديو، وتحسين معالجة بياناتك باستخدام الصور.

توفر GPT-4 Turbo المدار

  • gpt-4الإصدار:turbo-2024-04-09 متوفر لكل من عمليات النشر القياسية والمتوفرة. حاليا لا يدعم الإصدار المقدم من هذا النموذج طلبات استدلال الصورة/الرؤية. لا تقبل عمليات النشر المتوفرة لهذا النموذج سوى إدخال النص. تقبل عمليات نشر النموذج القياسي كلا من طلبات استدلال النص والصورة/الرؤية.

توافر المناطق

للحصول على معلومات حول التوفر الإقليمي للنموذج، راجع مصفوفة النموذج الخاصة بالنشر القياسي والموفر.

توزيع GPT-4 Turbo مع Vision GA

لنشر نموذج GA من واجهة مستخدم Studio، حدد GPT-4 ثم اختر turbo-2024-04-09 الإصدار من القائمة المنسدلة. ستكون الحصة النسبية الافتراضية gpt-4-turbo-2024-04-09 للنموذج هي نفس الحصة النسبية الحالية ل GPT-4-Turbo. راجع حدود الحصة الإقليمية.

ابدأ في استكشاف GPT-4 Turbo مع قدرات الرؤية باستخدام نهج بدون تعليمات برمجية من خلال Azure OpenAI Studio.

المتطلبات الأساسية

  • اشتراك Azure. أنشئ حسابًا مجانًا.
  • الوصول الممنوح إلى Azure OpenAI في اشتراك Azure المطلوب. حاليًا، يتم منح الوصول إلى هذه الخدمة فقط بواسطة التطبيق. يمكنك التقدم بطلب للوصول إلى Azure OpenAI عن طريق إكمال النموذج في https://aka.ms/oai/access. افتح مشكلة على هذا المستودع للاتصال بنا إذا كانت لديك مشكلة.
  • مورد خدمة Azure OpenAI مع GPT-4 Turbo مع نشر نموذج الرؤية. راجع توفر نموذج GPT-4 وGPT-4 Turbo Preview للمناطق المتاحة. لمزيد من المعلومات حول إنشاء الموارد، راجع دليل توزيع الموارد.
  • لتحسين الرؤية (اختياري): مورد Azure Computer Vision في نفس المنطقة مثل مورد Azure OpenAI، في المستوى المدفوع (S1).

إشعار

لا يتم حاليا دعم إيقاف تشغيل تصفية المحتوى لنموذج GPT-4 Turbo مع Vision.

انتقل إلى Azure OpenAI Studio

استعرض للوصول إلى Azure OpenAI Studio وسجل الدخول باستخدام بيانات الاعتماد المقترنة بمورد Azure OpenAI. أثناء سير عمل تسجيل الدخول أو بعده، حدد الدليل المناسب واشتراك Azure ومورد Azure OpenAI.

ضمن Management حدد Deployments وCreate a GPT-4 Turbo with Vision deployment by selecting model name: "gpt-4" and model version "vision-preview".. لمزيد من المعلومات حول نشر النموذج، راجع دليل توزيع الموارد.

ضمن قسم Playground حدد Chat.

Playground

من هذه الصفحة، يمكنك تكرار قدرات النموذج وتجربتها بسرعة.

للحصول على تعليمات عامة حول إعداد المساعد وجلسات الدردشة والإعدادات واللوحات، راجع التشغيل السريع للدردشة.

بدء جلسة دردشة لتحليل الصور أو الفيديو

في جلسة الدردشة هذه، تقوم بتوجيه المساعد للمساعدة في فهم الصور التي تقوم بإدخالها.

  1. للبدء، حدد GPT-4 Turbo with Vision deployment من القائمة المنسدلة.

  2. في جزء إعداد المساعد، قم بتوفير رسالة النظام لتوجيه المساعد. رسالة النظام الافتراضية هي: "أنت مساعد الذكاء الاصطناعي يساعد الأشخاص على العثور على المعلومات." يمكنك تخصيص رسالة النظام إلى الصورة أو السيناريو الذي تقوم بتحميله.

    إشعار

    يوصى بتحديث رسالة النظام لتكون خاصة بالمهمة لتجنب الاستجابات غير المفيدة من النموذج.

  3. احفظ التغييرات، وعند مطالبتك بتأكيد تحديث رسالة النظام، حدد متابعة.

  4. في جزء جلسة الدردشة ، أدخل مطالبة نصية مثل "وصف هذه الصورة"، ثم قم بتحميل صورة باستخدام زر المرفق. يمكنك استخدام مطالبة نصية مختلفة لحالة الاستخدام الخاصة بك. ثم حدد إرسال.

  5. لاحظ الإخراج المقدم. فكر في طرح أسئلة المتابعة المتعلقة بتحليل صورتك لمعرفة المزيد.

لقطة شاشة لملعب دردشة OpenAI studio.

تنظيف الموارد

إذا كنت ترغب في تنظيف مورد Azure OpenAI وإزالته، يمكنك حذف المورد أو مجموعة الموارد. يؤدي حذف مجموعة الموارد إلى حذف أية موارد أخرى مقترنة بها أيضًا.

استخدم هذه المقالة للبدء في استخدام واجهات برمجة تطبيقات Azure OpenAI REST لنشر نموذج GPT-4 Turbo مع Vision واستخدامه.

المتطلبات الأساسية

  • اشتراك Azure. أنشئ حسابًا مجانًا.
  • الوصول الممنوح إلى Azure OpenAI في اشتراك Azure المطلوب. حاليًا، يتم منح الوصول إلى هذه الخدمة فقط بواسطة التطبيق. يمكنك التقدم بطلب للوصول إلى Azure OpenAI عن طريق إكمال النموذج في https://aka.ms/oai/access. افتح مشكلة على هذا المستودع للاتصال بنا إذا كانت لديك مشكلة.
  • Python 3.8 أو إصدار أحدث.
  • مكتبات Python التالية: requests، . json
  • مورد خدمة Azure OpenAI مع GPT-4 Turbo مع نشر نموذج الرؤية. راجع توفر نموذج GPT-4 وGPT-4 Turbo Preview للمناطق المتاحة. لمزيد من المعلومات حول إنشاء الموارد، راجع دليل توزيع الموارد.
  • لتحسين الرؤية (اختياري): مورد Azure Computer Vision في نفس المنطقة مثل مورد Azure OpenAI، في المستوى المدفوع (S1).

إشعار

لا يتم حاليا دعم إيقاف تشغيل تصفية المحتوى لنموذج GPT-4 Turbo مع Vision.

قم باسترداد المفتاح ونقطة النهاية

لاستدعاء واجهات برمجة تطبيقات Azure OpenAI بنجاح، تحتاج إلى المعلومات التالية حول مورد Azure OpenAI الخاص بك:

عامل الاسم القيمة‬
نقطه النهايه api_base تقع قيمة نقطة النهاية ضمن المفاتيح ونقطة النهاية للمورد الخاص بك في مدخل Microsoft Azure. بدلا من ذلك، يمكنك العثور على القيمة في Azure OpenAI Studio>Playground>Code View. مثال على نقطة النهاية هو: https://docs-test-001.openai.azure.com/.
المفتاح api_key تقع قيمة المفتاح أيضا ضمن المفاتيح ونقطة النهاية للمورد الخاص بك في مدخل Microsoft Azure. ينشئ Azure مفتاحين للمورد الخاص بك. يمكنك استخدام أي من القيمتين.

انتقل إلى مجموعة الموارد في مدخل Microsoft Azure. في جزء التنقل، حدد Keys and Endpoint ضمن Resource Management. انسخ قيمة نقطة النهاية وقيمة مفتاح الوصول. يمكنك استخدام قيمة KEY 1 أو KEY 2 . يسمح لك وجود مفتاحين بتدوير المفاتيح وإعادة إنشائها بأمان دون التسبب في تعطيل الخدمة.

لقطة شاشة تعرض صفحة المفاتيح ونقطة النهاية لمورد Azure OpenAI في مدخل Microsoft Azure.

إنشاء تطبيق Python جديد

إنشاء ملف Python جديد يسمى quickstart.py. افتح الملف الجديد في المحرر المفضل لديك أو IDE.

  1. استبدل محتويات quickstart.py بالتعليمات البرمجية التالية.

    # Packages required:
    import requests 
    import json 
    
    api_base = '<your_azure_openai_endpoint>' 
    deployment_name = '<your_deployment_name>'
    API_KEY = '<your_azure_openai_key>'
    
    base_url = f"{api_base}openai/deployments/{deployment_name}" 
    headers = {   
        "Content-Type": "application/json",   
        "api-key": API_KEY 
    } 
    
    # Prepare endpoint, headers, and request body 
    endpoint = f"{base_url}/chat/completions?api-version=2023-12-01-preview" 
    data = { 
        "messages": [ 
            { "role": "system", "content": "You are a helpful assistant." }, 
            { "role": "user", "content": [  
                { 
                    "type": "text", 
                    "text": "Describe this picture:" 
                },
                { 
                    "type": "image_url",
                    "image_url": {
                        "url": "<image URL>"
                    }
                }
            ] } 
        ], 
        "max_tokens": 2000 
    }   
    
    # Make the API call   
    response = requests.post(endpoint, headers=headers, data=json.dumps(data))   
    
    print(f"Status Code: {response.status_code}")   
    print(response.text)
    
  2. قم بإجراء التغييرات التالية:

    1. أدخل عنوان URL لنقطة النهاية والمفتاح في الحقول المناسبة.

    2. أدخل GPT-4 Turbo الخاص بك مع اسم نشر Vision في الحقل المناسب.

    3. غير قيمة "image" الحقل إلى عنوان URL لصورتك.

      تلميح

      يمكنك أيضا استخدام بيانات صورة مشفرة أساسية 64 بدلا من عنوان URL. لمزيد من المعلومات، راجع دليل GPT-4 Turbo with Vision how-to.

  3. قم بتشغيل التطبيق باستخدام الأمر python:

    python quickstart.py
    

تنظيف الموارد

إذا كنت ترغب في تنظيف مورد Azure OpenAI وإزالته، يمكنك حذف المورد أو مجموعة الموارد. يؤدي حذف مجموعة الموارد إلى حذف أية موارد أخرى مقترنة بها أيضًا.

استخدم هذه المقالة للبدء في استخدام Azure OpenAI Python SDK لنشر نموذج GPT-4 Turbo مع Vision واستخدامه.

مكتبة التعليمات البرمجية | الحزمة (PyPi) |

المتطلبات الأساسية

  • اشتراك Azure. أنشئ حسابًا مجانًا.
  • الوصول الممنوح إلى Azure OpenAI في اشتراك Azure المطلوب. حاليًا، يتم منح الوصول إلى هذه الخدمة فقط بواسطة التطبيق. يمكنك التقدم بطلب للوصول إلى Azure OpenAI عن طريق إكمال النموذج في https://aka.ms/oai/access. افتح مشكلة على هذا المستودع للاتصال بنا إذا كانت لديك مشكلة.
  • Python 3.8 أو إصدار أحدث.
  • مكتبات Python التالية: os
  • مورد خدمة Azure OpenAI مع GPT-4 Turbo مع نشر نموذج الرؤية. راجع توفر نموذج GPT-4 وGPT-4 Turbo Preview للمناطق المتاحة. لمزيد من المعلومات حول إنشاء الموارد، راجع دليل توزيع الموارد.
  • لتحسين الرؤية (اختياري): مورد Azure Computer Vision في نفس المنطقة مثل مورد Azure OpenAI، في المستوى المدفوع (S1).

الإعداد

تثبيت مكتبة عميل OpenAI Python باستخدام:

pip install openai

إشعار

يتم الاحتفاظ بهذه المكتبة بواسطة OpenAI وهي قيد المعاينة حاليا. راجع محفوظات الإصدار أو محفوظات التثبيت version.py لتعقب آخر التحديثات إلى المكتبة.

قم باسترداد المفتاح ونقطة النهاية

لإجراء مكالمة بنجاح مقابل Azure OpenAI، تحتاج إلى نقطة نهاية ومفتاح.

اسم المتغير القيمة‬
ENDPOINT يمكن العثور على هذه القيمة في قسم المفاتيح ونقطة النهاية عند فحص المورد من مدخل Microsoft Azure. بدلاً من ذلك، يمكنك العثور على القيمة في Azure OpenAI Studio>Playground>Code View. مثال على نقطة النهاية هو: https://docs-test-001.openai.azure.com/.
API-KEY يمكن العثور على هذه القيمة في قسم المفاتيح ونقطة النهاية عند فحص المورد من مدخل Microsoft Azure. يمكنك استخدام إما KEY1 أو KEY2.

انتقل إلى مجموعة الموارد في مدخل Microsoft Azure. يمكن العثور على قسم Keys & Endpoint في قسم Resource Management . انسخ نقطة النهاية ومفتاح الوصول حيث ستحتاج إلى كليهما لمصادقة استدعاءات واجهة برمجة التطبيقات. يمكنك استخدام إما KEY1 أو KEY2. يسمح لك وجود مفتاحين دائماً بتدوير المفاتيح وإعادة إنشائها بأمان دون التسبب في تعطيل الخدمة.

لقطة شاشة لواجهة مستخدم النظرة العامة لمورد Azure OpenAI في مدخل Microsoft Azure مع وضع نقطة النهاية وموقع مفاتيح الوصول في دائرة باللون الأحمر.

متغيرات البيئة

إنشاء متغيرات بيئة ثابتة وتعيينها للمفتاح ونقطة النهاية.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

إنشاء تطبيق Python جديد

إنشاء ملف Python جديد يسمى quickstart.py. افتح الملف الجديد في المحرر المفضل لديك أو IDE.

  1. استبدل محتويات quickstart.py بالتعليمات البرمجية التالية.

    from openai import AzureOpenAI
    
    api_base = os.getenv("AZURE_OPENAI_ENDPOINT")
    api_key= os.getenv("AZURE_OPENAI_API_KEY")
    deployment_name = '<your_deployment_name>'
    api_version = '2023-12-01-preview' # this might change in the future
    
    client = AzureOpenAI(
        api_key=api_key,  
        api_version=api_version,
        base_url=f"{api_base}/openai/deployments/{deployment_name}"
    )
    
    response = client.chat.completions.create(
        model=deployment_name,
        messages=[
            { "role": "system", "content": "You are a helpful assistant." },
            { "role": "user", "content": [  
                { 
                    "type": "text", 
                    "text": "Describe this picture:" 
                },
                { 
                    "type": "image_url",
                    "image_url": {
                        "url": "<image URL>"
                    }
                }
            ] } 
        ],
        max_tokens=2000 
    )
    
    print(response)
    
  2. قم بإجراء التغييرات التالية:

    1. أدخل اسم GPT-4 Turbo الخاص بك مع نشر Vision في الحقل المناسب.
    2. غير قيمة "url" الحقل إلى عنوان URL لصورتك.

      تلميح

      يمكنك أيضا استخدام بيانات صورة مشفرة أساسية 64 بدلا من عنوان URL. لمزيد من المعلومات، راجع دليل GPT-4 Turbo with Vision how-to.

  3. قم بتشغيل التطبيق باستخدام الأمر python:

    python quickstart.py
    

تنظيف الموارد

إذا كنت ترغب في تنظيف مورد Azure OpenAI وإزالته، يمكنك حذف المورد أو مجموعة الموارد. يؤدي حذف مجموعة الموارد إلى حذف أية موارد أخرى مقترنة بها أيضًا.

الخطوات التالية