مخطط YAML لنشر دفعات CLI (الإصدار 2)

APPLY TO: Azure CLI ml extension v1 v2 (معاينة)

يمكن العثور على مخطط JSON المصدر في https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json.

هام

تُعد هذه الميزة قيد المعاينة العامة في الوقت الحالي. يجري توفير إصدار المعاينة هذا من دون اتفاقية على مستوى الخدمة، ولا يوصى به لأحمال العمل الخاصة بالإنتاج. بعض الميزات ربما لا تكون مدعمة أو بها بعض القدرات المقيدة. لمزيد من المعلومات، راجع ⁧⁩شروط الاستخدام التكميلية لمعاينات Microsoft Azure⁧⁩.

ملاحظة

يستند بناء جملة YAML المفصل في هذا المستند إلى مخطط JSON لأحدث إصدار من ملحق ML CLI v2. يتم ضمان بناء الجملة هذا فقط للعمل مع أحدث إصدار من ملحق ML CLI v2. يمكنك العثور على مخططات الإصدارات الملحقة القديمة في https://azuremlschemasprod.azureedge.net/.

بناء جملة YAML

المفتاح النوع الوصف القيم المسموح بها القيمة الافتراضية
$schema سلسلة مخطط YAML. إذا كنت تستخدم ملحق Azure التعلم الآلي VS Code لتأليف ملف YAML، بما في ذلك $schema في الجزء العلوي من الملف يمكنك من استدعاء المخطط وإكمال الموارد.
name سلسلة مطلوب اسم النشر.
description سلسلة وصف النشر.
tags كائن قاموس العلامات للنشر.
endpoint_name سلسلة مطلوب اسم نقطة النهاية لإنشاء النشر تحت.
model سلسلة أو كائن مطلوب النموذج المطلوب استخدامه للنشر. يمكن أن تكون هذه القيمة إما مرجعا إلى نموذج تم إصداره موجودا في مساحة العمل أو مواصفات نموذج مضمنة.

للإشارة إلى نموذج موجود، استخدم بناء الجملة azureml:<model-name>:<model-version> .

لتعريف نموذج مضمن، اتبع مخطط النموذج.

كأفضل ممارسة لسيناريوهات الإنتاج ، يجب عليك إنشاء النموذج بشكل منفصل والإشارة إليه هنا.
code_configuration كائن تكوين لمنطق التعليمات البرمجية لتسجيل النقاط.

هذه الخاصية غير مطلوبة إذا كان النموذج الخاص بك بتنسيق MLflow.
code_configuration.code سلسلة المسار المحلي إلى دليل التعليمات البرمجية المصدر لتسجيل النموذج.
code_configuration.scoring_script سلسلة المسار النسبي إلى ملف تسجيل النقاط في دليل التعليمات البرمجية المصدر.
environment سلسلة أو كائن البيئة التي يجب استخدامها للنشر. يمكن أن تكون هذه القيمة إما مرجعا إلى بيئة تم إصدارها موجودة في مساحة العمل أو مواصفات بيئة مضمنة.

هذه الخاصية غير مطلوبة إذا كان النموذج الخاص بك بتنسيق MLflow.

للإشارة إلى بيئة موجودة، استخدم بناء الجملة azureml:<environment-name>:<environment-version> .

لتحديد بيئة مضمنة، اتبع مخطط البيئة.

كأفضل ممارسة لسيناريوهات الإنتاج ، يجب عليك إنشاء البيئة بشكل منفصل والرجوع إليها هنا.
compute سلسلة مطلوب اسم هدف الحساب لتنفيذ مهام تسجيل الدفعات على. يجب أن تكون هذه القيمة مرجعا إلى حساب موجود في مساحة العمل باستخدام بناء الجملة azureml:<compute-name> .
resources.instance_count عدد صحيح عدد العقد التي يجب استخدامها لكل مهمة تسجيل دفعة. 1
max_concurrency_per_instance عدد صحيح الحد الأقصى لعدد عمليات التشغيل المتوازية scoring_script لكل مثيل. 1
error_threshold عدد صحيح عدد حالات فشل الملفات التي يجب تجاهلها. إذا تجاوز عدد الأخطاء للإدخال بأكمله هذه القيمة، إنهاء مهمة تسجيل الدفعات. error_threshold هو للإدخال بأكمله وليس للدفعات الصغيرة الفردية. إذا تم حذفه، السماح بأي عدد من حالات فشل الملفات دون إنهاء المهمة. -1
logging_level سلسلة مستوى الإسهاب في السجل. warning, info, debug info
mini_batch_size عدد صحيح عدد الملفات التي يمكن معالجتها code_configuration.scoring_script في مكالمة واحدة run() . 10
retry_settings كائن أعد محاولة الإعدادات لتسجيل كل دفعة صغيرة.
retry_settings.max_retries عدد صحيح الحد الأقصى لعدد عمليات إعادة المحاولة لدفعة صغيرة فاشلة أو منتهية المهلة. 3
retry_settings.timeout عدد صحيح المهلة في ثوان لتسجيل دفعة صغيرة. 30
output_action سلسلة يشير إلى كيفية تنظيم الإخراج في ملف الإخراج. append_row, summary_only append_row
output_file_name سلسلة اسم ملف إخراج تسجيل الدفعة. predictions.csv
environment_variables كائن قاموس أزواج القيم الرئيسية المتغيرة للبيئة لتعيينها لكل مهمة تسجيل دفعة.

الملاحظات

az ml batch-deployment يمكن استخدام الأوامر لإدارة عمليات نشر الدفعات التعلم الآلي Azure.

أمثلة

تتوفر أمثلة في الأمثلة GitHub المستودع. ويرد أدناه العديد منها.

YAML: أساسي (MLflow)

$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
name: mlflowdp
endpoint_name: mybatchedp
model: 
  path: ./autolog_nyc_taxi
compute: azureml:batch-cluster

YAML: نموذج مخصص ورمز تسجيل النقاط

$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
name: nonmlflowdp
endpoint_name: mybatchedp
model: 
  path: ./mnist/model/
code_configuration:
  code: ./mnist/code/
  scoring_script: digit_identification.py
environment:
  conda_file: ./mnist/environment/conda.yml
  image: mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04:latest
compute: azureml:batch-cluster
resources:
  instance_count: 1
max_concurrency_per_instance: 2
mini_batch_size: 10
output_action: append_row
output_file_name: predictions.csv
retry_settings:
  max_retries: 3
  timeout: 30
error_threshold: -1
logging_level: info

الخطوات التالية