مخطط YAML لنشر دفعات CLI (الإصدار 2)
APPLY TO: Azure CLI ml extension
v1
v2 (معاينة)
يمكن العثور على مخطط JSON المصدر في https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json.
هام
تُعد هذه الميزة قيد المعاينة العامة في الوقت الحالي. يجري توفير إصدار المعاينة هذا من دون اتفاقية على مستوى الخدمة، ولا يوصى به لأحمال العمل الخاصة بالإنتاج. بعض الميزات ربما لا تكون مدعمة أو بها بعض القدرات المقيدة. لمزيد من المعلومات، راجع شروط الاستخدام التكميلية لمعاينات Microsoft Azure.
ملاحظة
يستند بناء جملة YAML المفصل في هذا المستند إلى مخطط JSON لأحدث إصدار من ملحق ML CLI v2. يتم ضمان بناء الجملة هذا فقط للعمل مع أحدث إصدار من ملحق ML CLI v2. يمكنك العثور على مخططات الإصدارات الملحقة القديمة في https://azuremlschemasprod.azureedge.net/.
بناء جملة YAML
| المفتاح | النوع | الوصف | القيم المسموح بها | القيمة الافتراضية |
|---|---|---|---|---|
$schema |
سلسلة | مخطط YAML. إذا كنت تستخدم ملحق Azure التعلم الآلي VS Code لتأليف ملف YAML، بما في ذلك $schema في الجزء العلوي من الملف يمكنك من استدعاء المخطط وإكمال الموارد. |
||
name |
سلسلة | مطلوب اسم النشر. | ||
description |
سلسلة | وصف النشر. | ||
tags |
كائن | قاموس العلامات للنشر. | ||
endpoint_name |
سلسلة | مطلوب اسم نقطة النهاية لإنشاء النشر تحت. | ||
model |
سلسلة أو كائن | مطلوب النموذج المطلوب استخدامه للنشر. يمكن أن تكون هذه القيمة إما مرجعا إلى نموذج تم إصداره موجودا في مساحة العمل أو مواصفات نموذج مضمنة. للإشارة إلى نموذج موجود، استخدم بناء الجملة azureml:<model-name>:<model-version> . لتعريف نموذج مضمن، اتبع مخطط النموذج. كأفضل ممارسة لسيناريوهات الإنتاج ، يجب عليك إنشاء النموذج بشكل منفصل والإشارة إليه هنا. |
||
code_configuration |
كائن | تكوين لمنطق التعليمات البرمجية لتسجيل النقاط. هذه الخاصية غير مطلوبة إذا كان النموذج الخاص بك بتنسيق MLflow. |
||
code_configuration.code |
سلسلة | المسار المحلي إلى دليل التعليمات البرمجية المصدر لتسجيل النموذج. | ||
code_configuration.scoring_script |
سلسلة | المسار النسبي إلى ملف تسجيل النقاط في دليل التعليمات البرمجية المصدر. | ||
environment |
سلسلة أو كائن | البيئة التي يجب استخدامها للنشر. يمكن أن تكون هذه القيمة إما مرجعا إلى بيئة تم إصدارها موجودة في مساحة العمل أو مواصفات بيئة مضمنة. هذه الخاصية غير مطلوبة إذا كان النموذج الخاص بك بتنسيق MLflow. للإشارة إلى بيئة موجودة، استخدم بناء الجملة azureml:<environment-name>:<environment-version> . لتحديد بيئة مضمنة، اتبع مخطط البيئة. كأفضل ممارسة لسيناريوهات الإنتاج ، يجب عليك إنشاء البيئة بشكل منفصل والرجوع إليها هنا. |
||
compute |
سلسلة | مطلوب اسم هدف الحساب لتنفيذ مهام تسجيل الدفعات على. يجب أن تكون هذه القيمة مرجعا إلى حساب موجود في مساحة العمل باستخدام بناء الجملة azureml:<compute-name> . |
||
resources.instance_count |
عدد صحيح | عدد العقد التي يجب استخدامها لكل مهمة تسجيل دفعة. | 1 |
|
max_concurrency_per_instance |
عدد صحيح | الحد الأقصى لعدد عمليات التشغيل المتوازية scoring_script لكل مثيل. |
1 |
|
error_threshold |
عدد صحيح | عدد حالات فشل الملفات التي يجب تجاهلها. إذا تجاوز عدد الأخطاء للإدخال بأكمله هذه القيمة، إنهاء مهمة تسجيل الدفعات. error_threshold هو للإدخال بأكمله وليس للدفعات الصغيرة الفردية. إذا تم حذفه، السماح بأي عدد من حالات فشل الملفات دون إنهاء المهمة. |
-1 |
|
logging_level |
سلسلة | مستوى الإسهاب في السجل. | warning, info, debug |
info |
mini_batch_size |
عدد صحيح | عدد الملفات التي يمكن معالجتها code_configuration.scoring_script في مكالمة واحدة run() . |
10 |
|
retry_settings |
كائن | أعد محاولة الإعدادات لتسجيل كل دفعة صغيرة. | ||
retry_settings.max_retries |
عدد صحيح | الحد الأقصى لعدد عمليات إعادة المحاولة لدفعة صغيرة فاشلة أو منتهية المهلة. | 3 |
|
retry_settings.timeout |
عدد صحيح | المهلة في ثوان لتسجيل دفعة صغيرة. | 30 |
|
output_action |
سلسلة | يشير إلى كيفية تنظيم الإخراج في ملف الإخراج. | append_row, summary_only |
append_row |
output_file_name |
سلسلة | اسم ملف إخراج تسجيل الدفعة. | predictions.csv |
|
environment_variables |
كائن | قاموس أزواج القيم الرئيسية المتغيرة للبيئة لتعيينها لكل مهمة تسجيل دفعة. |
الملاحظات
az ml batch-deployment يمكن استخدام الأوامر لإدارة عمليات نشر الدفعات التعلم الآلي Azure.
أمثلة
تتوفر أمثلة في الأمثلة GitHub المستودع. ويرد أدناه العديد منها.
YAML: أساسي (MLflow)
$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
name: mlflowdp
endpoint_name: mybatchedp
model:
path: ./autolog_nyc_taxi
compute: azureml:batch-cluster
YAML: نموذج مخصص ورمز تسجيل النقاط
$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
name: nonmlflowdp
endpoint_name: mybatchedp
model:
path: ./mnist/model/
code_configuration:
code: ./mnist/code/
scoring_script: digit_identification.py
environment:
conda_file: ./mnist/environment/conda.yml
image: mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04:latest
compute: azureml:batch-cluster
resources:
instance_count: 1
max_concurrency_per_instance: 2
mini_batch_size: 10
output_action: append_row
output_file_name: predictions.csv
retry_settings:
max_retries: 3
timeout: 30
error_threshold: -1
logging_level: info