ما المقصود ب Workflow Orchestration Manager؟

ينطبق على:Azure Data Factory Azure Synapse Analytics

تلميح

جرب Data Factory في Microsoft Fabric، وهو حل تحليلي متكامل للمؤسسات. يغطي Microsoft Fabric كل شيء بدءا من حركة البيانات إلى علم البيانات والتحليلات في الوقت الحقيقي والمعلومات المهنية وإعداد التقارير. تعرف على كيفية بدء إصدار تجريبي جديد مجانا!

إشعار

يتم تشغيل إدارة تنسيق سير العمل بواسطة Apache Airflow.

إشعار

هذه الميزة قيد المعاينة العامة. للأسئلة أو اقتراحات الميزات، يرجى إرسال بريد إلكتروني إلى ManagedAirflow@microsoft.com مع التفاصيل.

إشعار

يعتمد مدير تنسيق سير العمل ل Azure Data Factory على تطبيق مصدر مفتوح Apache Airflow. يمكن العثور على وثائق والمزيد من البرامج التعليمية ل Airflow على وثائق Apache Airflow أو صفحات المجتمع.

يوفر Azure Data Factory مسارات بلا خادم لتنسيق عملية البيانات، وحركة البيانات مع أكثر من 100 موصل مدار، وتحويلات مرئية مع تدفق بيانات التعيين.

تعد خدمة إدارة تنسيق سير العمل في Azure Data Factory طريقة بسيطة وفعالة لإنشاء بيئات Apache Airflow وإدارتها، ما يتيح لك تشغيل مسارات البيانات على نطاق واسع بسهولة. Apache Airflow هو نظام أساسي مفتوح المصدر يستخدم لإنشاء مهام سير عمل البيانات المعقدة وجدولتها ومراقبتها برمجيا. يسمح لك بتحديد مجموعة من المهام، تسمى عوامل التشغيل، التي يمكن دمجها في الرسوم البيانية دورة دورة التوجيه (DAGs) لتمثيل مسارات البيانات. يتيح لك تدفق الهواء تنفيذ مجموعات DAGs هذه على جدول زمني أو استجابة لحدث ما، ومراقبة تقدم مهام سير العمل، وتوفير رؤية لحالة كل مهمة. يتم استخدامه على نطاق واسع في هندسة البيانات وعلوم البيانات لتنسيق مسارات البيانات، ويعرف بمرونته وقابليته للتوسعة وسهولة استخدامه.

تظهر لقطة الشاشة تكامل البيانات.

متى تستخدم إدارة تنسيق سير العمل؟

يوفر Azure Data Factory البنية الأساسية لبرنامج ربط العمليات التجارية لتنسيق عمليات البيانات بصريا (التأليف المستند إلى واجهة المستخدم). أثناء إدارة تزامن سير العمل، يقدم Airflow المستندة إلى Python DAGs (التأليف الذي يركز على التعليمات البرمجية python) لتحديد عملية تزامن البيانات. إذا كان لديك خلفية تدفق الهواء، أو كنت تستخدم حاليا Apache Airflow، فقد تفضل استخدام إدارة تنسيق سير العمل بدلا من المسارات. على العكس من ذلك، إذا كنت لا ترغب في كتابة/ إدارة مجموعات DAGs المستندة إلى python لتنسيق عملية البيانات، فقد تفضل استخدام البنية الأساسية لبرنامج ربط العمليات التجارية.

مع إدارة تزامن سير العمل، يوفر Azure Data Factory الآن قدرات متعددة التنسيقات تمتد عبر متطلبات تزامن OSS المرئية والمحورية حول التعليمات البرمجية.

الميزات

يقدم مدير تنسيق سير العمل في Azure Data Factory مجموعة من الميزات القوية، بما في ذلك:

  • النشر السريع والبسيط - يمكنك إعداد Apache Airflow بسرعة وسهولة عن طريق تحديد إصدار Apache Airflow عند إنشاء إدارة تنسيق سير العمل.
  • مقياس السحابة - يقوم Workflow Orchestration Manager تلقائيا بتغيير حجم عقد Apache Airflow عند الحاجة استنادا إلى مواصفات النطاق (الحد الأدنى، الحد الأقصى).
  • تكامل Microsoft Entra - يمكنك تمكين Microsoft Entra RBAC مقابل بيئة Airflow الخاصة بك للحصول على تجربة تسجيل دخول واحدة مؤمنة بواسطة معرف Microsoft Entra.
  • تشفير بيانات التعريف - يقوم Workflow Orchestration Manager تلقائيا بتشفير بيانات التعريف باستخدام المفاتيح المدارة من Azure لضمان أمان بيئتك بشكل افتراضي. كما أنه يدعم التشفير المزدوج باستخدام مفتاح مدار من قبل العميل (CMK).
  • Azure Monitoring and alerting - يتم تصدير جميع السجلات التي تم إنشاؤها بواسطة Workflow Orchestration Manager إلى Azure Monitor. كما يوفر مقاييس لتتبع الظروف الحرجة ومساعدتك على إعلامك إذا كانت الحاجة كذلك.

بناء الأنظمة

تظهر لقطة الشاشة البنية في إدارة تنسيق سير العمل.

توفر المنطقة (معاينة عامة)

  • شرق الولايات المتحدة
  • جنوب وسط الولايات المتحدة
  • غرب الولايات المتحدة
  • جنوب البرازيل
  • جنوب المملكة المتحدة
  • أوروبا الشمالية
  • أوروبا الغربية
  • جنوب شرق آسيا

إشعار

من خلال GA، سيتم دعم جميع مناطق ADF. يتم تعيين منطقة بيئة Airflow افتراضيا إلى منطقة Data Factory وهي غير قابلة للتكوين، لذا تأكد من استخدام Data Factory في المنطقة المدعومة أعلاه لتتمكن من الوصول إلى معاينة إدارة تنسيق سير العمل.

إصدارات Apache Airflow المدعومة

  • 2.6.3

إشعار

تغيير إصدار Airflow داخل وقت تشغيل التكامل الموجود غير مدعوم. بدلا من ذلك، الحل الموصى به هو إنشاء وقت تشغيل التكامل Airflow جديد مع الإصدار المطلوب

‏‫عمليات تكامل‬

يتكامل Apache Airflow مع خدمات Microsoft Azure من خلال موفر microsoft.azure.

يمكنك تثبيت أي حزمة موفر عن طريق تحرير بيئة تدفق الهواء من واجهة مستخدم Azure Data Factory. يستغرق الأمر بضع دقائق لتثبيت الحزمة.

تظهر لقطة الشاشة تكامل تدفق الهواء.

القيود

  • يتوفر مدير تنسيق سير العمل في مناطق أخرى بواسطة GA.
  • يجب أن تكون مصادر البيانات المتصلة من خلال تدفق الهواء متاحة من خلال نقطة النهاية العامة (الشبكة).
  • DAGs الموجودة داخل Blob Storage في VNet/behind Firewall غير مدعومة حاليا. بدلا من ذلك نوصي باستخدام ميزة مزامنة Git ل Workflow Orchestration Manager. راجع، مزامنة مستودع GitHub في إدارة تنسيق سير العمل
  • استيراد Dags من Azure Key Vault غير مدعوم في LinkedServices.