Mi az a Workflow Orchestration Manager?

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

Feljegyzés

A Workflow Orchestration Managert az Apache Airflow működteti.

Feljegyzés

Ez a funkció nyilvános előzetes verzióban érhető el. Ha kérdése vagy funkciójavaslata van, küldjön egy e-mailt ManagedAirflow@microsoft.com a részletekkel.

Feljegyzés

Az Azure Data Factory munkafolyamat-vezénylés-kezelője az Nyílt forráskód Apache Airflow-alkalmazásra támaszkodik. Az Airflow dokumentációja és további oktatóanyagai az Apache Airflow dokumentációjában vagy a közösségi oldalakon találhatók.

Az Azure Data Factory kiszolgáló nélküli folyamatokat kínál az adatfeldolgozás vezényléséhez, az adatáthelyezéshez több mint 100 felügyelt összekötővel, valamint vizualizációs átalakításokat a leképezési adatfolyammal.

Az Azure Data Factory Workflow Orchestration Manager szolgáltatása egyszerű és hatékony módja az Apache Airflow-környezetek létrehozásának és felügyeletének, lehetővé téve az adatfolyamok nagy léptékű, egyszerű futtatását. Az Apache Airflow egy nyílt forráskódú platform, amellyel programozott módon hozhat létre, ütemezhet és figyelhet összetett adat-munkafolyamatokat. Lehetővé teszi, hogy definiáljon egy olyan feladatkészletet, úgynevezett operátort, amely az adatfolyamokat ábrázoló irányított aciklikus grafikonokba (DAG-k) kombinálható. Az Airflow lehetővé teszi a DAG-k ütemezés szerinti vagy eseményre adott válaszként történő végrehajtását, a munkafolyamatok előrehaladásának monitorozását és az egyes tevékenységek állapotának láthatóságát. Széles körben használják az adatelemzésben és az adatelemzésben az adatfolyamok vezénylésére, és rugalmasságáról, bővíthetőségéről és könnyű használhatóságáról ismert.

Képernyőkép az adatintegrációról.

Mikor érdemes a Workflow Orchestration Managert használni?

Az Azure Data Factory folyamatokat kínál az adatfeldolgozás vizuális vezényléséhez (felhasználói felületalapú szerzői műveletek). A Workflow Orchestration Manager airflow-alapú python DAG-ket (python kódközpontú szerzői lehetőségeket) kínál az adatvezénylési folyamat meghatározásához. Ha rendelkezik az Airflow háttérrel, vagy jelenleg Apache Airflow-t használ, a munkafolyamatok helyett inkább a Workflow Orchestration Managert érdemes használnia. Éppen ellenkezőleg, ha nem szeretne python-alapú DAG-kat írni/ kezelni az adatfeldolgozás vezényléséhez, akkor érdemes lehet folyamatokat használnia.

A Workflow Orchestration Managerrel az Azure Data Factory mostantól több vezénylési képességeket kínál a vizuális, kódközpontú, OSS vezénylési követelményekre.

Funkciók

A Workflow Orchestration Manager az Azure Data Factoryben számos hatékony funkciót kínál, többek között a következőket:

  • Gyors és egyszerű üzembe helyezés – Gyorsan és egyszerűen állíthatja be az Apache Airflow-t egy Apache Airflow-verzió kiválasztásával, amikor munkafolyamat-vezénylés-kezelőt hoz létre.
  • Felhőbeli skálázás – A Workflow Orchestration Manager automatikusan skálázza az Apache Airflow-csomópontokat, ha szükséges, a tartomány specifikációja alapján (min, max).
  • Microsoft Entra-integráció – A Microsoft Entra RBAC-t az Airflow-környezetben engedélyezheti egyetlen bejelentkezési élmény érdekében, amelyet a Microsoft Entra ID biztosít.
  • Metaadatok titkosítása – A Workflow Orchestration Manager automatikusan titkosítja a metaadatokat az Azure által felügyelt kulcsokkal, hogy a környezet alapértelmezés szerint biztonságos legyen. Az ügyfél által felügyelt kulccsal (CMK) is támogatja a kettős titkosítást.
  • Azure Monitorozás és riasztás – A Workflow Orchestration Manager által létrehozott összes naplót exportálja a rendszer az Azure Monitorba. Metrikákat is biztosít a kritikus feltételek nyomon követéséhez, és segít értesíteni, ha szükséges.

Architektúra

Képernyőkép a Workflow Orchestration Manager architektúrájáról.

Régió rendelkezésre állása (nyilvános előzetes verzió)

  • Usa keleti régiója
  • Usa déli középső régiója
  • Usa nyugati régiója
  • Dél-Brazília
  • Az Egyesült Királyság déli régiója
  • Észak-Európa
  • Nyugat-Európa
  • Délkelet-Ázsia

Feljegyzés

A GA minden ADF-régiót támogat. Az Airflow környezeti régió alapértelmezés szerint a Data Factory-régióban van, és nem konfigurálható, ezért győződjön meg arról, hogy a fent támogatott régióban egy Data Factory használatával férhet hozzá a Workflow Orchestration Manager előzetes verziójához.

Támogatott Apache Airflow-verziók

  • 2.6.3

Feljegyzés

Az Airflow verziójának módosítása egy meglévő integrációs modulon belül nem támogatott. Ehelyett az ajánlott megoldás egy új Airflow IR létrehozása a kívánt verzióval

Integrációk

Az Apache Airflow a Microsoft Azure-szolgáltatásokkal a microsoft.azure szolgáltatón keresztül integrálható.

Bármely szolgáltatói csomagot telepíthet az airflow környezet szerkesztésével az Azure Data Factory felhasználói felületéről. A csomag telepítése körülbelül néhány percet vesz igénybe.

Képernyőkép az airflow-integrációról.

Korlátozások

  • A munkafolyamat-vezénylés-kezelő más régiókban a GA által érhető el.
  • A légáramláson keresztül csatlakozó adatforrásokat nyilvános végponton (hálózaton) keresztül kell elérni.
  • A virtuális hálózaton vagy tűzfal mögötti Blob Storage-ban található DAG-k jelenleg nem támogatottak. Ehelyett a Workflow Orchestration Manager Git szinkronizálási funkcióját javasoljuk. GitHub-adattár szinkronizálása a Workflow Orchestration Managerben
  • A Dags importálása az Azure Key Vaultból nem támogatott a LinkedServicesben.