Jak nastavit pracovní prostory pro Machine LearningHow to set up machine learning workspaces

Prostředí strojového učení a řízení přístupu na základě rolíMachine learning environments and role-based access control

Vývoj, testování a produkční prostředí podporují provozní procesy strojového učení.Development, testing, and production environments support machine learning operations processes.

Diagram znázorňující prostředí strojového učení a řízení přístupu na základě rolí.

Ve vývojovém prostředí: Kanály strojového učení by měly podporovat datové vědy a inženýrské činnosti uskutečňované odborníky přes data a odborníky na data.In a development environment: Machine learning pipelines should support the data science and engineering activities carried out by data scientists and data engineers. Měly by mít úplná oprávnění související se spouštěním experimentů, jako je zajišťování školicích clusterů nebo vytváření modelů.They should have full permissions related to running experiments, such as provisioning training clusters or building models. Neměly by ale mít oprávnění pro aktivity, jako je odstraňování nebo vytváření pracovních prostorů, nebo přidávání nebo odebírání uživatelů pracovního prostoru.However, they should not have permission for activities like deleting or creating workspaces, or adding or removing workspace users.

V testovacím prostředí: V prostředí modelu jsou provedeny různé testy a pro model by se mělo použít testování Champion/dravá nebo A/B.In a test environment: Various tests are performed on the model's environment, and either champion/challenger or A/B testing should be used for the model. Testovací prostředí by mělo napodobovat prostředí nasazení a by mělo spouštět testy, jako je zátěžové testování, doba odezvy modelu a další.The test environment should mimic the deployment environment, and should run tests such as load testing, model response time, and others. Odborníci na data a technici mají omezený přístup k tomuto prostředí, primárně přístup jen pro čtení a některá práva ke konfiguraci.Data scientists and engineers have limited access to this environment, primarily read-only access and some configuration rights. DevOps inženýr má úplný přístup k prostředí.A DevOps engineer hand has full access to the environment. Automatizujte co nejvíce testů.Automate as many tests as possible. Po dokončení všech testů se vyžaduje schválení účastníka pro nasazení v produkčním prostředí.Once all the tests are completed, stakeholder approval is required for deployment in the production environment.

V produkčním prostředí: Model je nasazen během dávkového nebo odvození v reálném čase.In a production environment: A model is deployed during batch or real-time inference. Produkční prostředí je obvykle jen pro čtení; DevOps inženýr ale má úplný přístup k tomuto prostředí a zodpovídá za průběžnou podporu a údržbu.A production environment is typically read-only; however, a DevOps engineer has full access to this environment and is responsible for continually supporting and maintaining it. Vědečtí data a technici dat mají omezený přístup k prostředí a jsou jen pro čtení.Data scientists and data engineers have limited access to the environment, and it's read-only.

Řízení přístupu na základě rolí pro všechna prostředí se zobrazuje v následujícím diagramu:Role-based access control for all environments is shown in the following diagram:

Diagram řízení přístupu na základě role pro všechna prostředí.

V této tabulce se dozvíte, že se v rámci vyšších prostředí snižují úrovně přístupu pro data inženýr a odborníky přes data, zatímco se DevOps inženýr zvyšuje přístup.This table shows that the data engineer and data scientist's access levels decrease within higher environments while the DevOps engineer's access increases. Důvodem je to, že provozní technik Machine Learning vytvoří kanál, spojí objekty a nasadí modely v produkčním prostředí.This is because a machine learning operations engineer builds the pipeline, glues things together, and deploys models in production. Tato úroveň členitosti se doporučuje pro každou roli.This level of granularity is recommended for each role.

Faktory, které ovlivňují pracovní prostory Machine LearningFactors that influence machine learning workspaces

Různé faktory mohou ovlivnit způsob nastavení pracovních prostorů Machine Learning a můžou vám pomůžou určit nejlepší strukturu a ovládací prvky pro každý typ pracovního prostoru:Multiple factors can influence how you set up your machine learning workspaces, and they can help you to determine the best structure and controls for each type of workspace:

Diagram postupu nastavení Azure Machine Learning pracovních prostorů.

  • Veřejné, omezené:Public, restricted:

    • Pracovní prostor pro vývoj, testování a provozDevelopment, test, and production workspace
    • Vlastní role: vědecký vědecký dataCustom role: Data scientist
    • Integrace Gitu pro řízení verzí a průběžnou integraci/průběžný vývoj (CI/CD)Git integration for version control and continuous integration/continuous development (CI/CD)
  • Veřejné, neomezeno:Public, unrestricted:

    • Pracovní prostor pro vývoj, testování a provozDevelopment, test, and production workspace
    • Role:PřispěvatelRole: Contributor
    • Integrace Gitu pro správu verzí a CI/CDGit integration for version control and CI/CD
  • Soukromé, omezené:Private, restricted:

    • Pracovní prostor pro vývoj, testování a provozDevelopment, test, and production workspace
    • Privátní odkaz povolenPrivate Link enabled
    • Vlastní role: vědecký vědecký dataCustom role: Data scientist
    • Integrace Gitu pro správu verzí a CI/CDGit integration for version control and CI/CD
  • Privátní, neomezený:Private, unrestricted:

    • Pracovní prostor pro vývoj, testování a provozDevelopment, test, and production workspace
    • Privátní odkaz povolenPrivate Link enabled
    • Role:PřispěvatelRole: Contributor
    • Integrace Gitu pro správu verzí a CI/CDGit integration for version control and CI/CD
  • Všechny pracovní prostory:All workspaces:

    • Jeden pracovní prostor Azure Machine Learning studia na projektOne Azure Machine Learning studio workspace per project
    • Jedna výpočetní instance na data – vědecký pracovníkOne compute instance per data scientist
    • Jeden výpočetní cluster na velikost virtuálního počítače sdílený s odborníky na data pro vývojOne compute cluster per virtual machine size shared with data scientists for development
    • Jeden výpočetní cluster na produkční kanálOne compute cluster per production pipeline
    • Nastavení minimální velikosti uzlu výpočetního clusteru na hodnotu 0, aby se snížily nákladySetting the compute cluster minimum node size to 0 to reduce costs
    • Dává uživatelům pokyn, aby po použití vypnul výpočetní instance ručně.Instructing users to shut down compute instances manually after use
    • Vlastní role Admin Workspace s přístupem k vytváření výpočetních instancí a clusterůA 'workspace admin' custom role with access to create compute instances and clusters
    • Vlastní role "datový vědecký", která vyžaduje, aby se veškerá infrastruktura nastavila jiným uživatelem, než může začít pracovat vědecký pracovník datA 'data scientist' custom role requiring all infrastructure to be set up by another user before the data scientist can begin work

Další krokyNext steps