PipelineStep Osztály

Egy Végrehajtási lépést jelöl egy Azure Machine Learning-folyamatban.

A folyamatok több folyamatlépésből épülnek fel, amelyek a folyamat különböző számítási egységei. Minden lépés önállóan futtatható, és elkülönített számítási erőforrásokat használhat. Minden lépésnek általában saját nevesített bemenetei, kimenetei és paraméterei vannak.

A PipelineStep osztály az az alaposztály, amelyből a gyakori forgatókönyvekhez tervezett más beépített lépésosztályok öröklik a következőt: , PythonScriptStepDataTransferStepés HyperDriveStep.

A folyamatok és a PipelineSteps kapcsolatának áttekintéséért lásd: Mik azok az ML-folyamatok.

PipelineStep inicializálása.

Öröklődés
builtins.object
PipelineStep

Konstruktor

PipelineStep(name, inputs, outputs, arguments=None, fix_port_name_collisions=False, resource_inputs=None)

Paraméterek

name
str
Kötelező

A folyamatlépés neve.

inputs
list
Kötelező

A lépésbemenetek listája.

outputs
list
Kötelező

A lépéskimenetek listája.

arguments
list
alapértelmezett érték: None

A lépésben használt szkriptnek átadni kívánt argumentumok választható listája.

fix_port_name_collisions
bool
alapértelmezett érték: False

Megadja, hogy kijavítsa-e a névütközéseket. Ha az Igaz és a bemenet és a kimenet neve megegyezik, akkor a bemenet "INPUT" előtaggal lesz ellátva. Az alapértelmezett érték a Hamis.

resource_inputs
list
alapértelmezett érték: None

Az erőforrásokként használandó bemenetek opcionális listája. A rendszer letölti az erőforrásokat a szkriptmappába, és lehetővé teszi a szkript futásidejű viselkedésének módosítását.

name
str
Kötelező

A folyamatlépés neve.

inputs
list
Kötelező

A lépésbemenetek listája.

outputs
list
Kötelező

A lépéskimenetek listája.

arguments
list
Kötelező

A lépésben használt szkriptnek átadni kívánt argumentumok választható listája.

fix_port_name_collisions
bool
Kötelező

Megadja, hogy kijavítsa-e a névütközéseket. Ha az Igaz és a bemenet és a kimenet neve megegyezik, akkor a bemenet "INPUT" előtaggal lesz ellátva. Az alapértelmezett érték a Hamis.

resource_inputs
list
Kötelező

Az erőforrásokként használandó bemenetek opcionális listája. A rendszer letölti az erőforrásokat a szkriptmappába, és lehetővé teszi a szkript futásidejű viselkedésének módosítását.

Megjegyzések

A PipelineStep olyan végrehajtási egység, amelynek általában végrehajtási célra (számítási célra), opcionális szkriptargumentumokkal és bemenetekkel végrehajtandó szkriptre van szüksége, és kimeneteket hozhat létre. A lépés számos más, a lépésre jellemző paramétert is igénybe vehet.

A folyamatlépések együtt konfigurálhatók egy Pipeline, amely egy megosztható és újrafelhasználható Azure Machine Learning-munkafolyamatot jelöl. A folyamat minden lépése konfigurálható úgy, hogy lehetővé tegye a korábbi futtatási eredmények újbóli felhasználását, ha a lépés tartalma (szkriptek/függőségek), valamint a bemenetek és paraméterek változatlanok maradnak. A lépés újrahasználásakor a feladat számítási feladatként való elküldése helyett az előző futtatás eredményei azonnal elérhetővé válnak a további lépésekhez.

Az Azure Machine Learning Pipelines beépített lépéseket biztosít a gyakori forgatókönyvekhez. Példákért tekintse meg a steps csomagot és az osztályt AutoMLStep . A folyamat előre elkészített lépéseken alapuló felépítésének áttekintéséért lásd: https://aka.ms/pl-first-pipeline.

A PipelineStep-ből származtatott előre elkészített lépések olyan lépések, amelyeket egy folyamat használ. Ha a gépi tanulási munkafolyamat olyan lépések létrehozására szólít fel, amelyek különböző folyamatokban használhatók és verziószámozottak, akkor használja az osztályt Module .

A folyamatlépések, a bemeneti/kimeneti adatok és a lépések újrafelhasználása során tartsa szem előtt az alábbiakat.

  • Javasoljuk, hogy külön source_directory helyeket használjon a különálló lépésekhez. Ha a folyamat lépéseinek összes szkriptje egyetlen könyvtárban található, a könyvtár kivonata minden alkalommal megváltozik, amikor egy szkriptet módosít, és az összes lépést újrafuttatásra kényszeríti. Példa arra, hogy különböző lépésekhez külön könyvtárakat kell használnia, lásd: https://aka.ms/pl-get-started.

  • Ha külön mappákat tart fenn a szkriptekhez és a függő fájlokhoz minden lépéshez, azzal csökkentheti az egyes lépésekhez létrehozott pillanatkép méretét, mivel csak az adott mappa van pillanatkép készítve. Mivel a lépésben lévő fájlok módosításai source_directory aktiválják a pillanatkép újrafeltöltését, és minden lépésben külön mappákat tart fenn, segít a folyamat lépéseinek újbóli felhasználásában, mert ha egy lépés source_directory nem változik, akkor a rendszer újra felhasználja a lépés előző futtatását.

  • Ha egy lépésben használt adatok egy adattárban találhatóak, és allow_reuse igaz, akkor a rendszer nem észleli az adatváltozás módosításait. Ha az adatok feltöltése a pillanatkép részeként történik (a lépés source_directory alatt), bár ez nem ajánlott, akkor a kivonat megváltozik, és újrafuttat.

Metódusok

create_input_output_bindings

Bemeneti és kimeneti kötéseket hozhat létre a lépés bemeneteiből és kimeneteiből.

create_module_def

Hozza létre a lépést leíró moduldefiníciós objektumot.

create_node

Ezen lépés alapján hozzon létre egy csomópontot a folyamatgráfhoz.

get_source_directory

Kérje le a lépés forráskönyvtárát, és ellenőrizze, hogy létezik-e a szkript.

resolve_input_arguments

A bemenetek és kimenetek argumentumokkal való egyeztetése argumentumsztring létrehozásához.

run_after

Futtassa ezt a lépést a megadott lépés után.

validate_arguments

Ellenőrizze, hogy az argumentumokban megadott lépésbemenetek és -kimenetek szerepelnek-e a bemenetek és kimenetek listájában.

create_input_output_bindings

Bemeneti és kimeneti kötéseket hozhat létre a lépés bemeneteiből és kimeneteiből.

create_input_output_bindings(inputs, outputs, default_datastore, resource_inputs=None)

Paraméterek

inputs
list
Kötelező

A lépésbemenetek listája.

outputs
list
Kötelező

A lépéskimenetek listája.

default_datastore
AbstractAzureStorageDatastore vagy AzureDataLakeDatastore
Kötelező

Az alapértelmezett adattár.

resource_inputs
list
alapértelmezett érték: None

Az erőforrásokként használandó bemenetek listája. A rendszer letölti az erőforrásokat a szkriptmappába, és lehetővé teszi a szkript futásidejű viselkedésének módosítását.

Válaszok

A bemeneti és kimeneti kötések rekordja.

Visszatérési típus

create_module_def

Hozza létre a lépést leíró moduldefiníciós objektumot.

create_module_def(execution_type, input_bindings, output_bindings, param_defs=None, create_sequencing_ports=True, allow_reuse=True, version=None, module_type=None, arguments=None, runconfig=None, cloud_settings=None)

Paraméterek

execution_type
str
Kötelező

A modul végrehajtási típusa.

input_bindings
list
Kötelező

A lépés bemeneti kötései.

output_bindings
list
Kötelező

A lépés kimeneti kötései.

param_defs
list
alapértelmezett érték: None

A lépésparaméter-definíciók.

create_sequencing_ports
bool
alapértelmezett érték: True

Megadja, hogy létrejönnek-e szekvenálási portok a modulhoz.

allow_reuse
bool
alapértelmezett érték: True

Meghatározza, hogy a modul használható lesz-e a jövőbeli folyamatokban való újrafelhasználáshoz.

version
str
alapértelmezett érték: None

A modul verziója.

module_type
str
alapértelmezett érték: None

A létrehozandó modullétrehozó szolgáltatás modultípusa. Jelenleg csak két típus támogatott: "Nincs" és "BatchInferencing". module_type eltér attól execution_type , amely meghatározza, hogy milyen háttérszolgáltatást használjon a modul futtatásához.

arguments
list
alapértelmezett érték: None

A modul meghívásakor használandó jegyzetekkel ellátott argumentumok listája

runconfig
str
alapértelmezett érték: None

A python_script_step

cloud_settings
<xref:azureml.pipeline.core._restclients.aeva.models.CloudSettings>
alapértelmezett érték: None

Felhőkhöz használt beállítások

Válaszok

A moduldefiníciós objektum.

Visszatérési típus

create_node

Ezen lépés alapján hozzon létre egy csomópontot a folyamatgráfhoz.

abstract create_node(graph, default_datastore, context)

Paraméterek

graph
Graph
Kötelező

Az a gráf, amelybe a csomópontot fel szeretné adni.

default_datastore
AbstractAzureStorageDatastore vagy AzureDataLakeDatastore
Kötelező

A lépéshez használandó alapértelmezett adattár.

context
<xref:azureml.pipeline.core._GraphContext>
Kötelező

A gráfkörnyezet objektuma.

Válaszok

A létrehozott csomópont.

Visszatérési típus

get_source_directory

Kérje le a lépés forráskönyvtárát, és ellenőrizze, hogy létezik-e a szkript.

get_source_directory(context, source_directory, script_name)

Paraméterek

context
<xref:azureml.pipeline.core._GraphContext>
Kötelező

A gráfkörnyezet objektuma.

source_directory
str
Kötelező

A lépés forráskönyvtára.

script_name
str
Kötelező

A lépés szkriptneve.

hash_paths
list
Kötelező

A modul ujjlenyomatának meghatározásakor használandó kivonatútvonalak.

Válaszok

A forráskönyvtár és a kivonat elérési útjai.

Visszatérési típus

resolve_input_arguments

A bemenetek és kimenetek argumentumokkal való egyeztetése argumentumsztring létrehozásához.

static resolve_input_arguments(arguments, inputs, outputs, params)

Paraméterek

arguments
list
Kötelező

A lépésargumentumok listája.

inputs
list
Kötelező

A lépésbemenetek listája.

outputs
list
Kötelező

A lépéskimenetek listája.

params
list
Kötelező

A lépésparaméterek listája.

Válaszok

Két elem rekordját adja vissza. Az első a feloldott argumentumok elemeinek egybesimított listája. A második a strukturált argumentumok listája (_InputArgument, _OutputArgument, _ParameterArgument és _StringArgument)

Visszatérési típus

run_after

Futtassa ezt a lépést a megadott lépés után.

run_after(step)

Paraméterek

step
PipelineStep
Kötelező

A lépés előtt futtatandó folyamatlépés.

Megjegyzések

Ha például egy lépést szeretne futtatni, például a 3. lépést az 1. és a 2. lépés befejezése után is, használhatja a következőt:


   step3.run_after(step1)
   step3.run_after(step2)

validate_arguments

Ellenőrizze, hogy az argumentumokban megadott lépésbemenetek és -kimenetek szerepelnek-e a bemenetek és kimenetek listájában.

static validate_arguments(arguments, inputs, outputs)

Paraméterek

arguments
list
Kötelező

A lépésargumentumok listája.

inputs
list
Kötelező

A lépésbemenetek listája.

outputs
list
Kötelező

A lépéskimenetek listája.