AdlaStep Osztály
Létrehoz egy Azure ML-folyamatlépést, amellyel U-SQL-szkriptet futtathat az Azure Data Lake Analytics.
Az AdlaStep használatára példaként tekintse meg a jegyzetfüzetet https://aka.ms/pl-adla.
Hozzon létre egy Azure ML-folyamatlépést, amellyel U-SQL-szkriptet futtathat az Azure Data Lake Analytics.
- Öröklődés
-
azureml.pipeline.core._adla_step_base._AdlaStepBaseAdlaStep
Konstruktor
AdlaStep(script_name, name=None, inputs=None, outputs=None, params=None, degree_of_parallelism=None, priority=None, runtime_version=None, compute_target=None, source_directory=None, allow_reuse=True, version=None, hash_paths=None)
Paraméterek
Name | Description |
---|---|
script_name
Kötelező
|
[Kötelező] Egy U-SQL-szkript neve a következőhöz |
name
|
A lépés neve. Ha nincs meghatározva, alapértelmezett érték: None
|
inputs
|
A bemenetiport-kötések listája. alapértelmezett érték: None
|
outputs
|
A kimeneti portkötések listája. alapértelmezett érték: None
|
params
|
Név-érték párok szótára. alapértelmezett érték: None
|
degree_of_parallelism
|
A feladathoz használandó párhuzamosság mértéke. Ennek 0-nál nagyobbnak kell lennie. Ha 0-nál kisebb értékre van állítva, az alapértelmezett érték 1. alapértelmezett érték: None
|
priority
|
Az aktuális feladathoz használandó prioritási érték. Az alacsonyabb számok magasabb prioritást élveznek. Alapértelmezés szerint egy feladat prioritása 1000. A megadott értéknek 0-nál nagyobbnak kell lennie. alapértelmezett érték: None
|
runtime_version
|
A Data Lake Analytics motor futtatókörnyezeti verziója. alapértelmezett érték: None
|
compute_target
|
[Kötelező] A feladathoz használandó ADLA-számítás. alapértelmezett érték: None
|
source_directory
|
Egy mappa, amely tartalmazza a szkriptet, szerelvényeket stb. alapértelmezett érték: None
|
allow_reuse
|
Azt jelzi, hogy a lépés újra felhasználja-e a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra. Az újrafelhasználás alapértelmezés szerint engedélyezve van. Ha a lépés tartalma (szkriptek/függőségek), valamint a bemenetek és paraméterek változatlanok maradnak, a rendszer újra felhasználja a lépés előző futtatásának kimenetét. A lépés újrahasználásakor a feladat számítási feladatként való elküldése helyett az előző futtatás eredményei azonnal elérhetővé válnak a további lépésekhez. Ha az Azure Machine Learning-adatkészleteket használja bemenetként, az újrafelhasználást az határozza meg, hogy az adathalmaz definíciója megváltozott-e, nem pedig az, hogy az alapul szolgáló adatok megváltoztak-e. alapértelmezett érték: True
|
version
|
Nem kötelező verziócímke a lépés funkcióváltozásának jelöléséhez. alapértelmezett érték: None
|
hash_paths
|
ELAVULT: már nincs rá szükség. A kivonat elérési útjainak listája a lépés tartalmának módosításakor. Ha nem észlelhető változás, a folyamat újra felhasználja az előző futtatás lépéstartalmat. Alapértelmezés szerint a tartalma alapértelmezett érték: None
|
script_name
Kötelező
|
[Kötelező] Egy U-SQL-szkript neve a következőhöz |
name
Kötelező
|
A lépés neve. Ha nincs meghatározva, |
inputs
Kötelező
|
Bemenetiport-kötések listája |
outputs
Kötelező
|
list[Union[PipelineData, <xref:azureml.pipeline.core.pipeline_output_dataset.PipelineAbstractOutputDataset>, OutputPortBinding]]
A kimeneti portkötések listája. |
params
Kötelező
|
Név-érték párok szótára. |
degree_of_parallelism
Kötelező
|
A feladathoz használandó párhuzamosság mértéke. Ennek 0-nál nagyobbnak kell lennie. Ha 0-nál kisebb értékre van állítva, az alapértelmezett érték 1. |
priority
Kötelező
|
Az aktuális feladathoz használandó prioritási érték. Az alacsonyabb számok magasabb prioritást élveznek. Alapértelmezés szerint egy feladat prioritása 1000. A megadott értéknek 0-nál nagyobbnak kell lennie. |
runtime_version
Kötelező
|
A Data Lake Analytics motor futtatókörnyezeti verziója. |
compute_target
Kötelező
|
[Kötelező] A feladathoz használandó ADLA-számítás. |
source_directory
Kötelező
|
Egy mappa, amely tartalmazza a szkriptet, szerelvényeket stb. |
allow_reuse
Kötelező
|
Azt jelzi, hogy a lépés újra felhasználja-e a korábbi eredményeket, amikor ugyanazokkal a beállításokkal fut újra. Az újrafelhasználás alapértelmezés szerint engedélyezve van. Ha a lépés tartalma (szkriptek/függőségek), valamint a bemenetek és paraméterek változatlanok maradnak, a rendszer újra felhasználja a lépés előző futtatásának kimenetét. A lépés újrahasználásakor a feladat számítási feladatként való elküldése helyett az előző futtatás eredményei azonnal elérhetővé válnak a további lépésekhez. Ha az Azure Machine Learning-adatkészleteket használja bemenetként, az újrafelhasználást az határozza meg, hogy az adathalmaz definíciója megváltozott-e, nem pedig az, hogy az alapul szolgáló adatok megváltoztak-e. |
version
Kötelező
|
Nem kötelező verziócímke, amely a lépés funkcióváltozását jelzi. |
hash_paths
Kötelező
|
ELAVULT: már nincs rá szükség. A kivonat elérési útjainak listája a lépés tartalmának módosításakor. Ha nem észlelhető változás, a folyamat újra felhasználja az előző futtatás lépéstartalmat. Alapértelmezés szerint a tartalma |
Megjegyzések
A szkriptben @@name@@ szintaxis használatával hivatkozhat bemenetekre, kimenetekre és paraméterekre.
ha a név egy bemeneti vagy kimeneti portkötés neve, akkor a szkriptben a @@name@@ előfordulásai a megfelelő portkötés tényleges adatútvonalával lesznek lecserélve.
Ha a név megegyezik a params dict bármely kulcsával, a @@name@@ minden előfordulását a megfelelő értékre cseréli a diktálásban.
Az AdlaStep csak a Data Lake Analytics fiók alapértelmezett Data Lake Storage tárolt adatokkal működik. Ha az adatok nem alapértelmezett tárolóban találhatóak, a használatával DataTransferStep másolja az adatokat az alapértelmezett tárolóba. Az alapértelmezett tárterületet úgy találja meg, hogy megnyitja Data Lake Analytics fiókját a Azure Portal, majd a bal oldali panel Beállítások területén az "Adatforrások" elemre lép.
Az alábbi példa bemutatja, hogyan használható az AdlaStep egy Azure Machine Learning-folyamatban.
adla_step = AdlaStep(
name='extract_employee_names',
script_name='sample_script.usql',
source_directory=sample_folder,
inputs=[sample_input],
outputs=[sample_output],
compute_target=adla_compute)
A teljes minta a következő forrásból érhető el: https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-use-adla-as-compute-target.ipynb
Metódusok
create_node |
Hozzon létre egy csomópontot az AdlaStep lépésből, és adja hozzá a megadott gráfhoz. Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz. |
create_node
Hozzon létre egy csomópontot az AdlaStep lépésből, és adja hozzá a megadott gráfhoz.
Ezt a módszert nem közvetlenül kell használni. Ha ezzel a lépéssel példányosít egy folyamatot, az Azure ML automatikusan átadja a szükséges paramétereket ezen a módszeren keresztül, hogy a lépés hozzáadható legyen a munkafolyamatot képviselő folyamatgráfhoz.
create_node(graph, default_datastore, context)
Paraméterek
Name | Description |
---|---|
graph
Kötelező
|
A gráfobjektum. |
default_datastore
Kötelező
|
Az alapértelmezett adattár. |
context
Kötelező
|
<xref:azureml.pipeline.core._GraphContext>
A gráfkörnyezet. |
Válaszok
Típus | Description |
---|---|
A csomópontobjektum. |
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: