Share via


CLI (v2) Automatizált gépi tanulási előrejelzés parancsfeladat YAML-séma

A KÖVETKEZŐKRE VONATKOZIK:Azure CLI ml extension v2 (aktuális)

A forrás JSON-séma a következő helyen található: https://azuremlschemas.azureedge.net/latest/autoMLForecastingJob.schema.json

Megjegyzés

A dokumentumban részletezett YAML-szintaxis az ML CLI v2 bővítmény legújabb verziójának JSON-sémáján alapul. Ez a szintaxis garantáltan csak az ML CLI v2 bővítmény legújabb verziójával működik. A régebbi bővítményverziók sémáit itt találja: https://azuremlschemasprod.azureedge.net/.

YAML-szintaxis

Kulcs Típus Description Megengedett értékek Alapértelmezett érték
$schema sztring A YAML-séma betöltésének helye/URL-címe.
Ha a felhasználó az Azure Machine Learning VS Code-bővítményt használja a YAML-fájl létrehozásához, a fájl tetején is $schema lehetővé teszi a felhasználó számára a séma és az erőforrás-kiegészítések meghívását.
compute sztring Szükséges.
A feladat végrehajtásához használni kívánt AML számítási infrastruktúra neve.
A számítás egy meglévő számítási gépre mutató hivatkozás lehet a munkaterületen
Megjegyzés: A folyamatban lévő feladatok nem támogatják a "helyi" elemet.compute Az itt található "helyi" azt jelenti, hogy a számítási példány a felhasználó Azure Machine Learning stúdió munkaterületén jött létre.
1. meglévő számítás használatának mintája [^azureml:<compute_name>] ,
2.'local' helyi végrehajtás használata
'local'
limits object Az automatizált gépi tanulási táblázatos feladat korlátkonfigurációiból álló szótárobjektumot jelöl.
A kulcs a korlát neve a feladat környezetében, az érték pedig a korlát értéke. Az objektum tulajdonságainak megtekintéséhez tekintse meg a korlátokat .
name sztring A beküldött automatizált gépi tanulási feladat neve.
A munkaterület összes feladatának egyedinek kell lennie. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy GUID azonosítót a névhez.
description sztring Az automatizált gépi tanulási feladat leírása.
display_name sztring Annak a feladatnak a neve, amelyet a felhasználó meg szeretne jeleníteni a stúdió felhasználói felületén. Nem egyedi lehet a munkaterületen belül. Ha nincs megadva, az Azure Machine Learning automatikusan létrehoz egy emberi olvasásra alkalmas melléknév-főnév azonosítót a megjelenítendő névhez.
experiment_name sztring A kísérlet neve.
A kísérletek az Azure-beli gépi tanulási feladatok rekordjai. A kísérletek a futtatások eredményeit, valamint a naplókat, diagramokat és grafikonokat tartalmazzák. Az egyes feladatok futtatási rekordja a megfelelő kísérlet alatt van rendezve a stúdió "Kísérletek" lapján.
Annak a munkakönyvtárnak a neve, amelyben létrehozták
environment_variables object A környezeti változók szótárobjektuma, amelyet a parancs végrehajtásának folyamatára kell beállítani.
outputs object A feladat kimeneti konfigurációinak szótárát jelöli. A kulcs a feladat környezetében lévő kimenet neve, az érték pedig a kimeneti konfiguráció. Az objektum tulajdonságainak megkereséséhez tekintse meg a feladat kimenetét .
log_files object Egy automatikus gépi tanulási feladat végrehajtásának naplóit tartalmazó szótárobjektum
log_verbosity sztring A napló részletességi szintje a naplófájlba való íráshoz.
Az elfogadható értékek a Python naplózási kódtárában vannak definiálva.
'not_set', 'debug', 'info', 'warning', 'error', 'critical' 'info'
type Const Szükséges.
A feladat típusa.
automl automl
task Const Szükséges.
A végrehajtandó automatizált gépi tanulási feladat típusa.
forecasting forecasting
target_column_name sztring Szükséges.
Az előrejelzendő oszlop nevét jelöli. Az automatizált gépi tanulási feladat hibát jelez, ha nincs megadva.
featurization object Az egyéni featurizáció konfigurációját meghatározó szótárobjektum. Ha nem jön létre, az automatikus gépi tanulási konfiguráció automatikus featurizációt alkalmaz. Az objektum tulajdonságainak megtekintéséhez lásd a featurizációt .
forecasting object Az előrejelzési feladat beállításait meghatározó szótárobjektum. Az objektum tulajdonságainak megtekintéséhez tekintse meg az előrejelzést .
n_cross_validations sztring vagy egész szám A modell/folyamat kiválasztásakor végrehajtandó keresztérvényesítések száma, ha validation_data nincs megadva.
Ha mind a paraméter, mind validation_data a paraméter nincs megadva, vagy a értékre Nonevan állítva, akkor az automatizált gépi tanulási feladat alapértelmezés szerint ezt állítja be auto . distributed_featurization Ha engedélyezve van, és validation_data nincs megadva, akkor alapértelmezés szerint 2 értékre van állítva.
'auto', [int] None
primary_metric sztring Egy olyan metrika, amelyet az automatizált gépi tanulás az Idősor-előrejelzési modell kiválasztásához optimalizál.
Ha allowed_training_algorithms "tcn_forecaster" van használatban a betanításhoz, akkor az automatizált gépi tanulás csak a "normalized_root_mean_squared_error" és a "normalized_mean_absolute_error" használatát támogatja primary_metric.
"spearman_correlation", "normalized_root_mean_squared_error", "r2_score""normalized_mean_absolute_error" "normalized_root_mean_squared_error"
training object A modell betanításához használt konfigurációt meghatározó szótárobjektum.
Az objektum tulajdonságainak megtekintéséhez tekintse meg a betanítást .
training_data object Kötelező
Egy olyan szótárobjektum, amely az MLTable konfigurációt tartalmazza, amely meghatározza a modellbetanítás bemeneteként használandó betanítási adatokat. Ezek az adatok az adatok egy részhalmazát alkotják, és független funkciókból/oszlopokból és célfunkciókból/oszlopokból kell lenniük. A felhasználó használhat egy regisztrált MLTable-t a munkaterületen a következő formátumban: (pl. Input(mltable='my_mltable:1')) VAGY használhat helyi fájlt vagy mappát MLTable(pl. Input(mltable=MLTable(local_path="./data")). Ezt az objektumot meg kell adni. Ha a célfunkció nem található meg a forrásfájlban, akkor az automatizált gépi tanulás hibát jelez. Az objektum tulajdonságainak kiderítéséhez tekintse meg a betanítási, ellenőrzési vagy tesztelési adatokat .
validation_data object Egy szótárobjektum, amely az MLTable konfigurációt tartalmazza, amely meghatározza az automatikus gépi tanulási kísérletben keresztérvényesítéshez használandó érvényesítési adatokat. Az objektumnak független funkciókból/oszlopokból és célfunkcióból/oszlopból kell állnia, ha ez az objektum meg van adva. A betanítási és érvényesítési adatok mintái nem fedhetik át egymást egy összecsukva.
Az objektum tulajdonságainak kiderítéséhez tekintse meg a betanítási, ellenőrzési vagy tesztelési adatokat . Ha ez az objektum nincs definiálva, akkor az automatizált gépi tanulás az objektumban definiált betanítási adatokból való felosztásra használja n_cross_validations az training_data érvényesítési adatokat.
test_data object Egy szótárobjektum, amely az MLTable konfigurációt tartalmazza, amely meghatározza a tesztfuttatásban használni kívánt tesztadatokat a legjobb modell használatával kapcsolatos előrejelzésekhez, és meghatározott metrikák használatával értékeli ki a modellt. Ez csak a betanítási adatokban használt független funkciókból állhat (célfunkció nélkül), ha ez az objektum meg van adva.
Az objektum tulajdonságainak kiderítéséhez tekintse meg a betanítási, ellenőrzési vagy tesztelési adatokat . Ha nincs megadva, akkor az automatizált gépi tanulás más beépített módszerekkel javasolja a legjobb modellt a következtetéshez.

Határok

Kulcs Típus Description Megengedett értékek Alapértelmezett érték
enable_early_termination boolean Azt jelzi, hogy engedélyezi-e a kísérlet leállítását, ha a veszteség pontszáma nem javul az "x" iterációk száma után.
Automatizált gépi tanulási feladat esetén az első 20 iterációban nem történik korai leállítás. A korai leállítási ablak csak az első 20 iteráció után indul el.
true, false true
max_concurrent_trials egész szám A párhuzamosan végrehajtandó kísérletek (gyermekfeladatok) maximális száma. Erősen ajánlott az egyidejű futtatások számát a fürt csomópontjainak számára állítani (aml-számítás a következőben computedefiniálva: ). 1
max_trials egész szám Az automatizált gépi tanulási feladatok által a hiperparaméterek különböző kombinációjával futtatható betanítási algoritmusok maximális számát jelöli. Alapértelmezett értéke 1000. Ha enable_early_termination meg van adva, akkor a betanítási algoritmusok futtatásához használt kísérletek száma kisebb lehet. 1000
max_cores_per_trial egész szám Az egyes próbaverziók által használható magok maximális számát jelöli. Az alapértelmezett érték -1, ami azt jelenti, hogy a folyamat minden magját használja. -1
timeout_minutes egész szám A beküldött automatizált gépi tanulási feladat futtatásának maximális időtartama percekben. A megadott idő elteltével a feladat leáll. Ez az időtúllépés magában foglalja az összes próba beállítását, featurizálását, betanítási futtatását, ensembling és modellmeg magyarázhatóságát (ha van).
Ne feledje, hogy nem tartalmazza a folyamat végén futó ensembling és modell magyarázatát, ha a feladat nem fejeződik be a megadott keretek timeout_minutes között, mivel ezek a funkciók az összes próba (gyermekfeladat) elvégzése után érhetők el.
Alapértelmezett értéke 360 perc (6 óra). Ha 1 óránál (60 percnél rövidebb) vagy annál kisebb időtúllépést szeretne megadni, a felhasználónak meg kell győződnie arról, hogy az adathalmaz mérete nem nagyobb 10 000 000-nél (soridő oszlop) vagy hibaeredménynél.
360
trial_timeout_minutes egész szám Az a maximális idő percekben, amíg a beküldött automatizált gépi tanulási feladat minden próbaverziója (gyermekfeladata) futtatható. A megadott idő elteltével a gyermekfeladat leáll. 30
exit_score float A kísérlet által elérni kívánt pontszám. A kísérlet a megadott pontszám elérése után leáll. Ha nincs megadva (nincs feltétel), a kísérlet addig fut, amíg nem történik további előrehaladás a definiált primary metricrendszeren.

Előrejelzés

Kulcs Típus Description Megengedett értékek Alapértelmezett érték
time_column_name sztring Kötelező
Az adathalmaz azon oszlopának neve, amely az egyes idősorok időtengelyének felel meg. A betanításhoz, ellenőrzéshez vagy teszteléshez használt bemeneti adatkészletnek tartalmaznia kell ezt az oszlopot, ha a tevékenység .forecasting Ha nincs megadva vagy be van állítva, az Noneautomatizált gépi tanulási előrejelzési feladat hibát jelez, és leállítja a kísérletet.
forecast_horizon sztring vagy egész szám A maximális előrejelzési horizont az idősorok gyakoriságának egységeiben. Ezek az egységek a betanítási adatok kikövetkeztetett időintervallumán alapulnak (például havonta, hetente), amelyet az előrejelző előrejelez. Ha a Nincs vagy autoa értékre van állítva, akkor az alapértelmezett értéke 1, ami azt jelenti, hogy "t+1" a bemeneti adatok utolsó időbélyegének t-éből. auto, [int] 1
frequency sztring Az előrejelzés létrehozásának gyakorisága, például napi, heti, éves stb.
Ha nincs megadva, vagy Nincs értékre van állítva, akkor az alapértelmezett értéke az adathalmaz időindexéből lesz kikövetkeztetve. A felhasználó az adathalmaz kikövetkeztetett gyakoriságánál nagyobb, de annál nem kisebb értéket állíthat be. Ha például az adathalmaz gyakorisága napi, akkor olyan értékeket vehet fel, mint a napi, heti, havi, de nem óránként, mivel az óránkénti érték kevesebb, mint a napi (24 óra).
További információért tekintse meg a pandas dokumentációját .
None
time_series_id_column_names sztring vagy lista(sztringek) A több idősorba csoportosítandó adatok oszlopainak neve. Ha time_series_id_column_names nincs definiálva, vagy Nincs értékre van állítva, az automatikus gépi tanulás automatikus észlelési logikával észleli az oszlopokat. None
feature_lags sztring Azt jelzi, hogy a felhasználó automatikusan szeretne-e késéseket generálni a megadott numerikus funkciókhoz. Az alapértelmezett érték a értékre autovan állítva, ami azt jelenti, hogy az automatizált gépi tanulás automatikus javítási alapú heurisztika használatával automatikusan kiválasztja az késési rendeléseket, és létrehozza a megfelelő késési funkciókat az összes numerikus funkcióhoz. A "Nincs" azt jelenti, hogy nem jön létre késés a numerikus funkciókhoz. 'auto', None None
country_or_region_for_holidays sztring Az az ország vagy régió, amely az ünnepi szolgáltatások létrehozásához használható. Ezeket a karaktereket iso 3166 kétbetűs ország-/régiókódokban kell ábrázolni, például "US" vagy "GB". Az ISO-kódok listája itt található https://wikipedia.org/wiki/List_of_ISO_3166_country_codes: . None
cv_step_size sztring vagy egész szám Az egyes önéletrajzok origin_time és a következő hajtás közötti időszakok száma. Ha például a napi adatok esetében 3-ra van állítva, az egyes hajtások forrásideje három nap különbséget jelent. Ha Nincs vagy nincs megadva, akkor alapértelmezés szerint a értékre van állítva auto . Ha egész típusú, akkor a minimális érték 1, különben hibát jelez. auto, [int] auto
seasonality sztring vagy egész szám Az idősor szezonalitása a sorozat gyakoriságának egész szám többszöröseként. Ha a szezonalitás nincs megadva, az értéke értékre 'auto'van állítva, ami azt jelenti, hogy automatikusan kikövetkezteti az automatizált gépi tanulás. Ha ez a paraméter nem értékre Nonevan állítva, az automatizált gép nem szezonálisként feltételezi az idősort, ami egyenértékű az 1 egész szám értékének beállításával. 'auto', [int] auto
short_series_handling_config sztring Azt jelzi, hogy az automatizált gépi tanulás hogyan kezelje a rövid idősorokat, ha meg van adva. A következő értékeket veszi fel:
  • 'auto' : rövid sorozat van párnázott, ha nincs hosszú sorozat, különben a rövid sorozat el van dobva.
  • 'pad': az összes rövid sorozat nullákkal van kipárnázott.
  • 'drop': az összes rövid sorozat el van dobva.
  • None: a rövid sorozat nem módosul.
    'auto', 'pad', 'drop', None auto
    target_aggregate_function sztring Az aggregátumfüggvényt jelöli, amely a céloszlop idősorokban való összesítéséhez és az előrejelzések meghatározott gyakorisággal történő létrehozásához használható (a következőben definiálva freq: ). Ha ez a paraméter be van állítva, de a freq paraméter nincs beállítva, hibaüzenet jelenik meg. A program kihagyja vagy Nincs értékre állítja, majd nem alkalmaz összesítést. 'sum', 'max', 'min', 'mean' auto
    target_lags sztring vagy egész szám vagy lista(egész szám) Az adathalmaz gyakorisága alapján a célértékektől való késéshez használandó múltbeli/előzményidőszakok száma. Alapértelmezés szerint ez a paraméter ki van kapcsolva. A 'auto' beállítás lehetővé teszi, hogy a rendszer automatikus heurisztikus alapú késést használjon.
    Ezt a késési tulajdonságot akkor kell használni, ha a független változók és a függő változók közötti kapcsolat alapértelmezés szerint nem korrelál. További információ: Az idősorok előrejelzésének késési funkciói az automatizált gépi tanulásban.
    'auto', [int] None
    target_rolling_window_size sztring vagy egész szám A céloszlop gördülőablak-átlagának létrehozásához használandó múltbeli megfigyelések száma. Előrejelzéskor ez a paraméter n előzményidőszakot jelöl az előrejelzett értékek létrehozásához, <= betanítási készlet mérete. Ha nincs megadva, n a betanítási csoport teljes mérete. Adja meg ezt a paramétert, ha csak bizonyos mennyiségű előzményt szeretne figyelembe venni a modell betanításakor. 'auto'Egész None None
    use_stl sztring Az STL-felbontás idősorokon való alkalmazásával létrehozandó összetevők. Ha nincs megadva vagy Nincs értékre van állítva, a rendszer nem hoz létre idősor-összetevőt.
    use_stl két értéket vehet fel:
    'season' : szezonösszetevő létrehozásához.
    'season_trend' : a szezon automatizált gépi tanulási és trendösszetevőinek létrehozásához.
    'season', 'seasontrend' None

    betanítási, ellenőrzési vagy tesztelési adatok

    Kulcs Típus Description Megengedett értékek Alapértelmezett érték
    datastore sztring Annak az adattárnak a neve, ahol az adatokat a felhasználó feltölti.
    path sztring Az az elérési út, ahonnan az adatokat be kell tölteni. Ez lehet file elérési út, folder elérési út vagy pattern elérési út.
    pattern olyan keresési mintát ad meg, amely lehetővé teszi az adatokat tartalmazó fájlok és mappák globbing(* és **) használatát. A támogatott URI-típusok a következők: azureml, https, wasbs, abfssés adl. További információ: Core yaml szintaxis az azureml:// URI formátum használatának megismeréséhez. Az összetevőfájl helyének URI-ja. Ha ez az URI nem rendelkezik sémával (például http:, azureml: stb.), akkor a rendszer helyi hivatkozásnak tekinti, és az entitás létrehozásakor a rendszer feltölti az alapértelmezett munkaterületi blobtárolóba.
    type Const A bemeneti adatok típusa. A számítógépes látástechnológiai modellek létrehozásához a felhasználónak címkézett képadatokat kell bemenetként használnia a modell betanításához MLTable formátumban. mltable mltable

    Képzés

    Kulcs Típus Description Megengedett értékek Alapértelmezett érték
    allowed_training_algorithms list(sztring) Az idősorozat-előrejelzési algoritmusok listája, amelyet egy kísérlet modellbetanításának alapmodelljeként próbálhat ki. Ha nincs megadva vagy Nincs értékre van állítva, akkor a rendszer az összes támogatott algoritmust használja a kísérlet során, kivéve a következőben blocked_training_algorithmsmegadott algoritmusokat: . 'auto_arima', 'prophet', 'naive','seasonal_naive', 'average', 'seasonal_average', 'exponential_smoothing', 'arimax', 'tcn_forecaster', 'elastic_net', 'gradient_boosting', 'decision_tree', 'knn', 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees', 'light_gbm', 'xg_boost_regressor' None
    blocked_training_algorithms list(sztring) Az idősorozat-előrejelzési algoritmusok listája, hogy ne fussanak alapmodellként egy kísérlet modellbetanítása során. Ha nincs megadva, vagy Nincs értékre van állítva, akkor a rendszer az összes támogatott algoritmust használja a modell betanítása során. 'auto_arima', 'prophet', 'naive', 'seasonal_naive', 'average', 'seasonal_average', 'exponential_smoothing', 'arimax','tcn_forecaster', 'elastic_net', 'gradient_boosting', 'decision_tree', 'knn', 'lasso_lars', 'sgd', 'random_forest', 'extreme_random_trees', 'light_gbm', 'xg_boost_regressor' None
    enable_dnn_training boolean A DNN-alapú modellek felvételének be- vagy kikapcsolására szolgáló jelző, amely kipróbálható a modell kiválasztása során. True, False False
    enable_model_explainability boolean Egy jelzőt jelöl, amely bekapcsolja a modell magyarázhatóságát, például a funkció fontosságát, amely az automatizált gépi tanulási rendszer által kiértékelt legjobb modell. True, False True
    enable_vote_ensemble boolean Jelölő egyes alapmodellek szavazási algoritmussal történő engedélyezéséhez vagy letiltásához. További információ az együttesekről: Automatikus betanítása. true, false true
    enable_stack_ensemble boolean Jelző egyes alapmodellek stacking algoritmussal történő engedélyezéséhez vagy letiltásához. Az előrejelzési feladatokban ez a jelző alapértelmezés szerint ki van kapcsolva, hogy elkerülje a túlillesztés kockázatát a metatanuló illesztéséhez használt kis betanítási készlet miatt. További információ az együttesekről: Automatikus betanítása. true, false false

    featurization

    Kulcs Típus Description Megengedett értékek Alapértelmezett érték
    mode sztring Az automatizált gépi tanulási feladat által használandó featurizációs mód.
    Beállítás a következőre:
    'auto' azt jelzi, hogy a featurizációs lépést automatikusan el kell-e végezni
    'off' azt jelzi, hogy nincs olyan featurizáció<'custom' , amely azt jelzi, hogy érdemes-e testre szabott featurizációt használni.

    Megjegyzés: Ha a bemeneti adatok ritkán fordulnak elő, a featurizáció nem kapcsolható be.
    'auto', 'off', 'custom' None
    blocked_transformers list(sztring) Az automated ML által a featurizáció során blokkolandó transzformátornevek listája, ha a featurizáció mode "egyéni" értékre van állítva. 'text_target_encoder', 'one_hot_encoder', 'cat_target_encoder', 'tf_idf', 'wo_e_target_encoder', 'label_encoder', 'word_embedding', 'naive_bayes', 'count_vectorizer', 'hash_one_hot_encoder' None
    column_name_and_types object Egy szótárobjektum, amely oszlopneveket tartalmaz diktálási kulcsként és az oszlopcél társított értékként való frissítéséhez használt funkciótípusokból, ha a featurizáció mode "egyéni" értékre van állítva.
    transformer_params object Egy beágyazott szótárobjektum, amely kulcsként transzformátornevet és a megfelelő testreszabási paramétereket tartalmaz az adathalmazoszlopokon a featurizáláshoz, ha a featurizáció mode "egyéni" értékre van állítva.
    Az előrejelzés csak a testreszabást támogató transzformátort támogatja imputer .
    A testreszabási paraméterek létrehozásának módjáról a column_transformers olvashat.
    None

    column_transformers

    Kulcs Típus Description Megengedett értékek Alapértelmezett érték
    fields list(sztring) Azoknak az oszlopneveknek a listája, amelyekre a megadott transformer_params nevet alkalmazni kell.
    parameters object Egy szótárobjektum, amely a "stratégia" mint kulcs és érték mint számítási stratégia.
    A megadásával kapcsolatos további részletekért tekintse meg a példákat itt.

    Feladatkimenetek

    Kulcs Típus Description Megengedett értékek Alapértelmezett érték
    type sztring A feladat kimenetének típusa. Az alapértelmezett uri_folder típus esetében a kimenet egy mappának felel meg. uri_folder , mlflow_model, custom_model uri_folder
    mode sztring A kimeneti fájlok céltárolóba való kézbesítésének módja. Olvasási és írási csatlakoztatási mód (rw_mount) esetén a kimeneti könyvtár egy csatlakoztatott könyvtár. Feltöltési mód esetén a megírt fájl(ok) a feladat végén lesznek feltöltve. rw_mount, upload rw_mount

    Előrejelzési feladat futtatása a parancssori felületen

    az ml job create --file [YOUR_CLI_YAML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]