automl Csomag

Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz.

A fő területek közé tartozik az AutoML-feladatok kezelése.

Osztályok

ClassificationJob

Az AutoML-besorolási feladat konfigurációja.

Új AutoML-besorolási feladat inicializálása.

ColumnTransformer

Oszlopátalakító beállításai.

ForecastingJob

AutoML-előrejelzési feladat konfigurálása.

Új AutoML-előrejelzési feladat inicializálása.

ForecastingSettings

AutoML-feladat előrejelzési beállításai.

ImageClassificationJob

Az AutoML többosztályos rendszerkép-besorolási feladatának konfigurálása.

Inicializáljon egy új AutoML többosztályos rendszerkép-besorolási feladatot.

ImageClassificationMultilabelJob

Az AutoML többcímkés képbesorolási feladatának konfigurálása.

Inicializáljon egy új, többcímkés AutoML-képbesorolási feladatot.

ImageClassificationSearchSpace

Keressen helyet az AutoML-képbesorolási és képbesorolási többcímkés feladatokhoz.

ImageInstanceSegmentationJob

Az AutoML-lemezképpéldány szegmentálási feladatának konfigurálása.

Új AutoML-lemezképpéldány szegmentálási feladatának inicializálása.

ImageLimitSettings

AutoML-kép függőleges beállításainak korlátozása.

Az ImageLimitSettings egy osztály, amely a következő paramétereket tartalmazza: max_concurrent_trials, max_trials és timeout_minutes.

Ez egy nem kötelező konfigurációs módszer a korlátok paramétereinek( például időtúllépések stb.) konfigurálásához.

Megjegyzés

Az egyidejű futtatások száma a megadott számítási célban elérhető erőforrásokon van meghatározva.

Győződjön meg arról, hogy a számítási cél rendelkezik a kívánt egyidejűséghez elérhető erőforrásokkal.

Tipp

Ajánlott max_concurrent_trials számát a fürt csomópontjainak számával egyeztetni.

Ha például egy fürt 4 csomóponttal rendelkezik, állítsa max_concurrent_trials 4-re.

Példahasználat

Az ImageLimitSettings konfigurálása


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

ImageLimitSettings objektum inicializálása.

Az ImageLimitSettings konstruktora autoML-kép függőlegesekhez.

ImageModelSettingsClassification

Modellbeállítások az AutoML-képbesorolási feladatokhoz.

ImageModelSettingsObjectDetection

Az AutoML képobjektum-észlelési feladat modellbeállításai.

ImageObjectDetectionJob

Az AutoML-lemezképobjektum-észlelési feladat konfigurációja.

Inicializáljon egy új AutoML-képobjektum-észlelési feladatot.

ImageObjectDetectionSearchSpace

Keressen helyet az AutoML képobjektum-észlelési és a képpéldány szegmentálási feladataihoz.

ImageSweepSettings

Takarítási beállítások az összes AutoML-kép függőlegesen.

NlpFeaturizationSettings

Az összes AutoML NLP-függőleges featurizációs beállításai.

NlpFixedParameters

Az objektum rögzített paramétereket biztosít az NLP-feladatokhoz.

NlpLimitSettings

Az autoML NLP-függőleges beállításainak korlátozása.

NlpSearchSpace

Keressen helyet az AutoML NLP-feladatokhoz.

NlpSweepSettings

Takarítási beállítások az összes AutoML NLP-feladathoz.

RegressionJob

Az AutoML regressziós feladatának konfigurálása.

Új AutoML regressziós feladat inicializálása.

SearchSpace

SearchSpace osztály AutoML-függőlegesekhez.

StackEnsembleSettings

A StackEnsemble-futtatás testreszabásának előzetes beállítása.

TabularFeaturizationSettings

AutoML-feladat featurizációs beállításai.

TabularLimitSettings

AutoML-táblázat függőleges beállításainak korlátozása.

TextClassificationJob

Az AutoML szövegbesorolási feladatának konfigurálása.

Inicializál egy új AutoML szövegbesorolási feladatot.

TextClassificationMultilabelJob

Az AutoML-szövegbesorolási többcímkés feladat konfigurálása.

Inicializál egy új AutoML szövegbesorolási többcímkés feladatot.

TextNerJob

Az AutoML Text NER-feladat konfigurációja.

Inicializál egy új AutoML Text NER-feladatot.

TrainingSettings

TrainingSettings osztály az Azure Machine Learninghez.

TrainingSettings osztály az Azure Machine Learninghez.

Enumerációk

BlockedTransformers

Enumerálás az AutoML által támogatott összes besorolási modellhez.

ClassificationModels

Enumerálás az AutoML által támogatott összes besorolási modellhez.

ClassificationMultilabelPrimaryMetrics

Elsődleges metrikák a többcímkés feladatok besorolásához.

ClassificationPrimaryMetrics

A besorolási feladatok elsődleges metrikái.

FeaturizationMode

Featurizációs mód – az adatok featurálási módját határozza meg.

ForecastHorizonMode

Enumerálás az előrejelzési horizont kijelölési módjának meghatározásához.

ForecastingModels

Az AutoML által támogatott összes előrejelzési modell enumerálása.

ForecastingPrimaryMetrics

Az előrejelzési tevékenység elsődleges metrikái.

InstanceSegmentationPrimaryMetrics

Az InstanceSegmentation feladatok elsődleges metrikái.

LearningRateScheduler

Tanulási sebességütemező enumerációja.

LogTrainingMetrics

Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz.

A fő területek közé tartozik az AutoML-feladatok kezelése.

LogValidationLoss

Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz.

A fő területek közé tartozik az AutoML-feladatok kezelése.

NCrossValidationsMode

Meghatározza az N-Cross validations érték meghatározásának módját.

ObjectDetectionPrimaryMetrics

Az Image ObjectDetection feladat elsődleges metrikái.

RegressionModels

Az AutoML által támogatott összes regressziós modell enumerációja.

RegressionPrimaryMetrics

A regressziós feladat elsődleges metrikái.

SamplingAlgorithmType

Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz.

A fő területek közé tartozik az AutoML-feladatok kezelése.

ShortSeriesHandlingConfiguration

Az a paraméter, amely meghatározza, hogy az AutoML hogyan kezelje a rövid idősorokat.

StochasticOptimizer

Sztochasztikus optimalizáló képmodellekhez.

TargetAggregationFunction

Cél aggregátumfüggvény.

TargetLagsMode

A célelmaradások kiválasztási módjai.

TargetRollingWindowSizeMode

Célgördülő ablakméret mód.

UseStl

Konfigurálja az idősor céloszlopának STL-felbontását.

ValidationMetricType

Metrikaszámítási módszer a rendszerképfeladatok érvényesítési metrikáihoz.

Függvények

classification

Függvény a ClassificationJob létrehozásához.

A besorolási feladat egy olyan modell betanítása, amely a legjobban előrejelzi az adatminta osztályát. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki, amely a legjobb teljesítményt nyújtja az érvényesítési adatokon az elsődleges metrika alapján.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

target_column_name
str

A címkeoszlop neve. Ez a paraméter a , validation_data és test_data paraméterekre vonatkozik training_data

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításáról további információt a következő témakörben talál https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric: .

Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted és precision_score_weighted Alapértelmezett értékek a pontossághoz

enable_model_explainability
bool

Engedélyezi-e a legjobb AutoML-modell magyarázatát az autoML betanítási iterációinak végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.

weight_column_name
str

A minta súlyozási oszlopának neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, ami az adatok sorainak súlyozását okozza. Ha a bemeneti adatok pandas-ból származnak. A DataFrame nem rendelkezik oszlopnevekkel, az oszlopindexek használhatók egész számként kifejezve.

Ez a paraméter a és validation_data a paraméterre training_data vonatkozik

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

Alapértelmezett érték: Nincs

validation_data_size
float

A felhasználóérvényesítési adatok meg nem adása esetén az ellenőrzéshez visszatartandó adatok hányada. Ennek 0,0 és 1,0 közöttinek kell lennie, nem inkluzívnak.

Itt adhatja meg validation_data az érvényesítési adatok megadását, máskülönben beállíthatja n_cross_validations vagy validation_data_size kinyerheti az érvényesítési adatokat a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatmegosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

n_cross_validations
Union[str, int]

Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.

Itt adhatja meg validation_data az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations vagy validation_data_size az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

cv_split_column_names
List[str]

Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.

Alapértelmezett érték: Nincs

test_data
Input

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ha ez a paraméter vagy a test_data_size paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást. A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is. Ha test_data meg van adva, meg kell adni a target_column_name paramétert.

Alapértelmezett érték: Nincs

test_data_size
float

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat. Ha test_data_size a paramétert a () értékével egy időben validation_data_sizeadja meg, akkor a tesztadatok felosztása training_data az érvényesítési adatok felosztása előtt történik. Ha például a validation_data_size=0.1, test_data_size=0.1 és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.

Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.

Ha ez a paraméter vagy a test_data paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.

Alapértelmezett érték: Nincs

Válaszok

Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.

Visszatérési típus

forecasting

Függvény előrejelzési feladat létrehozásához.

Az előrejelzési feladat a jövőbeli időszakra vonatkozó célértékek előrejelzésére szolgál az előzményadatok alapján. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki, amely a legjobb teljesítményt nyújtja az érvényesítési adatokon az elsődleges metrika alapján.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_datatest_data a paraméterekre training_datavonatkozik

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Alapértelmezett értékek normalized_root_mean_squared_error

enable_model_explainability
bool

A legjobb AutoML-modell magyarázatának engedélyezése az AutoML-betanítási iterációk végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.

weight_column_name
str

A mintasúly oszlop neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, így az adatok sorai felfelé vagy lefelé lesznek súlyozottak. Ha a bemeneti adatok pandasból származnak. Az oszlopnevekkel nem rendelkező DataFrame helyett az oszlopindexek használhatók egész számként kifejezve.

Ez a paraméter a és validation_data a paraméterekre training_data alkalmazható

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

Alapértelmezett érték: Nincs

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Itt adhatja meg validation_data az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations vagy validation_data_size az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

n_cross_validations
Union[str, int]

Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.

Itt adhatja meg validation_data az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations vagy validation_data_size az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

cv_split_column_names
List[str]

Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.

Alapértelmezett érték: Nincs

test_data
Input

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ha ez a paraméter vagy a test_data_size paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást. A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is. Ha test_data meg van adva, meg kell adni a target_column_name paramétert.

Alapértelmezett érték: Nincs

test_data_size
float

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat. Ha test_data_size a paramétert a () értékével egy időben validation_data_sizeadja meg, akkor a tesztadatok felosztása training_data az érvényesítési adatok felosztása előtt történik. Ha például a validation_data_size=0.1, test_data_size=0.1 és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.

Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.

Ha ez a paraméter vagy a test_data paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.

Alapértelmezett érték: Nincs

forecasting_settings
ForecastingSettings

Az előrejelzési feladat beállításai

Válaszok

Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.

Visszatérési típus

image_classification

Létrehoz egy objektumot az AutoML-rendszerkép többosztályos besorolási feladatához.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok.

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_data a paraméterekre training_data vonatkozik.

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted és precision_score_weighted Alapértelmezett értékek a pontosság érdekében.

validation_data
Input

A kísérletben használandó érvényesítési adatok.

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Adja meg validation_data , hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size , hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.

Alapértelmezett érték: .2

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

Képbesorolási feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.

Visszatérési típus

image_classification_multilabel

Létrehoz egy objektumot az AutoML-rendszerkép többcímkés besorolási feladatához.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok.

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_data a paraméterekre training_data vonatkozik.

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted és Iou Defaults to Iou.

validation_data
Input

A kísérletben használandó érvényesítési adatok.

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Adja meg validation_data , hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size , hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.

Alapértelmezett érték: .2

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

Kép többcímkés besorolási feladatobjektum, amely végrehajtás céljából elküldhető egy Azure ML-számításba.

Visszatérési típus

image_instance_segmentation

Létrehoz egy objektumot az AutoML-lemezképpéldány szegmentálási feladatához.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok.

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_data a paraméterekre training_data vonatkozik.

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

A kísérletben használandó érvényesítési adatok.

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Adja meg validation_data , hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size , hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.

Alapértelmezett érték: .2

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

Képpéldány szegmentálási feladata

Visszatérési típus

image_object_detection

Létrehoz egy objektumot az AutoML-rendszerképobjektum-észlelési feladathoz.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok.

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_data a paraméterekre training_data vonatkozik.

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

A kísérletben használandó érvényesítési adatok.

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Adja meg validation_data , hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size , hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.

Alapértelmezett érték: .2

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

Képobjektum-észlelési feladatobjektum, amely végrehajtás céljából elküldhető egy Azure ML-számításba.

Visszatérési típus

regression

Regressziós feladat létrehozásához.

A regressziós feladat egy modell betanítására szolgál egy adathalmazból származó célváltozó folyamatos értékeinek előrejelzésére. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki a rendszer, amely az elsődleges metrika alapján a legjobb teljesítményt nyújtja az érvényesítési adatokon.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

target_column_name
str

A címkeoszlop neve. Ez a paraméter a és validation_datatest_data a paraméterekre training_datavonatkozik

primary_metric

Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Elfogadható értékek: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Alapértelmezés szerint normalized_root_mean_squared_error

enable_model_explainability
bool

A legjobb AutoML-modell magyarázatának engedélyezése az AutoML-betanítási iterációk végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.

weight_column_name
str

A mintasúly oszlop neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, így az adatok sorai felfelé vagy lefelé lesznek súlyozottak. Ha a bemeneti adatok pandasból származnak. Az oszlopnevekkel nem rendelkező DataFrame helyett az oszlopindexek használhatók egész számként kifejezve.

Ez a paraméter a és validation_data a paraméterekre training_data alkalmazható

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).

Alapértelmezett érték: Nincs

validation_data_size
float

A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.

Itt adhatja meg validation_data az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations vagy validation_data_size az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

n_cross_validations
Union[str, int]

Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.

Itt adhatja meg validation_data az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations vagy validation_data_size az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból. Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names: .

További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.

Alapértelmezett érték: Nincs

cv_split_column_names
List[str]

Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.

Alapértelmezett érték: Nincs

test_data
Input

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ha ez a paraméter vagy a test_data_size paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást. A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is. Ha test_data meg van adva, meg kell adni a target_column_name paramétert.

Alapértelmezett érték: Nincs

test_data_size
float

A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.

Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat. Ha test_data_size a paramétert a () értékével egy időben validation_data_sizeadja meg, akkor a tesztadatok felosztása training_data az érvényesítési adatok felosztása előtt történik. Ha például a validation_data_size=0.1, test_data_size=0.1 és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.

Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.

Ha ez a paraméter vagy a test_data paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.

Alapértelmezett érték: Nincs

Válaszok

Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.

Visszatérési típus

text_classification

TextClassificationJob létrehozásához használható függvény.

A szövegbesorolási feladat egy olyan modell betanítása, amely képes előrejelezni a szöveges adatok osztályát/kategóriáját. A bemeneti betanítási adatoknak tartalmazniuk kell egy céloszlopot, amely pontosan egy osztályba sorolja a szöveget.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

target_column_name
str

A céloszlop neve.

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

primary_metric
Union[str, ClassificationPrimaryMetrics]

A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság, AUC_weighted, precision_score_weighted

log_verbosity
str

Napló részletességi szintje.

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

A TextClassificationJob objektum.

Visszatérési típus

text_classification_multilabel

TextClassificationMultilabelJob létrehozásához használható függvény.

A szövegbesorolási többcímkés feladat egy olyan modell betanítása, amely képes előrejelezni a szöveges adatok osztályait/kategóriáit. A bemeneti betanítási adatoknak tartalmazniuk kell egy céloszlopot, amely osztály(ok)ba sorolja a szöveget. A többcímkés adatok formátumával kapcsolatos további információkért lásd: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

target_column_name
str

A céloszlop neve.

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

primary_metric
str

A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság

log_verbosity
str

Napló részletességi szintje.

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

A TextClassificationMultilabelJob objektum.

Visszatérési típus

text_ner

TextNerJob-feladat létrehozásához használható függvény.

Az entitásfelismerő feladat nevű szöveg egy olyan modell betanítása, amely képes előrejelezni a névvel ellátott entitásokat a szövegben. A bemeneti betanítási adatoknak CoNLL formátumú szövegfájlnak kell lenniük. A szöveges NER-adatok formátumával kapcsolatos további információkért lásd: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Paraméterek

training_data
Input

A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

validation_data
Input

A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.

primary_metric
str

A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság

log_verbosity
str

Napló részletességi szintje.

kwargs
dict

További konfigurációs paraméterek szótára.

Válaszok

A TextNerJob objektum.

Visszatérési típus