automl Csomag
Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz.
A fő területek közé tartozik az AutoML-feladatok kezelése.
Osztályok
ClassificationJob |
Az AutoML-besorolási feladat konfigurációja. Új AutoML-besorolási feladat inicializálása. |
ColumnTransformer |
Oszlopátalakító beállításai. |
ForecastingJob |
AutoML-előrejelzési feladat konfigurálása. Új AutoML-előrejelzési feladat inicializálása. |
ForecastingSettings |
AutoML-feladat előrejelzési beállításai. |
ImageClassificationJob |
Az AutoML többosztályos rendszerkép-besorolási feladatának konfigurálása. Inicializáljon egy új AutoML többosztályos rendszerkép-besorolási feladatot. |
ImageClassificationMultilabelJob |
Az AutoML többcímkés képbesorolási feladatának konfigurálása. Inicializáljon egy új, többcímkés AutoML-képbesorolási feladatot. |
ImageClassificationSearchSpace |
Keressen helyet az AutoML-képbesorolási és képbesorolási többcímkés feladatokhoz. |
ImageInstanceSegmentationJob |
Az AutoML-lemezképpéldány szegmentálási feladatának konfigurálása. Új AutoML-lemezképpéldány szegmentálási feladatának inicializálása. |
ImageLimitSettings |
AutoML-kép függőleges beállításainak korlátozása. Az ImageLimitSettings egy osztály, amely a következő paramétereket tartalmazza: max_concurrent_trials, max_trials és timeout_minutes. Ez egy nem kötelező konfigurációs módszer a korlátok paramétereinek( például időtúllépések stb.) konfigurálásához. Megjegyzés Az egyidejű futtatások száma a megadott számítási célban elérhető erőforrásokon van meghatározva. Győződjön meg arról, hogy a számítási cél rendelkezik a kívánt egyidejűséghez elérhető erőforrásokkal. Tipp Ajánlott max_concurrent_trials számát a fürt csomópontjainak számával egyeztetni. Ha például egy fürt 4 csomóponttal rendelkezik, állítsa max_concurrent_trials 4-re. Példahasználat Az ImageLimitSettings konfigurálása
ImageLimitSettings objektum inicializálása. Az ImageLimitSettings konstruktora autoML-kép függőlegesekhez. |
ImageModelSettingsClassification |
Modellbeállítások az AutoML-képbesorolási feladatokhoz. |
ImageModelSettingsObjectDetection |
Az AutoML képobjektum-észlelési feladat modellbeállításai. |
ImageObjectDetectionJob |
Az AutoML-lemezképobjektum-észlelési feladat konfigurációja. Inicializáljon egy új AutoML-képobjektum-észlelési feladatot. |
ImageObjectDetectionSearchSpace |
Keressen helyet az AutoML képobjektum-észlelési és a képpéldány szegmentálási feladataihoz. |
ImageSweepSettings |
Takarítási beállítások az összes AutoML-kép függőlegesen. |
NlpFeaturizationSettings |
Az összes AutoML NLP-függőleges featurizációs beállításai. |
NlpFixedParameters |
Az objektum rögzített paramétereket biztosít az NLP-feladatokhoz. |
NlpLimitSettings |
Az autoML NLP-függőleges beállításainak korlátozása. |
NlpSearchSpace |
Keressen helyet az AutoML NLP-feladatokhoz. |
NlpSweepSettings |
Takarítási beállítások az összes AutoML NLP-feladathoz. |
RegressionJob |
Az AutoML regressziós feladatának konfigurálása. Új AutoML regressziós feladat inicializálása. |
SearchSpace |
SearchSpace osztály AutoML-függőlegesekhez. |
StackEnsembleSettings |
A StackEnsemble-futtatás testreszabásának előzetes beállítása. |
TabularFeaturizationSettings |
AutoML-feladat featurizációs beállításai. |
TabularLimitSettings |
AutoML-táblázat függőleges beállításainak korlátozása. |
TextClassificationJob |
Az AutoML szövegbesorolási feladatának konfigurálása. Inicializál egy új AutoML szövegbesorolási feladatot. |
TextClassificationMultilabelJob |
Az AutoML-szövegbesorolási többcímkés feladat konfigurálása. Inicializál egy új AutoML szövegbesorolási többcímkés feladatot. |
TextNerJob |
Az AutoML Text NER-feladat konfigurációja. Inicializál egy új AutoML Text NER-feladatot. |
TrainingSettings |
TrainingSettings osztály az Azure Machine Learninghez. TrainingSettings osztály az Azure Machine Learninghez. |
Enumerációk
BlockedTransformers |
Enumerálás az AutoML által támogatott összes besorolási modellhez. |
ClassificationModels |
Enumerálás az AutoML által támogatott összes besorolási modellhez. |
ClassificationMultilabelPrimaryMetrics |
Elsődleges metrikák a többcímkés feladatok besorolásához. |
ClassificationPrimaryMetrics |
A besorolási feladatok elsődleges metrikái. |
FeaturizationMode |
Featurizációs mód – az adatok featurálási módját határozza meg. |
ForecastHorizonMode |
Enumerálás az előrejelzési horizont kijelölési módjának meghatározásához. |
ForecastingModels |
Az AutoML által támogatott összes előrejelzési modell enumerálása. |
ForecastingPrimaryMetrics |
Az előrejelzési tevékenység elsődleges metrikái. |
InstanceSegmentationPrimaryMetrics |
Az InstanceSegmentation feladatok elsődleges metrikái. |
LearningRateScheduler |
Tanulási sebességütemező enumerációja. |
LogTrainingMetrics |
Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz. A fő területek közé tartozik az AutoML-feladatok kezelése. |
LogValidationLoss |
Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz. A fő területek közé tartozik az AutoML-feladatok kezelése. |
NCrossValidationsMode |
Meghatározza az N-Cross validations érték meghatározásának módját. |
ObjectDetectionPrimaryMetrics |
Az Image ObjectDetection feladat elsődleges metrikái. |
RegressionModels |
Az AutoML által támogatott összes regressziós modell enumerációja. |
RegressionPrimaryMetrics |
A regressziós feladat elsődleges metrikái. |
SamplingAlgorithmType |
Automatizált gépi tanulási osztályokat tartalmaz az Azure Machine Learning SDKv2-höz. A fő területek közé tartozik az AutoML-feladatok kezelése. |
ShortSeriesHandlingConfiguration |
Az a paraméter, amely meghatározza, hogy az AutoML hogyan kezelje a rövid idősorokat. |
StochasticOptimizer |
Sztochasztikus optimalizáló képmodellekhez. |
TargetAggregationFunction |
Cél aggregátumfüggvény. |
TargetLagsMode |
A célelmaradások kiválasztási módjai. |
TargetRollingWindowSizeMode |
Célgördülő ablakméret mód. |
UseStl |
Konfigurálja az idősor céloszlopának STL-felbontását. |
ValidationMetricType |
Metrikaszámítási módszer a rendszerképfeladatok érvényesítési metrikáihoz. |
Függvények
classification
Függvény a ClassificationJob létrehozásához.
A besorolási feladat egy olyan modell betanítása, amely a legjobban előrejelzi az adatminta osztályát. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki, amely a legjobb teljesítményt nyújtja az érvényesítési adatokon az elsődleges metrika alapján.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a , validation_data
és test_data
paraméterekre vonatkozik training_data
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításáról további információt a következő témakörben talál https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric: .
Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted és precision_score_weighted Alapértelmezett értékek a pontossághoz
- enable_model_explainability
- bool
Engedélyezi-e a legjobb AutoML-modell magyarázatát az autoML betanítási iterációinak végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.
- weight_column_name
- str
A minta súlyozási oszlopának neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, ami az adatok sorainak súlyozását okozza. Ha a bemeneti adatok pandas-ból származnak. A DataFrame nem rendelkezik oszlopnevekkel, az oszlopindexek használhatók egész számként kifejezve.
Ez a paraméter a és validation_data
a paraméterre training_data
vonatkozik
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
Alapértelmezett érték: Nincs
- validation_data_size
- float
A felhasználóérvényesítési adatok meg nem adása esetén az ellenőrzéshez visszatartandó adatok hányada. Ennek 0,0 és 1,0 közöttinek kell lennie, nem inkluzívnak.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, máskülönben beállíthatja n_cross_validations
vagy validation_data_size
kinyerheti az érvényesítési adatokat a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatmegosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations
vagy validation_data_size
az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.
Alapértelmezett érték: Nincs
- test_data
- Input
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ha ez a paraméter vagy a test_data_size
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is.
Ha test_data
meg van adva, meg kell adni a target_column_name
paramétert.
Alapértelmezett érték: Nincs
- test_data_size
- float
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Ha test_data_size
a paramétert a () értékével egy időben validation_data_size
adja meg, akkor a tesztadatok felosztása training_data
az érvényesítési adatok felosztása előtt történik.
Ha például a validation_data_size=0.1
, test_data_size=0.1
és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.
Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.
Ha ez a paraméter vagy a test_data
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
Alapértelmezett érték: Nincs
Válaszok
Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.
Visszatérési típus
forecasting
Függvény előrejelzési feladat létrehozásához.
Az előrejelzési feladat a jövőbeli időszakra vonatkozó célértékek előrejelzésére szolgál az előzményadatok alapján. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki, amely a legjobb teljesítményt nyújtja az érvényesítési adatokon az elsődleges metrika alapján.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
test_data
a paraméterekre training_data
vonatkozik
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error Alapértelmezett értékek normalized_root_mean_squared_error
- enable_model_explainability
- bool
A legjobb AutoML-modell magyarázatának engedélyezése az AutoML-betanítási iterációk végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.
- weight_column_name
- str
A mintasúly oszlop neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, így az adatok sorai felfelé vagy lefelé lesznek súlyozottak. Ha a bemeneti adatok pandasból származnak. Az oszlopnevekkel nem rendelkező DataFrame helyett az oszlopindexek használhatók egész számként kifejezve.
Ez a paraméter a és validation_data
a paraméterekre training_data
alkalmazható
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
Alapértelmezett érték: Nincs
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations
vagy validation_data_size
az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations
vagy validation_data_size
az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.
Alapértelmezett érték: Nincs
- test_data
- Input
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ha ez a paraméter vagy a test_data_size
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is.
Ha test_data
meg van adva, meg kell adni a target_column_name
paramétert.
Alapértelmezett érték: Nincs
- test_data_size
- float
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Ha test_data_size
a paramétert a () értékével egy időben validation_data_size
adja meg, akkor a tesztadatok felosztása training_data
az érvényesítési adatok felosztása előtt történik.
Ha például a validation_data_size=0.1
, test_data_size=0.1
és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.
Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.
Ha ez a paraméter vagy a test_data
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
Alapértelmezett érték: Nincs
- forecasting_settings
- ForecastingSettings
Az előrejelzési feladat beállításai
Válaszok
Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.
Visszatérési típus
image_classification
Létrehoz egy objektumot az AutoML-rendszerkép többosztályos besorolási feladatához.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok.
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
a paraméterekre training_data
vonatkozik.
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted és precision_score_weighted Alapértelmezett értékek a pontosság érdekében.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok.
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Adja meg validation_data
, hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size
, hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.
Alapértelmezett érték: .2
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
Képbesorolási feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.
Visszatérési típus
image_classification_multilabel
Létrehoz egy objektumot az AutoML-rendszerkép többcímkés besorolási feladatához.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok.
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
a paraméterekre training_data
vonatkozik.
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: pontosság, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted és Iou Defaults to Iou.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok.
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Adja meg validation_data
, hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size
, hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.
Alapértelmezett érték: .2
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
Kép többcímkés besorolási feladatobjektum, amely végrehajtás céljából elküldhető egy Azure ML-számításba.
Visszatérési típus
image_instance_segmentation
Létrehoz egy objektumot az AutoML-lemezképpéldány szegmentálási feladatához.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok.
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
a paraméterekre training_data
vonatkozik.
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok.
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Adja meg validation_data
, hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size
, hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.
Alapértelmezett érték: .2
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
Képpéldány szegmentálási feladata
Visszatérési típus
image_object_detection
Létrehoz egy objektumot az AutoML-rendszerképobjektum-észlelési feladathoz.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok.
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
a paraméterekre training_data
vonatkozik.
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok.
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Adja meg validation_data
, hogy érvényesítési adatokat adjon meg, máskülönben úgy van beállítva validation_data_size
, hogy kinyerje az érvényesítési adatokat a megadott betanítási adatokból.
Alapértelmezett érték: .2
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
Képobjektum-észlelési feladatobjektum, amely végrehajtás céljából elküldhető egy Azure ML-számításba.
Visszatérési típus
regression
Regressziós feladat létrehozásához.
A regressziós feladat egy modell betanítására szolgál egy adathalmazból származó célváltozó folyamatos értékeinek előrejelzésére. A betanítási adatokkal különböző modelleket tanítunk be. Végső modellként azt a modellt választja ki a rendszer, amely az elsődleges metrika alapján a legjobb teljesítményt nyújtja az érvényesítési adatokon.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
- target_column_name
- str
A címkeoszlop neve.
Ez a paraméter a és validation_data
test_data
a paraméterekre training_data
vonatkozik
- primary_metric
Az automatizált gépi tanulás által a modell kiválasztására optimalizált metrika. Az automatizált gépi tanulás több metrikát gyűjt, mint amennyit optimalizálni tud. A metrikák kiszámításával kapcsolatos további információkért lásd: https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Elfogadható értékek: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Alapértelmezés szerint normalized_root_mean_squared_error
- enable_model_explainability
- bool
A legjobb AutoML-modell magyarázatának engedélyezése az AutoML-betanítási iterációk végén. Az alapértelmezett érték a Nincs. További információ : Értelmezhetőség: modellmagyarázatok az automatizált gépi tanulásban.
- weight_column_name
- str
A mintasúly oszlop neve. Az automatizált gépi tanulás bemenetként támogatja a súlyozott oszlopokat, így az adatok sorai felfelé vagy lefelé lesznek súlyozottak. Ha a bemeneti adatok pandasból származnak. Az oszlopnevekkel nem rendelkező DataFrame helyett az oszlopindexek használhatók egész számként kifejezve.
Ez a paraméter a és validation_data
a paraméterekre training_data
alkalmazható
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a címkeoszlopot is (opcionálisan egy minta súlyozási oszlopot).
Alapértelmezett érték: Nincs
- validation_data_size
- float
A felhasználói érvényesítési adatok megadásakor az ellenőrzéshez visszatartandó adatok hány része van megadva. Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations
vagy validation_data_size
az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Hány keresztérvényesítést kell végrehajtani, ha a felhasználói érvényesítési adatok nincsenek megadva.
Itt adhatja meg validation_data
az érvényesítési adatok megadását, egyéb módon történő beállítását n_cross_validations
vagy validation_data_size
az érvényesítési adatok kinyerésének módját a megadott betanítási adatokból.
Az egyéni keresztérvényesítési hajtáshoz használja a következőt cv_split_column_names
: .
További információ: Adatfelosztások és keresztérvényesítés konfigurálása automatizált gépi tanulásban.
Alapértelmezett érték: Nincs
Az egyéni keresztérvényesítési felosztást tartalmazó oszlopok nevének listája. Az önéletrajz felosztási oszlopai egy cv felosztást jelölnek, ahol az egyes sorok 1-et jelölnek betanításra, vagy 0-t az ellenőrzéshez.
Alapértelmezett érték: Nincs
- test_data
- Input
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A tesztfuttatáshoz használandó tesztadatok automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ha ez a paraméter vagy a test_data_size
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
A tesztadatoknak tartalmazniuk kell a funkciókat és a címkeoszlopot is.
Ha test_data
meg van adva, meg kell adni a target_column_name
paramétert.
Alapértelmezett érték: Nincs
- test_data_size
- float
A Modellteszt szolgáltatás tesztadatkészletek vagy tesztadatok felosztása egy előzetes verziójú funkció, amely bármikor változhat. A betanítási adatok hány része legyen visszatartva egy tesztfuttatás tesztadataihoz, amelyek automatikusan elindulnak a modell betanítása után. A tesztfuttatás a legjobb modellel fog előrejelzéseket kapni, és az előrejelzések alapján kiszámítja a metrikákat.
Ennek 0,0 és 1,0 közöttinek kell lennie, nem beleértve azokat.
Ha test_data_size
a paramétert a () értékével egy időben validation_data_size
adja meg, akkor a tesztadatok felosztása training_data
az érvényesítési adatok felosztása előtt történik.
Ha például a validation_data_size=0.1
, test_data_size=0.1
és az eredeti betanítási adatok 1000 sort tartalmaznak, akkor a tesztadatok 100 sorból állnak, az érvényesítési adatok 90 sort, a betanítási adatok pedig 810 sort tartalmaznak.
Regresszióalapú feladatokhoz véletlenszerű mintavételezést használunk. Besorolási feladatokhoz rétegzett mintavételezést használunk. Az előrejelzés jelenleg nem támogatja a tesztadatkészletek betanítási/tesztelési felosztással történő megadását.
Ha ez a paraméter vagy a test_data
paraméter nincs megadva, akkor a modell betanítása után a rendszer nem hajtja végre automatikusan a tesztfuttatást.
Alapértelmezett érték: Nincs
Válaszok
Feladatobjektum, amely elküldhető egy Azure ML-számításba végrehajtás céljából.
Visszatérési típus
text_classification
TextClassificationJob létrehozásához használható függvény.
A szövegbesorolási feladat egy olyan modell betanítása, amely képes előrejelezni a szöveges adatok osztályát/kategóriáját. A bemeneti betanítási adatoknak tartalmazniuk kell egy céloszlopot, amely pontosan egy osztályba sorolja a szöveget.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- target_column_name
- str
A céloszlop neve.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Napló részletességi szintje.
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
A TextClassificationJob objektum.
Visszatérési típus
text_classification_multilabel
TextClassificationMultilabelJob létrehozásához használható függvény.
A szövegbesorolási többcímkés feladat egy olyan modell betanítása, amely képes előrejelezni a szöveges adatok osztályait/kategóriáit. A bemeneti betanítási adatoknak tartalmazniuk kell egy céloszlopot, amely osztály(ok)ba sorolja a szöveget. A többcímkés adatok formátumával kapcsolatos további információkért lásd: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- target_column_name
- str
A céloszlop neve.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- primary_metric
- str
A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság
- log_verbosity
- str
Napló részletességi szintje.
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
A TextClassificationMultilabelJob objektum.
Visszatérési típus
text_ner
TextNerJob-feladat létrehozásához használható függvény.
Az entitásfelismerő feladat nevű szöveg egy olyan modell betanítása, amely képes előrejelezni a névvel ellátott entitásokat a szövegben. A bemeneti betanítási adatoknak CoNLL formátumú szövegfájlnak kell lenniük. A szöveges NER-adatok formátumával kapcsolatos további információkért lásd: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Paraméterek
- training_data
- Input
A kísérletben használandó betanítási adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- validation_data
- Input
A kísérletben használandó érvényesítési adatok. Tartalmaznia kell a betanítási funkciókat és a céloszlopot is.
- primary_metric
- str
A tevékenység elsődleges metrikája. Elfogadható értékek: pontosság
- log_verbosity
- str
Napló részletességi szintje.
- kwargs
- dict
További konfigurációs paraméterek szótára.
Válaszok
A TextNerJob objektum.
Visszatérési típus
Azure SDK for Python
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: