Share via


Hiperparaméterek számítógépes látási feladatokhoz az automatizált gépi tanulásban

A KÖVETKEZŐKRE VONATKOZIK:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Megtudhatja, hogy mely hiperparaméterek érhetők el kifejezetten számítógépes látástechnológiai feladatokhoz automatizált gépi tanulási kísérletekben.

A számítógépes látástechnológiai feladatok támogatásával vezérelheti a modellarchitektúrát, és átveheti a hiperparamétereket. Ezek a modellarchitektúrák és hiperparaméterek a takarítás paraméterterületeként lesznek átadva. Bár a közzétett hiperparaméterek közül sok modellfüggetlen, vannak olyan példányok, ahol a hiperparaméterek modellspecifikusak vagy feladatspecifikusak.

Modellspecifikus hiperparaméterek

Ez a táblázat az architektúrára yolov5 jellemző hiperparamétereket foglalja össze.

Paraméter neve Leírás Alapértelmezett
validation_metric_type Az érvényesítési metrikákhoz használandó metrikaszámítási módszer.
A lehet none, coco, vocvagy coco_voc.
voc
validation_iou_threshold Az érvényesítési metrikák kiszámításakor a dobozegyezés IOU-küszöbértéke.
A(z) [0.1, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,5
image_size Képméret betanítása és érvényesítése céljából.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
640
model_size Modell mérete.
A lehet small, medium, largevagy extra_large.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a modell mérete túl nagy.
medium
multi_scale Több léptékű rendszerkép engedélyezése a kép méretének +/- 50%- kal történő változásával
0-nak vagy 1-nek kell lennie.

Megjegyzés: A betanítási futtatás akkor kerülhet be a CUDA OOM-ba, ha nincs elegendő GPU-memória.
0
box_score_threshold A következtetés során csak olyan javaslatokat ad vissza, amelyek pontszáma nagyobb, mint box_score_threshold. A pontszám az objektumérték és a besorolási valószínűség szorzása.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0.1
nms_iou_threshold A dedukció során használt IOU-küszöbérték a feldolgozást követő, nem maximális mellőzés esetén.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,5
tile_grid_size Az egyes képek burkolásához használandó rácsméret.
Megjegyzés: tile_grid_size nem lehet Nincs a kis objektumészlelési logika engedélyezéséhez
Sztringként "3x2" formátumban kell átadni. Példa: --tile_grid_size '3x2'
Nincs alapértelmezett
tile_overlap_ratio Átfedési arány az egyes dimenziók szomszédos csempéi között.
A lebegtetésnek [0, 1) tartományban kell lennie
0,25
tile_predictions_nms_threshold Az NMS végrehajtásához használandó IOU-küszöbérték csempékből és képekből származó előrejelzések egyesítése során. Az ellenőrzéshez/következtetéshez használatos.
A lebegtetésnek [0, 1] tartományban kell lennie
0,25

Ez a táblázat a példányszegmentációra jellemző hiperparamétereket foglalja össze a maskrcnn_* következtetés során.

Paraméter neve Leírás Alapértelmezett
mask_pixel_score_threshold Pontkivágás egy képpontnak az objektum maszkjának részeként történő figyelembe vételéhez. 0,5
max_number_of_polygon_points Az (x, y) koordinátapárok maximális száma sokszögben a maszkból való átalakítás után. 100
export_as_image Maszkok exportálása képként. Hamis
image_type A maszkot exportálni kívánt kép típusa (a beállítások jpg, png, bmp). JPG

Modellfüggetlen hiperparaméterek

Az alábbi táblázat a modellfüggetlen hiperparamétereket ismerteti.

Paraméter neve Leírás Alapértelmezett
number_of_epochs A betanítási alapidőszakok száma.
Pozitív egész számnak kell lennie.
15
(kivéve yolov5: 30)
training_batch_size Betanítási köteg mérete.
Pozitív egész számnak kell lennie.
Többosztályos/többcímkés: 78
(a vit-variánsok kivételével:
vits16r224: 128
vitb16r224: 48
vitl16r224:10)

Objektumészlelés: 2
(kivéve yolov5: 16)

Példányszegmentálás: 2

Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
validation_batch_size Érvényesítési köteg mérete.
Pozitív egész számnak kell lennie.
Többosztályos/többcímkés: 78
(a vit-variánsok kivételével:
vits16r224: 128
vitb16r224: 48
vitl16r224:10)

Objektumészlelés: 1
(kivéve yolov5: 16)

Példányszegmentálás: 1

Megjegyzés: Az alapértelmezett érték a legnagyobb kötegméret, amely 12 GiB GPU-memórián használható.
gradient_accumulation_step A színátmenetek felhalmozódása gradient_accumulation_step azt jelenti, hogy a modell súlyainak frissítése nélkül futtat egy konfigurált számot, miközben a lépések színátmeneteit gyűjti össze, majd a halmozott színátmenetek használatával kiszámítja a súlyfrissítéseket.
Pozitív egész számnak kell lennie.
1
early_stopping Korai leállítási logika engedélyezése a betanítás során.
0-nak vagy 1-nek kell lennie.
1
early_stopping_patience Alapidőszakok vagy érvényesítési értékelések minimális száma a következővel:
nincs elsődleges metrikafejlesztés a futtatás leállítása előtt.
Pozitív egész számnak kell lennie.
5
early_stopping_delay A várakozáshoz szükséges alapidőszakok vagy érvényesítési értékelések minimális száma
az elsődleges metrika javításának nyomon követése előtt a korai leállítás érdekében.
Pozitív egész számnak kell lennie.
5
learning_rate Kezdeti tanulási arány.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
Többosztályos: 0,01
(a vit-variánsok kivételével:
vits16r224: 0.0125
vitb16r224: 0.0125
vitl16r224: 0.001)

Többcímke: 0,035
(a vit-variánsok kivételével:
vits16r224: 0.025
vitb16r224: 0.025
vitl16r224: 0.002)

Objektumészlelés: 0.005
(kivéve yolov5: 0,01)

Példányszegmentálás: 0,005
learning_rate_scheduler A tanulási sebességütemező típusa.
A vagy stepa lehetwarmup_cosine.
warmup_cosine
step_lr_gamma A gamma értéke, ha a tanulási sebességütemező értéke step.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,5
step_lr_step_size A lépésméret értéke, ha a tanulási sebességütemező értéke step.
Pozitív egész számnak kell lennie.
5
warmup_cosine_lr_cycles A koszinuszciklus értéke, ha a tanulási sebességütemező értéke warmup_cosine.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,45
warmup_cosine_lr_warmup_epochs A bemelegítési alapidőszakok értéke, ha a tanulási sebességütemező értéke warmup_cosine.
Pozitív egész számnak kell lennie.
2
optimizer Az optimalizáló típusa.
Vagy , , adamadamwvagy lehetsgd.
sgd
momentum A lendület értéke, ha az optimalizáló értéke sgd.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,9
weight_decay A súlyromlás értéke, ha az optimalizáló értéke sgd, adamvagy adamw.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
1e-4
nesterov Akkor engedélyezzenesterov, ha az optimalizáló .sgd
0-nak vagy 1-nek kell lennie.
1
beta1 Az érték, beta1 ha az optimalizáló vagy adamadamw.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0,9
beta2 Az érték, beta2 ha az optimalizáló vagy adamadamw.
A(z) [0, 1] tartományban lebegő lebegőpontosnak kell lennie.
0.999
ams_gradient Engedélyezze ams_gradient , ha az optimalizáló vagy adamadamw.
0-nak vagy 1-nek kell lennie.
0
evaluation_frequency Az érvényesítési adatkészlet kiértékelésének gyakorisága a metrikapontszámok lekéréséhez.
Pozitív egész számnak kell lennie.
1
checkpoint_frequency A modell ellenőrzőpontjainak tárolási gyakorisága.
Pozitív egész számnak kell lennie.
Ellenőrzőpont az alapidőszakban az ellenőrzéshez legjobb elsődleges metrikával.
checkpoint_run_id A növekményes betanításhoz előre betanított ellenőrzőponttal rendelkező kísérlet futtatási azonosítója. nincs alapértelmezett
layers_to_freeze Hány réteget kell rögzíteni a modellhez. Ha például a 2 értéket seresnext a 0. réteg és az 1. réteg zárolását jelenti, az alábbi támogatott modellréteg-adatokra hivatkozik.
Pozitív egész számnak kell lennie.

- 'resnet': [('conv1.', 'bn1.'), 'layer1.', 'layer2.', 'layer3.', 'layer4.']
- 'mobilenetv2': ['features.0.', 'features.1.', 'features.2.', 'features.3.', 'features.4.', 'features.5.', 'features.6.', 'features.7.', 'features.8.', 'features.9.', 'features.10.', 'features.11.', 'features.12.', 'features.13.', 'features.14.', 'features.15.', 'features.16.', 'features.17.', 'features.18.']
- 'seresnext': ['layer0.', 'layer1.', 'layer2.', 'layer3.', 'layer4.'] * 'vit': ['patch_embed', 'blocks.0.', 'blocks.1.', 'blocks.2.', 'blocks.3.', 'blocks.4.', 'blocks.5.', 'blocks.6.','blocks.7.', 'blocks.8.', 'blocks.9.', 'blocks.10.', 'blocks.11.'] * 'yolov5_backbone': ['model.0.', 'model.1.', 'model.2.', 'model.3.', 'model.4.','model.5.', 'model.6.', 'model.7.', 'model.8.', 'model.9.']
- 'resnet_backbone': ['backbone.body.conv1.', 'backbone.body.layer1.', 'backbone.body.layer2.','backbone.body.layer3.', 'backbone.body.layer4.']
nincs alapértelmezett

Képbesorolás (többosztályos és többcímkés) specifikus hiperparaméterek

Az alábbi táblázat a képosztályozási (többosztályos és többcímkés) feladatok hiperparmétereit foglalja össze.

Paraméter neve Leírás Alapértelmezett
model_name A képbesorolási feladathoz használandó modellnév.

A következők egyikének mobilenetv2kell lennie: , resnet34resnet18, resnet50, resnet101, , resnet152, resnest50, vits16r224seresnextresnest101, , . vitl16r224vitb16r224
seresnext
weighted_loss - 0 súlyozás nélkül.
- 1 súlyozott veszteség sqrt. (class_weights)
- 2 a súlyozott veszteség class_weights.
- 0 vagy 1 vagy 2 lehet.
0
validation_resize_size – Képméret, amelyre az érvényesítési adathalmaz körülvágása előtt átméretezendő.
- Pozitív egész számnak kell lennie.

Megjegyzések:
- seresnext nem vesz fel tetszőleges méretet.
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
256
validation_crop_size – Képvágás mérete, amely a neurális hálózatba van beállítva az érvényesítési adatkészlethez.
- Pozitív egész számnak kell lennie.

Megjegyzések:
- seresnext nem vesz fel tetszőleges méretet.
- A ViT-variánsoknak azonosnak validation_crop_sizetraining_crop_sizeés .
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
224
training_crop_size – Képvágási méret, amely a neurális hálózat bemenete az adathalmaz betanításához.
- Pozitív egész számnak kell lennie.

Megjegyzések:
- seresnext nem vesz fel tetszőleges méretet.
- A ViT-variánsoknak azonosnak validation_crop_sizetraining_crop_sizeés .
- A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy
.
224

Objektumészlelés és példányszegmentálási feladatspecifikus hiperparaméterek

Az alábbi hiperparaméterek objektumészlelési és példányszegmentálási feladatokhoz használhatók.

Figyelmeztetés

Ezeket a paramétereket az architektúra nem támogatja yolov5 . A támogatott hiperparméterekért yolov5 tekintse meg a modellspecifikus hiperparaméterek szakaszt.

Paraméter neve Leírás Alapértelmezett
model_name A képbesorolási feladathoz használandó modellnév.
- Objektumészlelési feladat esetén a , , fasterrcnn_resnet18_fpn, fasterrcnn_resnet34_fpn, retinanet_resnet50_fpnfasterrcnn_resnet152_fpnfasterrcnn_resnet101_fpnfasterrcnn_resnet50_fpnegyikének yolov5kell lennie.
– Például a szegmentálási feladatnak az egyiknek maskrcnn_resnet18_fpnkell lennie, maskrcnn_resnet34_fpn, , , maskrcnn_resnet50_fpn, maskrcnn_resnet101_fpnmaskrcnn_resnet152_fpn
– Objektumészlelési feladat esetén: fasterrcnn_resnet50_fpn
– Példányszegmentálási feladat esetén: maskrcnn_resnet50_fpn
validation_metric_type Az érvényesítési metrikákhoz használható metrikaszámítási módszer.
A lehet none, coco, vocvagy coco_voc.
voc
validation_iou_threshold A dobozegyeztetés IOU-küszöbértéke az érvényesítési metrikák kiszámításakor.
A(z) [0,1, 1] tartományban lebegőpontosnak kell lennie.
0,5
min_size Az újraskálázandó kép minimális mérete, mielőtt betáplálnák a gerinchez.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
600
max_size Az újraskálázandó kép maximális mérete, mielőtt betáplálta volna a gerinchez.
Pozitív egész számnak kell lennie.

Megjegyzés: A betanítási futtatás a CUDA OOM-ba kerülhet, ha a méret túl nagy.
1333
box_score_threshold A következtetés során csak olyan javaslatokat ad vissza, amelyek besorolási pontszáma nagyobb, mint box_score_threshold.
A(z) [0, 1] tartományban lebegőpontosnak kell lennie.
0.3
nms_iou_threshold Az előrejelzési fejhez a nem maximális elnyomásban (NMS) használt IOU-küszöbérték (union over union) küszöbértéke. A következtetés során használatos.
A(z) [0, 1] tartományban lebegőpontosnak kell lennie.
0,5
box_detections_per_image Az észlelések maximális száma képenként az összes osztály esetében.
Pozitív egész számnak kell lennie.
100
tile_grid_size Az egyes képek burkolásához használandó rácsméret.
- tile_grid_size A kis objektumészlelési logika engedélyezéséhez nem lehet Nincs.
- tile_grid_size a példányszegmentálási feladatok esetében nem támogatott.
"3x2" formátumú sztringként kell átadni. Példa: --tile_grid_size '3x2'
Nincs alapértelmezett
tile_overlap_ratio Átfedési arány a szomszédos csempék között az egyes dimenziókban.
A(z) [0, 1) tartományban kell lebegnie
0,25
tile_predictions_nms_threshold Az NMS végrehajtásához használandó IOU-küszöbérték a csempék és a rendszerképek előrejelzéseinek egyesítése során. Ellenőrzéshez/ következtetéshez használatos.
A(z) [0, 1] tartományban kell lebegnie
0,25

Következő lépések