Share via


Adatok előkészítése számítógépes látási feladatokhoz automatizált gépi tanulással

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Fontos

Az Azure Machine Tanulás automatizált gépi tanulási modelljeinek támogatása egy kísérleti nyilvános előzetes verziójú funkció. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik. További információ: Kiegészítő használati feltételek a Microsoft Azure előzetes verziójú termékeihez.

Ebből a cikkből megtudhatja, hogyan készítheti elő a képadatokat a számítógépes látásmodellek betanításához automatizált gépi tanulással az Azure Machine Tanulás.

Ha számítógépes látási feladatokhoz szeretne modelleket létrehozni automatizált gépi tanulással, címkézett képadatokat kell bevinnie a modell betanításához egy MLTable.

A címkézett betanítási adatokból JSONL formátumban hozhat létre MLTable . Ha a címkézett betanítási adatok más formátumban vannak (például pascal VOC vagy COCO), használhat egy konverziós szkriptet , amely először JSONL-be konvertálja, majd létrehoz egy MLTable. Másik lehetőségként az Azure Machine Tanulás adatcímkéző eszközével manuálisan címkézhet képeket, és exportálhatja a címkézett adatokat az AutoML-modell betanításához.

Előfeltételek

Címkézett adatok lekérése

Ahhoz, hogy számítógépes látásmodelleket taníthasson be az AutoML használatával, először címkézett betanítási adatokat kell kapnia. A képeket fel kell tölteni a felhőbe, és a címkék széljegyzeteinek JSONL formátumban kell lenniük. Az Azure Machine Tanulás Data Labeling eszközzel címkézheti meg az adatokat, vagy előre címkézett képadatokkal kezdhet.

Az Azure Machine Tanulás Data Labeling eszköz használata a betanítási adatok címkézéséhez

Ha nem rendelkezik előre megjelölt adatokkal, az Azure Machine Tanulás adatcímkéző eszközével manuálisan címkézhet képeket. Ez az eszköz automatikusan létrehozza a betanításhoz szükséges adatokat az elfogadott formátumban.

Segít az adatcímkézési feladatok létrehozásában, kezelésében és monitorozásában

  • Képbesorolás (többosztályos és többcímke)
  • Objektumészlelés (határolókeret)
  • Példányszegmentáció (sokszög)

Ha már rendelkezik használni kívánt címkézett adatokkal, exportálhatja a címkézett adatokat Azure Machine Tanulás-adathalmazként, majd elérheti az adathalmazt az Azure Machine Tanulás Studióban az "Adathalmazok" lapon. Ez az exportált adatkészlet ezután formátum használatával azureml:<tabulardataset_name>:<version> továbbítható bemenetként. Íme egy példa arra, hogyan továbbíthatja a meglévő adatkészletet bemenetként a számítógépes látásmodellek betanításához.

ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)

training_data:
  path: azureml:odFridgeObjectsTrainingDataset:1
  type: mltable
  mode: direct

Előre címkézett betanítási adatok használata a helyi gépről

Ha olyan adatokat címkézett meg, amelyeket a modell betanítása érdekében szeretne használni, fel kell töltenie a képeket az Azure-ba. A rendszerképeket feltöltheti az Azure Machine Tanulás-munkaterület alapértelmezett Azure Blob Storage-tárhelyére, és regisztrálhatja adategységként.

Az alábbi szkript feltölti a rendszerképadatokat a helyi gépen a "./data/odFridgeObjects" útvonalon az Azure Blob Storage adattárba. Ezután létrehoz egy új adategységet "fridge-items-images-object-detection" néven az Azure Machine Tanulás-munkaterületen.

Ha már létezik "fridge-items-images-object-detection" nevű adategység az Azure Machine Tanulás-munkaterületen, frissíti az adategység verziószámát, és átirányítja az új helyre, ahol a rendszerképadatok fel vannak töltve.

ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)

Hozzon létre egy .yml fájlt az alábbi konfigurációval.

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: fridge-items-images-object-detection
description: Fridge-items images Object detection
path: ./data/odFridgeObjects
type: uri_folder

A képek adategységként való feltöltéséhez futtassa a következő CLI v2 parancsot a .yml fájl elérési útjával, a munkaterület nevével, az erőforráscsoporttal és az előfizetés azonosítójával.

az ml data create -f [PATH_TO_YML_FILE] --workspace-name [YOUR_AZURE_WORKSPACE] --resource-group [YOUR_AZURE_RESOURCE_GROUP] --subscription [YOUR_AZURE_SUBSCRIPTION]

Ha már rendelkezik az adataival egy meglévő adattárban, és egy adategységet szeretne belőle létrehozni, ezt úgy teheti meg, hogy megadja az adattárban lévő adatok elérési útját ahelyett, hogy a helyi gép elérési útját adja meg. Frissítse a fenti kódot a következő kódrészlettel.

ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)

Hozzon létre egy .yml fájlt az alábbi konfigurációval.

$schema: https://azuremlschemas.azureedge.net/latest/data.schema.json
name: fridge-items-images-object-detection
description: Fridge-items images Object detection
path: azureml://subscriptions/<my-subscription-id>/resourcegroups/<my-resource-group>/workspaces/<my-workspace>/datastores/<my-datastore>/paths/<path_to_image_data_folder>
type: uri_folder

Ezután JSONL formátumban kell lekérnie a címkejegyzeteket. A címkézett adatok sémája a számítógépes látási feladattól függ. Az AutoML számítógépes látási kísérleteihez készült JSONL-fájlok sémáiban további információt kaphat az egyes feladattípusokhoz szükséges JSONL-sémákról.

Ha a betanítási adatok más formátumban vannak (például pascal VOC vagy COCO), az adatok JSONL-zé alakítására szolgáló segédszkriptek a jegyzetfüzet-példákban érhetők el.

Miután létrehozta a jsonl-fájlt a fenti lépéseket követve, felhasználói felületen regisztrálhatja azt adategységként. Győződjön meg arról, hogy a sémaszakaszban a típust választja stream az animációban látható módon.

Az adategység jsonl-fájlokból való regisztrálását bemutató animáció

Előre felcímkézett betanítási adatok használata az Azure Blob Storage-ból

Ha a címkézett betanítási adatok egy Azure Blob Storage-tárolóban találhatók, akkor közvetlenül onnan érheti el azokat egy, a tárolóra hivatkozó adattár létrehozásával.

MLTable létrehozása

Miután JSONL formátumban megadta a címkézett adatokat, létrehozhatja azokat MLTable az ebben a yaml-kódrészletben látható módon. Az MLtable egy hasznosítható objektumba csomagolja az adatokat a betanításhoz.

paths:
  - file: ./train_annotations.jsonl
transformations:
  - read_json_lines:
        encoding: utf8
        invalid_lines: error
        include_path_column: false
  - convert_column_types:
      - columns: image_url
        column_type: stream_info

Ezután adatbemenetként továbbíthatja az MLTable AutoML-betanítási feladathoz.

Következő lépések