Migrera ett Custom Vision-projekt till förhandsgranskning av bildanalys 4.0

Artikel
01/23/2024

Du kan migrera ett befintligt Azure AI Custom Vision-projekt till det nya Image Analysis 4.0-systemet. Custom Vision är en modellanpassningstjänst som fanns före bildanalys 4.0.

Den här guiden använder Python-kod för att ta alla träningsdata från ett befintligt Custom Vision-projekt (bilder och deras etikettdata) och konvertera dem till en COCO-fil. Du kan sedan importera COCO-filen till Vision Studio för att träna en anpassad bildanalysmodell. Se Skapa och träna en anpassad modell och gå till avsnittet om att importera en COCO-fil – du kan följa guiden därifrån till slutet.

Förutsättningar

En Azure-prenumeration – Skapa en kostnadsfritt
Python 3.x
En Custom Vision-resurs där ett befintligt projekt lagras.
En Azure Storage-resurs – Skapa en

Jupyter Notebook
Python

Den här notebook-filen exporterar dina bilddata och anteckningar från arbetsytan i ett Custom Vision Service-projekt till din egen COCO-fil i en lagringsblob, redo för träning med anpassning av bildanalysmodell. Du kan köra koden i det här avsnittet med ett anpassat Python-skript, eller så kan du ladda ned och köra notebook-filen på en kompatibel plattform.

Dricks

Innehållet i export_cvs_data_to_blob_storage.ipynb. Öppna i GitHub.

Installera python-exempelpaketet

Kör följande kommando för att installera det nödvändiga python-exempelpaketet:

pip install cognitive-service-vision-model-customization-python-samples

Autentisering

Ange sedan autentiseringsuppgifterna för ditt Custom Vision-projekt och din bloblagringscontainer.

Du måste fylla i rätt parametervärden. Du behöver följande information:

Namnet på det Azure Storage-konto som du vill använda med ditt nya anpassade modellprojekt
Nyckeln för lagringskontot
Namnet på containern som du vill använda i lagringskontot
Din Träningsnyckel för Custom Vision
Url för Din Custom Vision-slutpunkt
Projekt-ID för ditt Custom Vision-projekt

Autentiseringsuppgifterna för Azure Storage finns på den resursens sida i Azure-portalen. Custom Vision-autentiseringsuppgifterna finns på sidan för Custom Vision-projektinställningar på Custom Vision-webbportalen.

azure_storage_account_name = ''
azure_storage_account_key = ''
azure_storage_container_name = ''

custom_vision_training_key = ''
custom_vision_endpoint = ''
custom_vision_project_id = ''

Köra migreringen

När du kör migreringskoden sparas Custom Vision-träningsavbildningarna i en {project_name}_{project_id}/images mapp i din angivna Azure Blob Storage-container och COCO-filen sparas {project_name}_{project_id}/train.json i samma container. Både taggade och otaggade bilder exporteras, inklusive negativa bilder.

Viktigt!

Anpassning av bildanalysmodell stöder för närvarande inte klassificeringsträning med flera etiketter. Köp du kan fortfarande exportera data från ett Custom Vision-klassificeringsprojekt för flera etiketter.

from cognitive_service_vision_model_customization_python_samples import export_data
import logging
logging.getLogger().setLevel(logging.INFO) 
logging.getLogger('azure.core.pipeline.policies.http_logging_policy').setLevel(logging.WARNING)

n_process = 8
export_data(azure_storage_account_name, azure_storage_account_key, azure_storage_container_name, custom_vision_endpoint, custom_vision_training_key, custom_vision_project_id, n_process)

Installera bibliotek

Det här skriptet kräver vissa Python-bibliotek. Installera dem i projektkatalogen med följande kommando.

pip install azure-storage-blob azure-cognitiveservices-vision-customvision cffi

Förbereda migreringsskriptet

Skapa en ny Python-fil – export-cvs-data-to-coco.py till exempel. Öppna den sedan i en textredigerare och klistra in följande innehåll.

from typing import List, Union
from azure.cognitiveservices.vision.customvision.training import CustomVisionTrainingClient
from azure.cognitiveservices.vision.customvision.training.models import Image, ImageTag, ImageRegion, Project
from msrest.authentication import ApiKeyCredentials
import argparse
import time
import json
import pathlib
import logging
from azure.storage.blob import ContainerClient, BlobClient
import multiprocessing


N_PROCESS = 8


def get_file_name(sub_folder, image_id):
    return f'{sub_folder}/images/{image_id}'


def blob_copy(params):
    container_client, sub_folder, image = params
    blob_client: BlobClient = container_client.get_blob_client(get_file_name(sub_folder, image.id))
    blob_client.start_copy_from_url(image.original_image_uri)
    return blob_client


def wait_for_completion(blobs, time_out=5):
    pendings = blobs
    time_break = 0.5
    while pendings and time_out > 0:
        pendings = [b for b in pendings if b.get_blob_properties().copy.status == 'pending']
        if pendings:
            logging.info(f'{len(pendings)} pending copies. wait for {time_break} seconds.')
            time.sleep(time_break)
            time_out -= time_break


def copy_images_with_retry(pool, container_client, sub_folder, images: List, batch_id, n_retries=5):
    retry_limit = n_retries
    urls = []
    while images and n_retries > 0:
        params = [(container_client, sub_folder, image) for image in images]
        img_and_blobs = zip(images, pool.map(blob_copy, params))
        logging.info(f'Batch {batch_id}: Copied {len(images)} images.')
        urls = urls or [b.url for _, b in img_and_blobs]

        wait_for_completion([b for _, b in img_and_blobs])
        images = [image for image, b in img_and_blobs if b.get_blob_properties().copy.status in ['failed', 'aborted']]
        n_retries -= 1
        if images:
            time.sleep(0.5 * (retry_limit - n_retries))

    if images:
        raise RuntimeError(f'Copy failed for some images in batch {batch_id}')

    return urls


class CocoOperator:
    def __init__(self):
        self._images = []
        self._annotations = []
        self._categories = []
        self._category_name_to_id = {}

    @property
    def num_imges(self):
        return len(self._images)

    @property
    def num_categories(self):
        return len(self._categories)

    @property
    def num_annotations(self):
        return len(self._annotations)

    def add_image(self, width, height, coco_url, file_name):
        self._images.append(
            {
                'id': len(self._images) + 1,
                'width': width,
                'height': height,
                'coco_url': coco_url,
                'file_name': file_name,
            })

    def add_annotation(self, image_id, category_id_or_name: Union[int, str], bbox: List[float] = None):
        self._annotations.append({
            'id': len(self._annotations) + 1,
            'image_id': image_id,
            'category_id': category_id_or_name if isinstance(category_id_or_name, int) else self._category_name_to_id[category_id_or_name]})

        if bbox:
            self._annotations[-1]['bbox'] = bbox

    def add_category(self, name):
        self._categories.append({
            'id': len(self._categories) + 1,
            'name': name
        })

        self._category_name_to_id[name] = len(self._categories)

    def to_json(self) -> str:
        coco_dict = {
            'images': self._images,
            'categories': self._categories,
            'annotations': self._annotations,
        }

        return json.dumps(coco_dict, ensure_ascii=False, indent=2)


def log_project_info(training_client: CustomVisionTrainingClient, project_id):
    project: Project = training_client.get_project(project_id)
    proj_settings = project.settings
    project.settings = None
    logging.info(f'Project info dict: {project.__dict__}')
    logging.info(f'Project setting dict: {proj_settings.__dict__}')
    logging.info(f'Project info: n tags: {len(training_client.get_tags(project_id))},'
                 f' n images: {training_client.get_image_count(project_id)} (tagged: {training_client.get_tagged_image_count(project_id)},'
                 f' untagged: {training_client.get_untagged_image_count(project_id)})')


def export_data(azure_storage_account_name, azure_storage_key, azure_storage_container_name, custom_vision_endpoint, custom_vision_training_key, custom_vision_project_id, n_process):
    azure_storage_account_url = f"https://{azure_storage_account_name}.blob.core.windows.net"
    container_client = ContainerClient(azure_storage_account_url, azure_storage_container_name, credential=azure_storage_key)
    credentials = ApiKeyCredentials(in_headers={"Training-key": custom_vision_training_key})
    trainer = CustomVisionTrainingClient(custom_vision_endpoint, credentials)

    coco_operator = CocoOperator()
    for tag in trainer.get_tags(custom_vision_project_id):
        coco_operator.add_category(tag.name)

    skip = 0
    batch_id = 0
    project_name = trainer.get_project(custom_vision_project_id).name
    log_project_info(trainer, custom_vision_project_id)
    sub_folder = f'{project_name}_{custom_vision_project_id}'
    with multiprocessing.Pool(n_process) as pool:
        while True:
            images: List[Image] = trainer.get_images(project_id=custom_vision_project_id, skip=skip)
            if not images:
                break
            urls = copy_images_with_retry(pool, container_client, sub_folder, images, batch_id)
            for i, image in enumerate(images):
                coco_operator.add_image(image.width, image.height, urls[i], get_file_name(sub_folder, image.id))
                image_tags: List[ImageTag] = image.tags
                image_regions: List[ImageRegion] = image.regions
                if image_regions:
                    for img_region in image_regions:
                        coco_operator.add_annotation(coco_operator.num_imges, img_region.tag_name, [img_region.left, img_region.top, img_region.width, img_region.height])
                elif image_tags:
                    for img_tag in image_tags:
                        coco_operator.add_annotation(coco_operator.num_imges, img_tag.tag_name)

            skip += len(images)
            batch_id += 1

    coco_json_file_name = 'train.json'
    local_json = pathlib.Path(coco_json_file_name)
    local_json.write_text(coco_operator.to_json(), encoding='utf-8')
    coco_json_blob_client: BlobClient = container_client.get_blob_client(f'{sub_folder}/{coco_json_file_name}')
    if coco_json_blob_client.exists():
        logging.warning(f'coco json file exists in blob. Skipped uploading. If existing one is outdated, please manually upload your new coco json from ./train.json to {coco_json_blob_client.url}')
    else:
        coco_json_blob_client.upload_blob(local_json.read_bytes())
        logging.info(f'coco file train.json uploaded to {coco_json_blob_client.url}.')


def parse_args():
    parser = argparse.ArgumentParser('Export Custom Vision workspace data to blob storage.')

    parser.add_argument('--custom_vision_project_id', '-p', type=str, required=True, help='Custom Vision Project Id.')
    parser.add_argument('--custom_vision_training_key', '-k', type=str, required=True, help='Custom Vision training key.')
    parser.add_argument('--custom_vision_endpoint', '-e', type=str, required=True, help='Custom Vision endpoint.')

    parser.add_argument('--azure_storage_account_name', '-a', type=str, required=True, help='Azure storage account name.')
    parser.add_argument('--azure_storage_account_key', '-t', type=str, required=True, help='Azure storage account key.')
    parser.add_argument('--azure_storage_container_name', '-c', type=str, required=True, help='Azure storage container name.')

    parser.add_argument('--n_process', '-n', type=int, required=False, default=8, help='Number of processes used in exporting data.')

    return parser.parse_args()


def main():
    args = parse_args()

    export_data(args.azure_storage_account_name, args.azure_storage_account_key, args.azure_storage_container_name,
                args.custom_vision_endpoint, args.custom_vision_training_key, args.custom_vision_project_id, args.n_process)


if __name__ == '__main__':
    main()

Kör skriptet

Kör skriptet med kommandot python .

python export-cvs-data-to-coco.py -p <project ID> -k <training key> -e <endpoint url> -a <storage account> -t <storage key> -c <container name>

Du måste fylla i rätt parametervärden. Du behöver följande information:

Projekt-ID för ditt Custom Vision-projekt
Din Träningsnyckel för Custom Vision
Url för Din Custom Vision-slutpunkt
Namnet på det Azure Storage-konto som du vill använda med ditt nya anpassade modellprojekt
Nyckeln för lagringskontot
Namnet på containern som du vill använda i lagringskontot

Använda COCO-fil i ett nytt projekt

Skriptet genererar en COCO-fil och laddar upp den till den bloblagringsplats som du angav. Du kan nu importera den till ditt modellanpassningsprojekt. Se Skapa och träna en anpassad modell och gå till avsnittet om att välja/importera en COCO-fil – du kan följa guiden därifrån till slutet.

Nästa steg

Skapa och träna en anpassad modell