Esercitazione: Usare Visione personalizzata con un dispositivo IoT per segnalare gli stati di visualizzazione

Articolo
01/22/2024

Questa app di esempio illustra come usare Visione personalizzata per eseguire il training di un dispositivo dotato di una fotocamera per rilevare gli stati visivi. È possibile eseguire questo scenario di rilevamento in un dispositivo IoT usando un modello ONNX esportato.

Uno stato visivo descrive il contenuto di un'immagine, ovvero una stanza vuota o una stanza con persone, una strada vuota o una strada con un camion e così via. Nell'immagine seguente è possibile osservare che l'app rileva quando una banana o una mela viene posizionata davanti alla fotocamera.

Animation of a UI labeling fruit in front of the camera

In questa esercitazione verranno illustrate le attività seguenti:

Configurare l'app di esempio in modo da usare le risorse di Visione personalizzata e dell'hub IoT.
Usare l'app per eseguire il training del progetto di Visione personalizzata.
Usare l'app per assegnare punteggi alle nuove immagini in tempo reale e inviare i risultati ad Azure.

Se non si ha una sottoscrizione di Azure, creare un account gratuito prima di iniziare.

Prerequisiti

Per usare il servizio Visione personalizzata, è necessario creare le risorse Training visione personalizzata e Previsioni visione personalizzata in Azure. A questo scopo, nel portale di Azure completare la finestra di dialogo nella pagina Create Custom Vision (Crea visione personalizzata) per creare una risorsa di training e di previsione.

Importante

Il progetto deve consistere in una classificazione di immagini di tipo Compact, perché successivamente il modello verrà esportato in ONNX.
Sarà inoltre necessario creare una risorsa dell'hub IoT in Azure.
Visual Studio 2015 o versioni successive
Facoltativamente, un dispositivo IoT che esegue Windows 10 IoT Core versione 17763 o successiva. È anche possibile eseguire l'app direttamente dal PC.
- Per Raspberry Pi 2 e 3, è possibile configurare Windows 10 direttamente dall'app Dashboard IoT. Per altri dispositivi, ad esempio DrangonBoard, è necessario eseguire il flashing del sistema operativo usando il metodo eMMC. Per informazioni sulla configurazione di un nuovo dispositivo, vedere Configurazione del dispositivo nella documentazione di Windows IoT.

Informazioni sull'app Visual Alerts

L'app IoT Visual Alerts viene eseguita a ciclo continuo e passa attraverso quattro stati diversi, in base alle esigenze:

Nessun modello: stato no-op. L'app va continuamente in sospensione per un secondo e controlla la fotocamera.
Acquisizione di immagini di training: in questo stato, l'app acquisisce un'immagine e la carica come immagine di training nel progetto di destinazione Visione personalizzata. L'app va quindi in sospensione per 500 ms e ripete l'operazione fino a quando non viene acquisito il numero di immagini preimpostato, quindi attiva il training del modello di Visione personalizzata.
In attesa del modello sottoposto a training: in questo stato, l'app chiama l'API Visione personalizzata ogni secondo per verificare se il progetto di destinazione contiene un'iterazione sottoposta a training. Quando ne trova una, scarica il modello ONNX corrispondente in un file locale e passa allo stato Scoring (Assegnazione di punteggio).
Assegnazione dei punteggi: in questo stato, l'app usa Windows ML per valutare un singolo fotogramma dalla fotocamera rispetto al modello ONNX locale. La classificazione dell'immagine risultante viene visualizzata sullo schermo e inviata come messaggio all'hub IoT. L'app quindi va in sospensione per un secondo prima di assegnare un punteggio a una nuova immagine.

Esaminare la struttura del codice

I file seguenti gestiscono la modalità di funzionamento principale dell'app.

File	Descrizione
MainPage.xaml	Questo file definisce l'interfaccia utente XAML. Ospita il controllo della fotocamera Web e contiene le etichette usate per gli aggiornamenti dello stato.
MainPage.xaml.cs	Questo codice controlla il comportamento dell'interfaccia utente XAML. Contiene il codice di elaborazione degli stati.
CustomVision\CustomVisionServiceWrapper.cs	Questa classe è un wrapper che gestisce l'integrazione con il servizio Visione personalizzata.
CustomVision\CustomVisionONNXModel.cs	Questa classe è un wrapper che gestisce l'integrazione con Windows ML per il caricamento del modello ONNX e l'assegnazione di punteggi rispetto a tale modello.
IoTHub\IotHubWrapper.cs	Questa classe è un wrapper che gestisce l'integrazione con l'hub IoT per caricare i risultati dei punteggi in Azure.

Configurare l'app Visual Alerts

Seguire questa procedura per consentire l'esecuzione dell'app IoT Visual Alerts sul proprio PC o dispositivo IoT.

Clonare o scaricare l'esempio di IoTVisualAlerts su GitHub.
Aprire la soluzione IoTVisualAlerts.sln in Visual Studio.
Integrare il progetto Visione personalizzata:
1. Nello script CustomVision\CustomVisionServiceWrapper.cs aggiornare la variabile ApiKey con la propria chiave di training.
2. Aggiornare quindi la variabile Endpoint con l'URL dell'endpoint associato alla chiave.
3. Aggiornare la variabile targetCVSProjectGuid con l'ID corrispondente del progetto di Visione personalizzata che si vuole usare.
Configurare la risorsa hub IoT:
1. Nello script IoTHub\IotHubWrapper.cs aggiornare la variabile s_connectionString con la stringa di connessione appropriata per il dispositivo usato.
2. Nella portale di Azure caricare l'istanza di hub IoT, selezionare Dispositivi IoT in Esplora risorse, selezionare nel dispositivo di destinazione (o crearne uno se necessario) e trovare il stringa di connessione in Stringa di Connessione primaria. La stringa conterrà il nome dell'hub IoT, l'ID del dispositivo e la chiave di accesso condiviso, nel formato seguente: {your iot hub name}.azure-devices.net;DeviceId={your device id};SharedAccessKey={your access key}.

Eseguire l'app

Se si esegue l'app sul PC, selezionare Computer locale come dispositivo di destinazione in Visual Studio e impostare x64 o x86 come piattaforma di destinazione. Premere quindi F5 per eseguire il programma. L'app verrà avviata e visualizzerà il feed live della fotocamera e un messaggio di stato.

Se si distribuisce l'app in un dispositivo IoT con un processore ARM, è necessario selezionare ARM come piattaforma di destinazione e Computer remoto come dispositivo di destinazione. Specificare l'indirizzo IP del dispositivo quando richiesto (deve trovarsi nella stessa rete del PC). È possibile ottenere l'indirizzo IP dall'app predefinita di Windows IoT non appena si avvia il dispositivo e si connette il dispositivo alla rete. Premere F5 per eseguire il programma.

Quando viene eseguita per la prima volta, l'app non avrà alcuna conoscenza degli stati visivi. Verrà visualizzato un messaggio di stato per segnalare che non è disponibile alcun modello.

Acquisire le immagini di training

Per configurare un modello, è necessario impostare l'app sullo stato Capturing Training Images (Acquisizione delle immagini di training). Eseguire uno dei passaggi seguenti:

Se si esegue l'app sul PC, usare il pulsante nell'angolo in alto a destra dell'interfaccia utente.
Se si esegue l'app su un dispositivo IoT, chiamare il metodo EnterLearningMode sul dispositivo tramite l'hub IoT. Il metodo può essere chiamato tramite la voce corrispondente al dispositivo nel menu dell'hub IoT nel portale di Azure oppure con uno strumento, ad esempio IoT Hub Device Explorer.

Quando l'app passa allo stato Capturing Training Images (Acquisizione delle immagini di training), acquisisce circa due immagini al secondo fino a raggiungere il numero di immagini preimpostato. Per impostazione predefinita corrisponde a 30 immagini, ma si può impostare questo parametro passando il numero desiderato come argomento al metodo EnterLearningMode dell'hub IoT.

Mentre l'app acquisisce immagini, è necessario esporre la fotocamera ai tipi di stati visivi da rilevare, ad esempio una stanza vuota, una stanza con persone, una scrivania vuota, una scrivania con un camion giocattolo e così via.

Eseguire il training del modello di Visione personalizzata

Dopo aver completato il processo di acquisizione, l'app caricherà le immagini e passerà allo stato Waiting For Trained Model (In attesa del modello sottoposto a training). A questo punto, è necessario passare al sito Web di Visione personalizzata e creare un modello basato sulle nuove immagini del training. L'animazione seguente mostra un esempio di questo processo.

Animation: tagging multiple images of bananas

Per ripetere questo processo con il proprio scenario:

Accedere al sito Web di Visione personalizzata.
Trovare il progetto di destinazione, che a questo punto dovrebbe avere tutte le immagini di training caricate dall'app.
Per ogni stato visivo che si vuole identificare, selezionare le immagini appropriate e applicare manualmente il tag.
- Se, ad esempio, l'obiettivo è distinguere tra una stanza vuota e una stanza con persone, è consigliabile contrassegnare cinque o più immagini con persone come una nuova classe, People, e altre cinque o più immagini senza persone con il tag Negative. In questo modo si aiuterà il modello a distinguere tra i due diversi stati.
- Sempre a titolo di esempio, se si vuole identificare approssimativamente quanto è pieno uno scaffale, è possibile usare tag specifici come EmptyShelf, PartiallyFullShelf e FullShelf.
Al termine, selezionare il pulsante Train (Avvia training).
Al termine del training, l'app rileverà che è disponibile un'iterazione sottoposta a training. Avvierà quindi il processo di esportazione del modello sottoposto a training in ONNX e di download del modello nel dispositivo.

Usare il modello sottoposto a training

Dopo aver scaricato il modello sottoposto a training, l'app passerà allo stato Scoring (Assegnazione di punteggio) e inizierà ad assegnare punteggi alle immagini della fotocamera in modalità a ciclo continuo.

Per ogni immagine acquisita, l'app visualizzerà il tag più rilevante sullo schermo. Se non è in grado di riconoscere lo stato visivo, restituirà il messaggio No Matches (Nessuna corrispondenza). L'app invia anche questi messaggi all'hub IoT e, se viene rilevata una classe, il messaggio includerà l'etichetta, il punteggio di attendibilità e una proprietà denominata detectedClassAlert, che può essere usata dai client dell'hub IoT interessati all'inoltro rapido di messaggi in base a proprietà.

L'esempio usa inoltre una libreria Sense HAT per rilevare quando l'app viene eseguita in un dispositivo Raspberry Pi con un'unità Sense HAT, in modo da poter usare questa unità come visualizzazione dell'output, impostando tutte le luci su rosso ogni volta che viene rilevata una classe e sullo stato disattivato quando non viene rilevata alcuna corrispondenza.

Riutilizzare l'app

Se si vuole ripristinare lo stato originale dell'app, è possibile fare clic sul pulsante nell'angolo in alto a destro dell'interfaccia utente oppure richiamare il metodo DeleteCurrentModel tramite l'hub IoT.

In qualsiasi momento, è possibile ripetere il passaggio del caricamento di immagini di training facendo clic sul pulsante in alto a destra dell'interfaccia utente o chiamando il metodo EnterLearningMode una seconda volta.

Se si esegue l'app su un dispositivo ed è necessario recuperare nuovamente l'indirizzo IP, ad esempio per stabilire una connessione remota tramite il client remoto di Windows IoT, è possibile chiamare il metodo GetIpAddress tramite l'hub IoT.

Pulire le risorse

Eliminare il progetto di Visione personalizzata se non si vuole più gestirlo. Nel sito Web Visione personalizzata passare a Progetti e selezionare l'icona del cestino sotto il nuovo progetto.

Screenshot of a panel labeled My New Project with a trash can icon

Passaggi successivi

In questa esercitazione è stata configurata ed eseguita un'applicazione che rileva le informazioni sullo stato visivo in un dispositivo IoT e invia i risultati all'hub IoT. A questo punto è possibile esaminare più in dettaglio il codice sorgente o apportare una delle modifiche suggerite di seguito.

Esempio di IoTVisualAlerts (GitHub)

Aggiungere un metodo dell'hub IoT per consentire all'app di passare direttamente allo stato Waiting For Trained Model (In attesa del modello sottoposto a training). In questo modo, è possibile eseguire il training del modello con immagini che non vengono acquisite dal dispositivo stesso e quindi eseguire il push del nuovo modello nel dispositivo quando necessario.
Seguire l'esercitazione Visualizzare i dati dei sensori in tempo reale per creare un dashboard di Power BI per visualizzare gli avvisi dell'hub IoT inviati dall'esempio.
Seguire l'esercitazione Monitoraggio remoto di IoT per creare un'app per la logica che risponda agli avvisi dell'hub IoT quando vengono rilevati determinati stati visivi.

Share via