Progetto Paragon: Assistente di lavoro per l'apprendimento profondo

Di raspi berry | 26 luglio 2023

Per quanto riguarda la produttività, i tinker hanno utilizzato microprocessori e microcontrollori in vari modi.

Tuttavia, questo assistente di lavoro per l'apprendimento profondo è in cima alla lista dei progetti più creativi che abbiamo visto da molto tempo a questa parte!

Questo progetto, sviluppato da Benjamin su Creatori WIZnet, scattano foto ogni 5 secondi e poi le leggono attraverso l'intelligenza artificiale per riconoscere i modelli di lavoro.

Benjamin ha addestrato il modello a riconoscere alcune delle numerose situazioni che tutti noi affrontiamo quando lavoriamo. Identifica quando ci si sente normali o sonnolenti o se si sbadiglia. Ma soprattutto, scansionando il viso, è in grado di capire se si è distratti e persino se si sta usando il cellulare.

Con tutte queste informazioni, sarete in grado di determinare quanto siete realmente produttivi!

Hardware

Per l'Hardware, Benjamin ha scelto un clone modificato di Raspberry Pi Pico messo in commercio da WIZnet insieme a un Arducam.

Tuttavia, se necessario, è possibile utilizzare un Raspberry Pi Pico standard con un'altra telecamera.

Inoltre, a seconda della velocità che si vuole ottenere, si potrebbe prendere in considerazione l'idea di controllare il funzionamento di un Google Coral potrebbe fare nel fare questa gara alla velocità della luce!

Ma con un microcontrollore e una fotocamera, avrete sicuramente abbastanza per sviluppare almeno una forma modificata di questo progetto.

Secondo la mia esperienza, spesso è proprio questo che rende così eccitante un'operazione del genere: mescolare e abbinare la ferramenta può spesso dare vita a nuovi risultati e a progetti collaterali!

Software

Affidandosi a CircuitPython, Benjamin è stato così gentile da pubblicare il codice di questo progetto su GitHub. Quindi, una volta installato il codice su Pico, le cose dovrebbero essere pronte e funzionanti.

Il codice si basa sul modello nano di Ultralitici YOLOv8che è un "modello di rilevamento degli oggetti e di segmentazione delle immagini in tempo reale". Se siete interessati alla struttura del modello di YOLOv8 più in generale, potete trovarla qui.

Nel frattempo, se siete interessati a saperne di più sul deep learning, il mio collega Nathan ha scritto un ottimo post sull'argomento. qui.

Con il modello nano di YOLOv8, Benjamin fa passare tutto attraverso un'applicazione Flask per fornire informazioni in tempo reale mentre segue il flusso di lavoro di una persona.

Provate voi stessi e vedete se riuscite a identificare i vostri modelli di lavoro!

Almeno questo assistente di lavoro per il deep learning aiuterà a rispondere alla mia domanda di sempre: Quante volte sbadiglio prima della terza tazza di caffè?

Potete trovare altri progetti Paragon qui.

Cosa fareste con un assistente di lavoro come questo?