Projet Paragon : Assistant de travail pour l'apprentissage profond

En matière de productivité, les bricoleurs ont utilisé les microprocesseurs et les microcontrôleurs de diverses manières.

Cependant, cet assistant de travail d'apprentissage profond arrive en tête de liste des projets les plus créatifs que nous ayons vus depuis longtemps !

Ce projet, développé par Benjamin à WIZnet MakersLe système de gestion des photos prend des photos toutes les 5 secondes et les lit ensuite à l'aide de l'intelligence artificielle pour reconnaître les habitudes de travail.

Benjamin a entraîné le modèle à reconnaître certaines des nombreuses situations auxquelles nous sommes tous confrontés lorsque nous travaillons. Il identifie si vous vous sentez normal ou somnolent ou si vous bâillez. Plus important encore, en scannant votre visage, il peut vous dire si vous êtes distrait et même si vous utilisez votre téléphone portable.

Grâce à toutes ces informations, vous serez en mesure de déterminer à quel point vous êtes réellement productif !

Matériel informatique

Pour la quincaillerie, Benjamin a opté pour un clone modifié de Raspberry Pi Pico mis en place par WIZnet ainsi qu'un Arducam.

Cependant, vous pouvez tout à fait utiliser un Raspberry Pi Pico standard avec une autre caméra si nécessaire.

En outre, en fonction de la vitesse à laquelle vous voulez que cela fonctionne, vous pourriez envisager de vérifier ce qu'est un Google Coral pour que cette course se déroule à la vitesse de l'éclair !

Crédit : Benjamin chez WIZnet Makers

Mais avec un microcontrôleur et une caméra, vous aurez certainement de quoi développer une forme modifiée de ce projet.

D'après mon expérience, c'est souvent ce qui rend ce genre de projet si passionnant : le fait de mélanger et d'assortir le matériel peut souvent donner lieu à de nouveaux résultats et à des projets dérivés !

Logiciel

S'appuyant sur CircuitPython, Benjamin a eu la gentillesse de publier le code de ce projet sur GitHub. Une fois que vous aurez installé ce code sur votre Pico, tout devrait être opérationnel.

Le code s'appuie sur le modèle nanométrique de Ultralytics YOLOv8qui est un "modèle de détection d'objets et de segmentation d'images en temps réel". Si vous êtes intéressé par la structure du modèle de YOLOv8 de manière plus générale, vous pouvez la trouver sur le site suivant ici.

En attendant, si vous souhaitez en savoir plus sur l'apprentissage profond, mon collègue Nathan a rédigé un excellent article à ce sujet. ici.

Crédit : Ultralytiques.

Avec le modèle nano de YOLOv8, Benjamin fait tout passer par une application Flask pour recracher les informations en temps réel en suivant le flux de travail d'une personne.

Essayez-le pour vous-même et voyez si vous pouvez identifier vos propres schémas de travail !

Au moins, cet assistant de travail à apprentissage profond contribuera à répondre à la question que je me pose depuis toujours : Combien de fois dois-je bâiller avant ma troisième tasse de café ?

Vous pouvez trouver d'autres projets Paragon ici.

Que feriez-vous avec un tel assistant de travail ?

Laissez un commentaire