Proyecto Paragon: Asistente de trabajo de aprendizaje profundo

Los microprocesadores y microcontroladores se han utilizado de muchas formas para aumentar la productividad.

Sin embargo, este asistente de trabajo de aprendizaje profundo encabeza la lista como uno de los proyectos más creativos que hemos visto en mucho tiempo.

Este proyecto, desarrollado por Benjamin en Creadores de WIZnet, toma fotos cada 5 segundos y luego las lee mediante IA para reconocer patrones de trabajo.

Benjamin ha entrenado al modelo para que reconozca algunas de las muchas situaciones a las que todos nos enfrentamos cuando trabajamos. Identifica cuándo te sientes normal o somnoliento o si bostezas. Y lo que es más importante, al escanear tu cara, puede decirte si estás distraído e incluso si estás usando el móvil.

Con toda esta información, podrás determinar hasta qué punto estás siendo realmente productivo.

Hardware

Para el hardware, Benjamin eligió un clon modificado de Raspberry Pi Pico publicado por WIZnet junto con un Arducam.

Sin embargo, definitivamente se podría utilizar una Raspberry Pi Pico estándar con otra cámara en su lugar si es necesario.

Además, dependiendo de la velocidad a la que quieras que funcione, podrías considerar comprobar qué es un Google Coral ¡podría hacer en hacer esta carrera a la velocidad del rayo!

Crédito: Benjamin en WIZnet Makers

Pero con un microcontrolador y una cámara, sin duda tendrás suficiente para desarrollar una forma modificada de este proyecto como mínimo.

En mi experiencia, eso es lo que hace que algo así sea tan emocionante: mezclar y combinar herrajes puede dar lugar a nuevos resultados y proyectos derivados.

Software

Apoyándose en CircuitPython, Benjamin tuvo la amabilidad de publicar el código de este proyecto en GitHub. Así que una vez que instales ese código en tu Pico, las cosas deberían estar listas y funcionando.

El código se basa en el modelo nano de Ultralytics YOLOv8que es un "modelo de detección de objetos y segmentación de imágenes en tiempo real". Si está interesado en la estructura del modelo de YOLOv8 de forma más general, puede encontrarla en aquí.

Mientras tanto, si te interesa leer más sobre el aprendizaje profundo, mi colega Nathan ha escrito un estupendo post sobre el tema aquí.

Crédito: Ultralytics.

Con el modelo nano de YOLOv8, Benjamin ejecuta todo a través de una aplicación Flask para escupir la información en tiempo real a medida que rastrea el flujo de trabajo de alguien.

Pruébelo usted mismo y vea si puede identificar sus propios patrones de trabajo.

Al menos este asistente de trabajo de aprendizaje profundo ayudará a responder a mi pregunta de toda la vida: ¿Cuántas veces bostezo antes de mi tercera taza de café?

Encontrará más proyectos de Paragon aquí.

¿Qué harías con un asistente de trabajo como éste?

Deja un comentario