Projeto Paragon: Assistente de trabalho de aprendizagem profunda
No que diz respeito à produtividade, os técnicos têm utilizado microprocessadores e microcontroladores de várias formas.
No entanto, este assistente de trabalho de aprendizagem profunda está no topo da lista como um dos projectos mais criativos que vimos em muito tempo!
Este projeto, desenvolvido por Benjamin na Criadores da WIZnetO sistema, que tira fotografias de 5 em 5 segundos, lê-as através da IA para reconhecer padrões de trabalho.
Benjamin treinou o modelo para reconhecer algumas das muitas situações que todos nós enfrentamos quando estamos a trabalhar. Identifica quando nos sentimos normais ou sonolentos ou se bocejamos. Mais importante ainda, ao analisar o seu rosto, pode dizer se está distraído e até se está a usar o telemóvel.
Com toda esta informação, poderá determinar o grau de produtividade que está realmente a ter!
Hardware
Para o Hardware, Benjamin optou por um clone Raspberry Pi Pico modificado lançado pela WIZnet juntamente com um Arducam.
No entanto, se necessário, é possível utilizar um Raspberry Pi Pico normal com outra câmara.
Além disso, dependendo da rapidez com que pretende que isto funcione, pode considerar verificar o que um Google Coral poderia fazer para fazer esta corrida à velocidade da luz!
Mas com um microcontrolador e uma câmara, terá certamente o suficiente para desenvolver, no mínimo, uma forma modificada deste projeto.
Na minha experiência, é muitas vezes isso que torna algo assim tão excitante: misturar e combinar hardware pode muitas vezes dar origem a novos resultados e projectos derivados!
Software
Confiando no CircuitPython, Benjamin teve a gentileza de publicar o código deste projeto em GitHub. Assim que instalares esse código no teu Pico, as coisas devem estar a funcionar.
O código baseia-se no modelo nano de Ultralytics YOLOv8que é um "modelo de deteção de objectos e segmentação de imagens em tempo real". Se estiver interessado na estrutura do modelo do YOLOv8 em termos mais gerais, pode encontrá-la aqui.
Entretanto, se estiver interessado em ler mais sobre a aprendizagem profunda, o meu colega Nathan escreveu um excelente post sobre o assunto aqui.
Com o modelo nano do YOLOv8, Benjamin passa tudo por uma aplicação Flask para obter informações em tempo real à medida que acompanha o fluxo de trabalho de alguém.
Experimente você mesmo e veja se consegue identificar os seus próprios padrões de trabalho!
Pelo menos, este assistente de trabalho de aprendizagem profunda ajudará a responder à minha pergunta de sempre: Quantas vezes bocejo antes da minha terceira chávena de café?
Pode encontrar mais projectos Paragon aqui.
O que é que faria com um assistente de trabalho como este?