Paragon-Projekt: Deep Learning Arbeitsassistent
Wenn es um Produktivität geht, haben Tüftler Mikroprozessoren und Mikrocontroller auf vielfältige Weise eingesetzt.
Dieser Deep Learning-Arbeitsassistent ist jedoch eines der kreativsten Projekte, die wir seit langem gesehen haben!
Dieses Projekt, das von Benjamin von der WIZnet-Machernehmen alle 5 Sekunden Fotos auf und lesen sie dann durch KI, um Arbeitsmuster zu erkennen.
Benjamin hat das Modell darauf trainiert, einige der vielen Situationen zu erkennen, denen wir alle bei der Arbeit begegnen. Es erkennt, ob man sich normal oder schläfrig fühlt oder ob man gähnt. Noch wichtiger ist, dass es durch Scannen Ihres Gesichts erkennen kann, ob Sie abgelenkt sind und sogar, ob Sie Ihr Handy benutzen.
Mit all diesen Informationen können Sie feststellen, wie produktiv Sie wirklich sind!
Hardware
Für Hardware wählte Benjamin ein modifizierter Raspberry Pi Pico-Klon die von WIZnet zusammen mit einer Arducam herausgegeben wird.
Sie könnten aber auch einen normalen Raspberry Pi Pico mit einer anderen Kamera verwenden.
Je nachdem, wie schnell Sie es haben wollen, sollten Sie außerdem prüfen, was ein Google Koralle um dieses Rennen blitzschnell zu machen!
Aber mit einem Mikrocontroller und einer Kamera hast du auf jeden Fall genug, um zumindest eine modifizierte Form dieses Projekts zu entwickeln.
Meiner Erfahrung nach ist es oft das, was so etwas so spannend macht: Das Mischen und Kombinieren von Hardware kann oft zu neuen Ergebnissen und Nebenprojekten führen!
Software
Da er sich auf CircuitPython verlässt, war Benjamin so freundlich, den Code für dieses Projekt auf GitHub. Sobald Sie diesen Code auf Ihrem Pico installiert haben, sollte alles funktionieren.
Der Code stützt sich auf das Nanomodell von Ultralytik YOLOv8das ein "Echtzeit-Objekterkennungs- und Bildsegmentierungsmodell" ist. Wenn Sie an der Modellstruktur von YOLOv8 im Allgemeinen interessiert sind, finden Sie sie hier hier.
In der Zwischenzeit hat mein Kollege Nathan einen großartigen Beitrag über Deep Learning geschrieben, falls Sie mehr darüber erfahren möchten hier.
Mit dem Nano-Modell von YOLOv8 lässt Benjamin alles durch eine Flask-Anwendung laufen, um die Echtzeit-Informationen auszuspucken, während es den Arbeitsablauf einer Person verfolgt.
Probieren Sie es selbst aus und sehen Sie, ob Sie Ihre eigenen Arbeitsmuster erkennen können!
Zumindest wird dieser Deep-Learning-Arbeitsassistent dazu beitragen, meine lebenslange Frage zu beantworten: Wie oft muss ich vor meiner dritten Tasse Kaffee gähnen?
Mehr Paragon Projekte finden Sie hier.
Was würden Sie mit einem solchen Arbeitsassistenten machen?