Проект Paragon: Рабочий помощник по глубокому обучению

Для повышения производительности микропроцессоры и микроконтроллеры используются в самых разных областях.

Однако этот помощник по глубокому обучению возглавляет список самых креативных проектов, которые мы видели за последнее время!

Этот проект, разработанный Бенджамином на сайте Создатели WIZnetОни делают фотографии каждые 5 секунд, а затем считывают их с помощью искусственного интеллекта, чтобы распознать характер работы.

Бенджамин обучил модель распознавать некоторые из многочисленных ситуаций, с которыми каждый из нас сталкивается во время работы. Она определяет, когда вы чувствуете себя нормально или сонливо, зеваете ли вы. Более того, сканируя ваше лицо, она может определить, не отвлекаетесь ли вы, и даже не пользуетесь ли вы мобильным телефоном.

Имея всю эту информацию, вы сможете определить, насколько продуктивно вы работаете на самом деле!

Оборудование

Для аппаратного обеспечения Бенджамин выбрал модифицированный клон Raspberry Pi Pico выпущенный компанией WIZnet вместе с Arducam.

Однако при необходимости можно использовать стандартный Raspberry Pi Pico с другой камерой.

Кроме того, в зависимости от того, насколько быстро вы хотите работать, вы можете рассмотреть возможность использования Google Coral можно сделать, чтобы гонка прошла с молниеносной скоростью!

Credit: Benjamin at WIZnet Makers

Но если у вас есть микроконтроллер и камера, то этого вполне достаточно для разработки как минимум модифицированной формы этого проекта.

По моему опыту, именно это часто делает подобные проекты такими интересными: смешивание и комбинирование оборудования часто приводит к новым результатам и побочным проектам!

Программное обеспечение

Опираясь на CircuitPython, Бенджамин был достаточно любезен, чтобы опубликовать код этого проекта на сайте GitHub. После установки этого кода на Pico все должно быть готово к работе.

Код опирается на нано-модель Ultralytics YOLOv8которая представляет собой "модель обнаружения объектов и сегментации изображений в реальном времени". Если вас интересует структура модели YOLOv8 в более общем виде, то вы можете найти ее здесь.

Тем временем, если вам интересно узнать больше о глубоком обучении, мой коллега Натан написал об этом замечательный пост здесь.

Кредит: Ultralytics.

В нано-модели YOLOv8 Бенджамин прогоняет все через приложение Flask, которое выдает информацию в режиме реального времени, отслеживая рабочий процесс человека.

Попробуйте сами и посмотрите, сможете ли вы определить свои собственные шаблоны работы!

По крайней мере, этот рабочий помощник с глубоким обучением поможет ответить на мой вечный вопрос: Сколько раз я зеваю перед третьей чашкой кофе?

Вы можете найти другие проекты компании Paragon здесь.

Что бы вы делали с таким помощником?

Комментировать