Проекты
Конкурсные проекты

Жест


Тип участника:  Физическое лицо
Полное наименование организации/физического лица/авторского или творческого коллектива:  Земская Софья Сергеевна
В лице (для организации или авторского/творческого коллектива указывается ФИО и должность руководителя):  Земская Софья Сергеевна
Интернет-сайт заявителя:  https://www.altstu.ru/
Контактное лицо: ФИО:  Земская Софья Сергеевна
Идея и краткое описание ИТ-проекта: 

Идея: Создание интуитивно понятной и доступной среды, позволяющей людям с ограниченными возможностями эффективно управлять устройствами и общаться с миром вокруг них.

Краткое описание: проект направлен на помощь людям с ограниченными возможностями в повседневной жизни. Оно использует технологии распознавания жестов и голос, чтобы обеспечить доступ к информации и облегчить коммуникацию.

С помощью жестов или голосовых команд пользователи могут управлять устройствами, получать доступ к информации или общаться с другими людьми. Это может быть особенно полезно для людей с ограниченной подвижностью или нарушениями слуха и речи.
Перечень решаемых задач: 

1.   Обеспечение доступности: внедрение функционала, способствующего доступности взаимодействия с компьютером людям с ограниченными возможностями

2.   Социальная интеграция: Обеспечение способов коммуникации между пользователями системы, чтобы они могли взаимодействовать с компьютером и с окружающим миром, поддерживая социальные связи.

Описание функциональных возможностей и элементов проекта: 

Проект позволяет управлять компьютером с помощью жестовых команд или с помощью голоса.

Проект включает в себя несколько ключевых функциональных возможностей, направленных на улучшение взаимодействия пользователя с компьютером:

1. Жестовое управление:

   - Распознавание жестов: Система использует веб-камеру компьютера для отслеживания движений рук и распознавания жестов, которые могут выполнять различные команды.

   - Кастомизация жестов: Пользователи могут настраивать и создавать собственные жесты путем комбинации статических жестов, привязывая их к определенным функциям или программам, что позволяет повысить удобство использования.

2. Голосовое управление:

   - Контекстное понимание: Система способна понимать контекст команд и предложений, что позволяет выполнять более сложные задачи без необходимости в точных формулировках.

   - Интеграция с приложениями: Возможность управления различными приложениями (например, открытие файлов, выполнение задач, управление медиаплеером) с помощью голосовых команд.

3. Интерфейс пользователя:

   - Интуитивно понятный интерфейс: Графический интерфейс программы обеспечивает легкий доступ к настройкам и функциям, позволяя пользователям быстро обучаться использованию системы.

   - Обратная связь через звук и визуальные эффекты: Система предоставляет пользователю обратную связь о выполнении команд через звуковые сигналы и визуальные индикации, что помогает повышать уверенность в использовании.

4. Безопасность и конфиденциальность:

   - Аутентификация пользователей: Дополнительные меры безопасности, такие как биометрическая аутентификация (распознавание лиц), для защиты личных данных и доступа к системе.

   - Настройки конфиденциальности: Пользователи могут управлять настройками конфиденциальности, контролируя, какие данные собираются и используются для обучения системы.

6. Обучение и адаптация:

   - Индивидуальное обучение системы: Проект использует методы машинного обучения для адаптации под предпочтения и характеристики пользователя, улучшая распознавание жестов и голоса с течением времени.

   - Обратная связь от пользователей: Возможность отправки отзывов и предложений для улучшения системы, что способствует ее постоянному развитию и актуализации функционала.
Дата внедрения (в случае, если предполагается запуск проекта в эксплуатацию):  -
Используемые платформы, средства разработки: 

·       Модель resnet-18 для распознавания жестов

·       Модель resnet-18 для распознавания голоса

·       Менеджер управления файлами для работы с компьютером

·       PyQt интуитивно понятный интерфейс

Стоимость разработки системы:  100000
Средний размер ежегодных затрат на эксплуатацию:  Алгоритм не требует таких затрат
Перспективы развития: 

·       Внедрение средств распознавания голоса

·       Расширение функционала управления компьютером

·       Адаптация программного обеспечения под разные устройства и операционные системы

Достижение поставленных целей:  В рамках выполнения ВКР была проделана работа, решающая часть поставленных целей
Социальная значимость и/или экономическая эффективность (в зависимости от типа проекта): 

1. Инклюзия и доступность: Проект способствует созданию более инклюзивного общества, где люди с ограниченными возможностями могут участвовать в повседневной жизни на равных условиях с другими. Это помогает устранить барьеры, которые часто встречаются в коммуникации и доступе к информации.

2. Улучшение качества жизни: Использование технологий распознавания жестов и голоса может значительно улучшить качество жизни людей с ограниченными возможностями, предоставляя им возможность самостоятельно управлять своими устройствами и получать необходимую информацию, что увеличивает их независимость и уверенность.

3. Социальная интеграция: Проект может способствовать социальной интеграции людей с ограниченными возможностями, облегчая взаимодействие с окружающими и участию в различных социальных, образовательных и профессиональных мероприятиях.

4. Образование и информированность: Реализация проекта может повысить общественную осведомленность о потребностях людей с ограниченными возможностями, способствуя изменению общественного восприятия и создания более толерантной среды.

5. Снижение изоляции: Возможности для общения и взаимодействия с помощью технологий помогают снизить чувство изоляции, которое часто испытывают люди с ограниченными возможностями.

6. Поддержка инноваций: Проект может стать катализатором для дальнейших исследований и разработок в области assistive technology, что приведет к новым решениям и улучшениям для людей с различными ограничениями.

В целом, проект имеет потенциал значительно улучшить жизнь людей с ограниченными возможностями, способствуя созданию более доступного и справедливого общества.
Актуальность, экономическая или социальная полезность: 

Экономическая полезность: Расширение возможностей для людей с ограниченными возможностями также может иметь экономическую ценность. Увеличение их участия в рабочей силе и социальной активности может привести к позитивным изменениям как для самих людей, так и для общества в целом.

Социальная полезность: Проект предоставляет людям с ограниченными возможностями инструменты для более независимого и активного участия в повседневной формальной и неформальной сферах жизни. Создание интуитивно понятной среды способствует социальному вовлечению людей с ограниченными возможностями, что позволяет разрушить барьеры в коммуникации и взаимодействии с окружающими. Это, в свою очередь, может способствовать лучшему пониманию и принятию таких людей в обществе.
Адаптивность, стилистическое единство всех функциональных блоков: 

Интерфейс программного обеспечения адаптирован под социальную задачу проекта, а также его целевую аудиторию. Минимализм убирает лишние детали и позволяет пользователю ПО сосредоточиться на важных вещах. Присутствуют гармония и согласованность в визуальном и функциональном оформлении всех элементов системы.

Масштабируемость, способность к взаимодействию с другими системами, мобильность: 

Пока что программное обеспечение адаптировано только на работу на компьютерах с операционной системой windows. В дальнейшем планируется расширить проект и перенести программное обеспечение на другие устройства и другие операционные системы.

Обоснованность применяемых проектных решений: 

Для нейросетей используется архитектура Оптимальным вариантом будет архитектура ResNet, который известен своей способностью эффективно обучаться на больших объемах данных. Основное преимущество ResNet заключается в использовании skip connections, которые позволяют успешно обучать глубокие нейронные сети, избегая проблемы затухания градиента.

Также оптимальным выбором стало создание менеджера управления файлами, который работает при помощи функций перехвата (хук-функций). Для управления компьютером с помощью жестов функцией перехвата будет являться жест, инструкцией – вызываемая жестом функция, описанная в программе для связи жеста и системных команд для работы с компьютером, а планируемой функцией – набор системных команд.

Необходимо, чтобы система работала без использования лишней периферии, потому использоваться будут стандартные устройства – микрофон и веб-камера.
Оригинальность, новизна, отличие от аналогов либо отсутствие аналогов: 

Существуют системы, которые переводят жестовый язык в текст:

  - SignAll: Система, которая переводит американский жестовый язык (ASL) в текст и речь с помощью камер и искусственного интеллекта. Она направлена на облегчение общения между глухими и слышащими людьми.

   - HandTalk: Приложение, которое переводит текст на португальский жестовый язык с использованием 3D-аватара, предоставляя доступ к информации пользователям, использующим жестовый язык.

Существуют специализированные голосовые интерфейсы:

  - Amazon Alexa и Google Assistant: Эти голосовые помощники позволяют управлять умными домами и получать доступ к информации с помощью голосовых команд, что может быть очень полезно для людей с ограниченной подвижностью.

   - Dragon NaturallySpeaking: Программа для распознавания голоса, позволяющая пользователям управлять компьютером, диктовать тексты и выполнять другие задачи с помощью голоса.

Хотя эти технологии уже существуют, прогресс в области доступности и инклюзии продолжается. Исследователи и разработчики постоянно ищут способы улучшить эти системы, чтобы сделать их более интуитивно понятными и эффективными для конечных пользователей. Более того – мной не было найдено готовых программных продуктов, которые объединяют весь придуманный функционал.
Соответствие дизайн-решения целевой аудитории:  Дизайн проекта спокойный и минималистичный, а также при реализации сделан упор на читабельность, понятность и простоту. Использованы большие кегли шрифта, большие шрифты, а также всплывающие подсказки.
Юзабилити и полезность: 

Пользователь быстро понимает, как пользоваться продуктом без необходимости в обучении, а также быстро достигает своих целей с минимальными усилиями и временем. Продукт минимизирует количество возможных ошибок и предоставляет пользователям понятные способы их исправления.

Гарантирую достоверность предоставленной в заявке информации. Подтверждаю, что организация не находится в состоянии ликвидации, банкротства, реорганизации (Только для организаций):  Да
Презентация проекта pdf:  Загрузить
Возврат к списку
нет доступа к комментариям Авторизоваться