Сегодня 27 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → сонар

Созданы очки с сонаром, которые переводят беззвучную речь в печатный текст

Аспирант Корнеллского университета (США) Жуйдун Чжан (Ruidong Zhang) разработал оборудованные сонаром очки EchoSpeech, способные «слышать» беззвучную речь своего владельца — достаточно лицевой артикуляции. Очки могут использоваться в качестве стандартного устройства ввода.

 Жуйдун Чжан (Ruidong Zhang). Источник изображения: ruidongzhang.com

Жуйдун Чжан (Ruidong Zhang). Источник изображения: ruidongzhang.com

Новый проект автора основан на предыдущей разработке, в рамках которой он установил камеры на беспроводные наушники. Формат очков оказался для этих целей более удобным: пользователю не нужно смотреть в камеру или вставлять что-то в ухо. Данные с установленных на очки динамиков и микрофонов по беспроводному каналу передаются на смартфон, где обрабатываются алгоритмами искусственного интеллекта.

При первом использовании требуется калибровка EchoSpeech, позволяющая ИИ изучить особенности мимики пользователя — достаточно всего нескольких минут, за которые человеку предлагается, например, зачитать несколько чисел. Когда настройка завершена, точность срабатывания системы достигает 95 %. Использование смартфона для обработки данных позволяет очкам оставаться компактными и ненавязчивыми, обеспечивать им до 10 часов автономной работы и гарантировать, что вся информация остаётся на телефоне — его производительности достаточно для локальной обработки всех данных.

На практике у EchoSpeech может быть множество самых разных применений: управление программами на ПК, беззвучное управление музыкальным проигрывателем без рук, возможность диктовки сообщения на громком концерте, или даже совместная работа с голосовым синтезатором для людей с нарушениями речи — они снова заговорят. Сейчас авторы проекта рассматривают возможности вывода технологий на рынок при участии действующей в Корнеллском университете программы финансирования.


window-new
Soft
Hard
Тренды 🔥
Анонсирован VR-хоррор Alien: Rogue Incursion, который полностью погрузит игроков в ужасы вселенной «Чужого» 5 ч.
Российская пошаговая тактика «Спарта 2035» про элитных наёмников в Африке получила первый геймплей — демоверсия не выйдет 30 апреля 6 ч.
Власти США позвали Сэма Альтмана, Дженсена Хуанга и Сатью Наделлу помочь им с защитой от ИИ 7 ч.
«В команде явно продали души дьяволу»: игроков впечатлила работа Biomutant на Nintendo Switch, но производительность требует жертв 8 ч.
Microsoft открыла исходный код MS-DOS 4.00 и разместила его на GitHub 8 ч.
Большинство россиян не видит угрозы в ИИ 8 ч.
Китайские клавиатурные приложения Honor, Oppo, Samsung, Vivo и Xiaomi оказались уязвимы перед слежкой 9 ч.
Alphabet удалось развеять опасения по поводу отставания в области ИИ 10 ч.
GSC Game World показала новый трейлер и скриншоты S.T.A.L.K.E.R. 2: Heart of Chornobyl 11 ч.
Рекламные доходы YouTube в первом квартале выросли на 21 % до $8,1 млрд 12 ч.
Регулятор в США проверит декабрьское обновление автопилота Tesla, которое должно было улучшить безопасность 2 ч.
Новая статья: Обзор QD-OLED DQHD-монитора Samsung Odyssey OLED G9 G95SC: игровой универсал 4 ч.
TSMC научилась создавать монструозные двухэтажные процессоры размером с пластину 7 ч.
Федеральное расследование аварий с автопилотом Tesla нашло их причину — «неправильное использование» 8 ч.
Oppo представила смартфон A60 с Snapdragon 680 и 50-Мп камерой 8 ч.
Япония ужесточит контроль экспорта полупроводников и квантовых технологий куда бы то ни было 8 ч.
Hisense представила ультракороткофокусный лазерный 4K-проектор PX3-PRO для геймеров и киноманов 8 ч.
Intel пожаловалась на производственные проблемы при сборке Core Ultra — из-за этого процессоров не хватает 10 ч.
Великобритания и Новая Зеландия задействуют подводные оптические кабели для распознавания землетрясений и цунами 10 ч.
Объём российского IoT-рынка превысил 35 млрд руб. 10 ч.