Сегодня 18 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» раскрыл алгоритм распознавания голосовых команд в шумных условиях

Инженеры «Яндекса» опубликовали научную статью, в которой раскрыли принципы работы нейросети, обеспечивающей распознавание голосовых команд в условиях внешнего шума. Компания уже применяет эту технологию, и теперь внедрить её смогут разработчики по всему миру.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

Работа будет представлена на международной конференции по речевым технологиям Interspeech, которая пройдёт с 17 по 21 августа в нидерландском Роттердаме; среди прочих участников мероприятия значатся Microsoft, Google DeepMind и Google AR.

Разработанная специалистами «Яндекса» технология используется в умных колонках и «ТВ Станциях». Она позволяет устройствам с «Алисой» правильно интерпретировать голосовые команды, если что-то пытается этому помешать: играет музыка, шумит вода, гудит вечеринка, или за окном грохочет стройка — система услышит пользователя, даже если он не будет пытаться перекричать песню или не станет выключать пылесос. Используя эту технологию, любая компания сможет повысить качество работы голосового помощника с искусственным интеллектом и уменьшить долю ложных срабатываний.

Если человеческий голос раздаётся на фоне музыки, эффективными считаются алгоритмы эхоподавления; в случае других посторонних источников лучше работает шумоподавление, которое, однако, ухудшает и разборчивость человеческой речи. Поэтому в «Яндексе» разработали attention-механизм на основе нейросетей — на вход ему подаются сразу оба сигнала, с эхо- и шумоподавлением, и система динамически выбирает наиболее чёткий, адаптируясь к звуковому фону от источников разной природы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Дракона не остановить: Team Spirit стала чемпионом BLAST Bounty Season 2, разгромив The MongolZ 9 ч.
Новая статья: Mafia: The Old Country — возвращение привычной «Мафии». Рецензия 17-08 00:09
Сэм Альтман рассказал о перспективах OpenAI, ИИ и других технологий 16-08 17:14
Meta проведёт масштабные изменения в структуре ИИ-подразделений — в четвёртый раз за полгода 16-08 15:23
Google Gemini был доступен для россиян всего несколько часов 16-08 15:03
GPT-5 пока не смогла порадовать потребителей, зато корпоративные клиенты пришли в восторг 16-08 13:11
В рамках вторичного размещения персонал OpenAI продаст акций на сумму $6 млрд 16-08 07:17
Волна интереса к ИИ порождает новых миллиардеров с рекордной скоростью 16-08 04:34
Почти 30 тыс. серверов Microsoft Exchange Server оказались уязвимыми из-за нерасторопности администраторов 16-08 01:23
OpenAI заработала $2 млрд на мобильном приложении ChatGPT — в 30 раз больше всех конкурентом вместе 16-08 01:05
Новая статья: Зачем AMD рекомендует DDR5-8000 для Ryzen 7 9800X3D? Разбираемся с помощью модулей KingBank 7 ч.
США и Китай поменялись ролями: выбросы CO₂ в Поднебесной снизились, а в Америке выросли 12 ч.
Google потратит $9 млрд на развитие облачной и ИИ-инфраструктуры в Оклахоме — часть пойдёт на обучение электриков 13 ч.
В России наметили запуск межпланетной станции к Венере 16 ч.
Inspur разработала СЖО для мегаваттных стоек с 3-кВт ИИ-ускорителями 17 ч.
На пути к $10 млрд/год: Arista наращивает выручку и чистую прибыль на фоне бума ИИ 17 ч.
В Пекине стартовали первые в мире Всемирные игры человекоподобных роботов 16-08 17:00
Автономность планшетов Surface Pro 11 снизилась вдвое — Microsoft изучает проблему 16-08 16:27
Asus выпустила белые версии GeForce RTX 5060 и Radeon RX 9060 XT в исполнении Dual 16-08 16:23
В преддверии десятого испытательного полёта Starship компания SpaceX раскрыла причины двух прошлых неудач 16-08 15:28