Сегодня 13 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Российские исследователи научили ИИ точнее распознавать незнакомые объекты на фото

Учёные лаборатории исследований искусственного интеллекта T-Bank AI Research представили на Международной конференции по обработке изображений (IEEE ICIP) в Абу-Даби новый метод под названием SDDE (Saliency-Diversified Deep Ensembles), который позволяет значительно повысить точность распознавания объектов на изображениях с помощью ИИ.

 Источник изображения: BrianPenny/Pixabay

Источник изображения: BrianPenny/Pixabay

Новое решение, в разработке которого также участвовали студенты МИСИС и МФТИ, позволяет примерно на 20 % снизить риск ошибки при обработке и анализе изображений, пишет Forbes.

При распознавании объектов используются методы машинного обучения, повышающие его эффективность. В частности, применяются глубокие ансамбли, когда в процессе распознавания используется несколько нейронных сетей. При методе SDDE используются карты внимания, фокусирующиеся на разных аспектах данных, что позволяет моделям анализировать изображение под разными ракурсами, помогая получить более полную информацию и повысить общую точность анализа. Благодаря этому идентификация объектов становится более надёжной и диверсифицированной, отметили в T-Bank AI Research. По мнению исследователей, новый метод будет востребован в сфере беспилотных транспортных средств и медицинской диагностики.

Также ИИ-модель научили учитывать при анализе изображение не только наборы данных, которые использовались при её обучении, но и незнакомую ей информацию. Это расширило возможности модели при идентификации неизвестных ей объектов. Как отметил младший научный сотрудник группы «ИИ в промышленности» Института AIRI Максим Голядкин, нейросети зачастую не распознают, когда сталкиваются с незнакомыми входными данными, поэтому это решение очень важно. «Вместо того, чтобы признать неопределённость, они могут уверенно выдавать неправильные прогнозы подобно тому, как некоторые языковые модели могут предоставлять вводящую в заблуждение информацию, известную как “галлюцинации”, — говорит эксперт. — Разнообразив фокус каждой модели, ансамбль становится лучше в распознавании тех входных данных, с которыми он ранее не сталкивался».

Мировой рынок компьютерного зрения стремительно растёт с прогнозируемым увеличением с $25,8 млрд в 2024 до $47 млрд к 2030 году, подсчитали в Statista. В частности, в сфере здравоохранении объём рынка вырастет с $986 млн в 2022 году до $31 млрд в 2031 году с прогнозируемым ростом на 47 % в год, утверждают в Straits Research.

В России рынок в этом году вырастет до более чем $600 млн и далее по 10,5 % в среднем в год до 2030-го, когда он превысит $1,1 млрд, прогнозируют в Statista.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Блогер встроил «чит» прямо в руку — электростимуляция ускорила прицеливание в CS2 6 ч.
ИИ-бот Claude теперь может прочитать «Войну и мир» за раз — Anthropic увеличила контекстное меню в 5 раз 6 ч.
ИБ-платформа Security Vision 5 получила множество доработок 7 ч.
Krafton: увольнение руководителей Unknown Worlds спасло Subnautica 2 от судьбы Kerbal Space Program 2 и «непоправимого ущерба всей франшизе» 8 ч.
Chrome начнёт блокировать скрипты для слежки, но только в режиме «Инкогнито» 8 ч.
VK Tech увеличила в I полугодии 2025 года выручку в полтора раза, а количество клиентов выросло более чем втрое 8 ч.
Догоняя X: месячная аудитория Threads превысила 400 млн активных пользователей 9 ч.
Perplexity предложила выкупить Google Chrome за $34,5 млрд — сам стартап стоит почти вдвое меньше 9 ч.
Персонализация поиска Google стала по-настоящему персональной — теперь можно самому выбирать источники 11 ч.
Capcom устроит «эксклюзивный показ» Resident Evil Requiem на Gamescom: Opening Night Live 12 ч.