Сегодня 25 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft показала нейросеть, которая делает говорящие что угодно дипфейки по одному фото

За последние пару лет генеративные нейросети преодолели важный этап развития, став более мощными и способными создавать по текстовому описанию не только изображения, но и видео. Новый алгоритм VASA-1 от Microsoft, вероятно, сумеет удивить многих, поскольку для его работы вообще не нужно описание. Достаточно предоставить одно изображение человека и аудиодорожку, на основе которых нейросеть сгенерирует видео говорящего человека с широким спектром эмоций и естественной мимикой.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Результат работы VASA-1 выглядит очень естественно и правдоподобно. Всего из одного снимка лица и записи голоса алгоритм создаёт реалистичное видео, на котором запечатлённый на снимке человек буквально «оживает», а его мимика, движения губ и головы выглядят вполне натурально. Поскольку созданные с помощью VASA-1 видео с ходу сложно отличить от реальных, уже высказываются опасения по поводу того, что алгоритм может использоваться злоумышленниками для создания фейков.

Что касается самой нейросети, то главным её отличием от других подобных алгоритмов является наличие целостной модели генерации лицевой мимики и движений головы. Специалисты Microsoft провели обширную исследовательскую работу, включая оценку ряда новых метрик. В результате они установили, что новый алгоритм значительно превосходит представленные ранее аналоги по многим параметрам.

«Наш метод не только обеспечивает генерацию видео высокого качества с реалистичной мимикой лица и движениями головы, но также поддерживает функцию онлайн-генерации видео 512×512 точек с частотой 40 кадров в секунду с незначительной начальной задержкой. Это открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими поведение человека во время разговора», — говорится в сообщении Microsoft.

Другими словами, нейросеть может создавать качественные фейковые видео на основе всего одного изображения. Поэтому не удивительно, что Microsoft называет VASA-1 «исследовательской демонстрацией» и не планирует выводить его на коммерческий рынок, по крайней мере, в ближайшее время.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google выпустила ИИ-модель Lyria 3 Pro для генерации трёхминутных музыкальных треков — но не бесплатно 17 мин.
Надёжный инсайдер раскрыл главную игру апрельской линейки PS Plus за неделю до официального анонса 51 мин.
«Яндекс» и UserGate представили совместное решение для киберзащиты по принципу сетевого доверия 2 ч.
Разработчики Forza Horizon 6 «выкатили» системные требования — в том числе для «экстремальных» настроек графики и трассировки лучей 2 ч.
Марадона против Тора: сумасшедший трейлер подтвердил дату выхода футбольной аркады FIFA Heroes 3 ч.
Безумный кооперативный симулятор Salvation Denied отправит строить гигантские башни с помощью абсурдных инструментов 5 ч.
Mozilla запустила разработку платформы cq — своего рода Stack Overflow для ИИ-агентов 5 ч.
Американский судья усмотрела в действиях Пентагона желание наказать Anthropic за её позицию 7 ч.
ChatGPT научился давать прогноз погоды на срок до 10 дней с помощью AccuWeather 7 ч.
Апскейлер PSSR 2 для PlayStation 5 имеет общие корни с технологией масштабирования AMD FSR, но использует иную реализацию 8 ч.
MaxSun представила свои варианты Arc Pro B70 — с активным и пассивным охлаждением 27 мин.
Google поведёт квантовые компьютеры по гибридному пути: к сверхпроводящим кубитам добавят нейтральные атомы 29 мин.
ASRock представила юбилейную матплату Z890 Taichi 10th Anniversary с обновлённым дизайном 52 мин.
Dell представила обновлённые ноутбуки серии Pro — они стали тоньше и получили свежие чипы Intel и AMD 3 ч.
Intel выпустила Xeon 600 с 12–86 ядрами для рабочих станций и Core Ultra 300 vPro для бизнес-ноутбуков 3 ч.
Samsung представила смартфоны Galaxy A37 и A57 с чипами Exynos и улучшенной защитой от влаги по цене $450–550 3 ч.
Intel выпустила «Больших боевых магов» — видеокарты Arc Pro B70 и B65 с 32 Гбайт GDDR6 для профессионалов 4 ч.
MSI представила блоки питания со встроенным зуммером — он громко предупредит об угрозе расплавления видеокарты 4 ч.
Австралия решила надавить на ИИ ЦОД, частично отказавшись от рыночного подхода 4 ч.
Samsung представила 4-нм процессор Exynos 1680 для смартфонов среднего уровня 5 ч.