Сегодня 27 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google научила ИИ-бота Gemini редактировать любые изображения

Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём.

 Источник изображений: Google

Источник изображений: Google

Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений.

Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями.

 Источник изображений: Google

«Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач.

Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Миллионные зарплаты не помогли: элитная лаборатория суперинтеллекта Meta стала терять сотрудников 2 мин.
Atari выкупила у Ubisoft права на пять игр, включая Cold Fear, I Am Alive и Grow Home 28 мин.
Google выпустила «ИИ-фотошоп» — в Gemini встроили модель nano-banana, которая может точно редактировать картинки 55 мин.
«Мы прислушиваемся к вашим отзывам»: Paradox ответила на критику платных вампирских кланов в Vampire: The Masquerade — Bloodlines 2 2 ч.
OpenAI рискует потерять миллиарды инвестиций: переговоры с Microsoft откладывают реструктуризацию 3 ч.
Google кардинально обновила дизайн мобильного приложения Gmail в стиле Material 3 Expressive 5 ч.
Средневековый коронавирус и завершение истории Индржиха: новые детали сюжетного аддона Mysteria Ecclesiae для Kingdom Come: Deliverance 2 13 ч.
Россияне смогут блокировать звонки из-за рубежа — представлены новые меры против кибермошенников 14 ч.
Google оштрафовали на 7 млн рублей за работу в России без регистрации в Роскомнадзоре 15 ч.
Без русского языка и офлайн-режима, зато с монетизацией: геймплейный трейлер раскрыл дату выхода в раннем доступе скейтерского симулятора Skate 15 ч.