Сегодня 18 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Apple представила ИИ для редактирования фото по текстовым командам

Научное подразделение Apple совместно с исследователями Калифорнийского университета в Санта-Барбаре выпустило мультимодальную модель искусственного интеллекта MGIE, предназначенную для редактирования изображений. Чтобы внести изменения в снимок, пользователю достаточно естественным языком описать, что он хочет получить на выходе.

 Источник изображений: Apple

Источник изображений: Apple

MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для задач различной сложности, связанных с редактированием изображений: можно добавлять различные объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя, а затем «представляет себе», как будет выглядеть изменённая в соответствии с ними картинка.

В описывающей MGIE статье приводятся несколько примеров её работы. Когда модели дали на редактирование фото пиццы и предложили «сделать её более здоровой», та добавила овощную начинку. Далее ей предложили излишне тёмный снимок гепарда в пустыне и предложили «добавить контраста, имитируя больше света» — изображение стало ярче. MGIE доступна для бесплатного скачивания на GitHub, а опробовать её в работе можно на платформе Hugging Face Spaces. В Apple не уточнили, каковы планы компании в отношении модели вне исследовательского проекта.

Редактирование изображений поддерживается некоторыми ИИ-генераторами, включая OpenAI DALL-E 3; функции генеративного ИИ присутствуют и в Photoshop благодаря модели Adobe Firefly. Apple не позиционирует себя как крупного игрока в области ИИ в отличие от Microsoft, Meta или Google, но недавно гендиректор компании Тим Кук заявил, что в этом году производитель добавит на свои устройства новые функции ИИ. В минувшем декабре компания выпустила открытую платформу MLX для обучения ИИ-моделей на чипах Apple Silicon.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Twitter официально переехал на домен X.com 3 ч.
Google выпустил вторую бету Android 15 с «Личным пространством», предиктивным «Назад» и множеством других нововведений 11 ч.
Новая статья: Animal Well — колодец, из которого не хочется вылезать. Рецензия 11 ч.
В России готовы взяться за борьбу с серым импортом видеоигр 11 ч.
Microsoft начала веерные остановки подписок на свои облачные продукты для российских корпоративных клиентов 11 ч.
Лучше поздно, чем никогда: Arkane Austin всё-таки выпустит финальное обновление Redfall 12 ч.
МТС открыла магистратуру по искусственному интеллекту в Высшей школе экономики 14 ч.
Sony пригрозила 700 компаниям судом за несанкционированное использование музыки для обучения ИИ 15 ч.
Ubisoft отреагировала на слухи о требованиях Assassin's Creed Shadows к постоянному онлайн-подключению 15 ч.
Следующая Call of Duty на старте продаж станет доступна в Game Pass 17 ч.
Раскладушки Motorola Razr 50 и Razr 50 Ultra получат большие внешние экраны и свежие процессоры 4 мин.
Летающими электромобилями XPeng можно будет управлять без особых разрешений, но только за пределами городов 5 ч.
Слухи: Apple готовит сверхтонкий iPhone 17 — он выйдет в 2025 году и будет дороже iPhone 17 Pro Max 8 ч.
Крупнейший в России оператор ЦОД и облачных услуг «РТК-ЦОД» готовится к IPO 13 ч.
Palit представит на Computex видеокарту с водоблоком и воздушной системой охлаждения 14 ч.
Роборуки от MIT помогут астронавтам NASA встать после падения на Луне 14 ч.
Xiaomi представила смартфон среднего уровня Redmi Note 13R — он почти идентичен Redmi Note 12R 15 ч.
AT&T и AST SpaceMobile обеспечат спутниковой связью обычные смартфоны сначала в США, а после — по всей Земле 15 ч.
TSMC будет выпускать основания для стеков HBM4 по 12- и 5-нм техпроцессам 17 ч.
LG свернула производство рулонных телевизоров Signature OLED R 17 ч.