Сегодня 25 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → изображение
Быстрый переход

Изобразительная нейросеть Kandinsky 3.1 стала доступна для всех пользователей

«Сбер» объявил о доступности для всех пользователей без ограничений улучшенной модели генеративной нейросети Kandinsky 3.1, представленной ранее в этом месяце. ИИ-сервис позволяет создавать изображения по текстовому описанию на русском и английском языках. Сообщается, что обновлённая версия была дообучена на датасете эстетичных изображений, что позволило повысить качество генерации картинок.

 Источник изображения: «Сбер»

Источник изображения: «Сбер»

Кроме того, благодаря новому подходу к обучению и использованию качественного датасета значительно улучшилась функция Inpainting для редактирования отдельных фрагментов изображения.

Как сообщает «Сбер», у пользователей также появилась возможность воспользоваться в Telegram-боте в том числе быстрой моделью Kandinsky 3.1 Flash. Время генерации изображений с её помощью уменьшилось по сравнению с базовой версией более чем в 10 раз.

По словам разработчика, в ближайшее время будут добавлены инструменты создания изображений в формате 4K, функции создания вариаций изображения, смешивания нескольких графических файлов, смешивания картинок и текстов, генерации стикерпаков, а также возможность внесения локальных правок изображения без изменения всей композиции сцены (ControlNet). Кроме того, вскоре все пользователи смогут протестировать обновлённую версию модели генерации видео по тексту Kandinsky Video 1.1.

OpenAI отключила генератор изображений DALL-E 2 — его место займёт более продвинутый DALL-E 3

Компания OpenAI продолжает активно развивать свои генеративные алгоритмы, делая их более совершенными и удобными для пользователей. На этом фоне разработчики объявили о закрытии нейросети DALL-E 2, которая дебютировала в апреле 2022 года и позволяла создавать качественные изображения на основе текстовых описаний. Этого следовало ожидать, поскольку OpenAI уже выпустила более совершенный алгоритм DALL-E 3.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Алгоритм DALL-E 3 получил полную интеграцию с ИИ-ботом ChatGPT, что способствовало формированию более простого пользовательского интерфейса и созданию более качественных изображений. Начать взаимодействие с ChatGPT в DALL-E 3 можно буквально в пару кликов. Что же касается DALL-E 2, то очевидно, что нейросеть безвозвратно уходит в прошлое.

«Мы больше не допускаем новых пользователей к DALL-E 2. DALL-E 3 позволяет создавать изображения более высокого качества, лучше обрабатывает запросы, и мы начали внедрять в него функцию редактирования изображений. Он доступен пользователям ChatGPT Plus, Teams и Enterprise, а также через API OpenAI», — говорится в сообщении разработчиков на странице DALL-E 2.

Вместе с появлением сообщения от разработчиков со страницы исчезла форма для ввода текстовых описаний. Доступ к сгенерированным ранее изображениям на данный момент есть, но не исключено, что позднее это изменится. OpenAI предупреждала о предстоящем закрытии доступа к алгоритму ещё в начале года, поэтому для пользователей нейросети этот шаг не должен стать чем-то неожиданным.

Meta✴ добавила ИИ-генерацию изображений в реальном времени в WhatsApp — пока в тестовом режиме

Компания Meta начала тестировать в мессенджере WhatsApp генератор изображений Meta AI на базе искусственного интеллекта. Пока новая функция доступно только пользователям из США. Она работает в режиме реального времени: как только пользователь начинает добавлять в запрос детали для создания картинки, он сразу же видит, как изображение меняется в соответствии с указанными деталями.

 Источник изображения:  pexels.com

Источник изображения: pexels.com

В примере, предоставленном Meta, пользователь составляет запрос: «Представь игру в футбол на Марсе» (Imagine a soccer game on mars). С каждым написанным словом ИИ добавляет новые детали в генерируемое изображения, сначала показывая обычных игроков в футбол на обычном поле, а затем меняет его на пейзаж Марса. Пользователи, получившие доступ к бета-версии ИИ-генератора изображения в WhatsApp, могут попробовать новую функцию сами. Запрос необходимо делать на английском языке, начиная со слова «Imagine».

Компания Meta также сообщила, что её языковая модель Llama 3, на которой построен ИИ-генератор, способна создавать «более чёткие и качественные» изображения и лучше отображать текст. Пользователи также могут делать для Meta AI запрос для анимации любого предоставленного ими изображения. ИИ сгенерирует из статичной картинки GIF-изображение, которым можно будет поделиться с друзьями.

Помимо мобильного приложения WhatsApp, функция ИИ-генерации изображений в реальном времени также стала доступна для пользователей веб-версии платформы Meta AI, но пока тоже только из США.

Intel выпустила XeSS 1.3 — в ней пересмотрены уровни масштабирования изображения

Компания Intel выпустила новую версию своей технологии масштабирования изображения XeSS и сообщила, что поддержка XeSS теперь реализована в более чем 100 различных играх.

 Источник изображений: Intel

Источник изображений: Intel

Новейшая версия технологии масштабирования XeSS 1.3 обеспечивает более высокую производительность по сравнению с предыдущей версией. Однако следует уточнить, что в новой версии были изменены профили масштабирования изображения. Иными словами, хотя компания заявляет о повышении производительности у XeSS 1.3, этот прирост достигается за счёт меньшего разрешения (более высокого уровня масштабирования), а не благодаря той же оптимизации кода самой XeSS.

В новую версию XeSS 1.3 компания добавила алгоритм с новой ИИ-моделью, которая, как заявляется, обеспечивает отображение более визуально сложных элементов, лучшую реконструкцию изображения, улучшенное сглаживание, уменьшение ореолов вокруг объектов и повышенную временную стабильность.

В XeSS 1.3 также представлены два дополнительных профиля настроек масштабирования: Ultra Performance и Ultra Quality Plus. Первые максимально повышают производительность за счёт снижения качества изображения, а вторые призваны минимизировать снижение качества картинки за счёт снижения производительности. Кроме того, в XeSS 1.3 представлена технология Native Anti-Aliasing, являющаяся аналогом Nvidia DLAA и представляющая собой сглаживание без масштабирования.

Как уже говорилось выше, XeSS 1.3 использует иные уровни масштабирования. Настройки «Ultra Quality» теперь обеспечивают масштабирования в 1,5 раза вместо 1,3, в свою очередь настройки «Quality» предлагают масштабирование в 1,7 раза вместо 1,5. Настройки «Balanced» масштабируют картинку в 2,0x вместо 1,7x, «Performance» — 2,3x вместо 2,0x, а «Ultra Performance» масштабирует изображения в три раза.

Intel также приводит несколько сравнений технологий масштабирования XeSS 1.2 и XeSS 1.3. Однако учитывая, что каждый профиль настроек XeSS 1.3 был изменён просто за счёт изменения разрешения, это сравнение может показаться бессмысленным. И всё же окончательные выводы можно будет делать после того, как XeSS 1.3 станет доступна в играх, и можно будет сравнить эффективность профилей настроек обеих технологий, их производительность и, что важнее, обеспечиваемое ими качество изображения.

Intel сообщила, что выпустила новую версию SDK с поддержкой XeSS 1.3, поэтому игровые разработчики уже могут приступать к интеграции новой технологии в свои проекты.

ИИ Meta✴ оказался неспособен рисовать азиатов вместе с представителями других рас

Разработанный Meta генератор изображений на основе искусственного интеллекта вслед за Google Gemini продемонстрировал неожиданное отношение к расовому вопросу. Созданная гигантом соцсетей система оказалась почти неспособной изображать азиатов совместно с представителями других рас, обратила внимание журналистка The Verge Миа Сато (Mia Sato), которая сама является азиаткой.

 Источник изображений: ***

Источник изображений: Meta

Она несколько десятков раз обращалась к созданному Meta ИИ-генератору изображений, используя такие запросы как «мужчина-азиат и друг-европеец», «муж-азиат и жена с европейскими чертами лица», «азиатская женщина и муж-европеец». И лишь однажды система смогла точно изобразить предложенных ей представителей рас. Вариации запросов ситуацию не спасли. Команда «азиатский мужчина и белая женщина, улыбающиеся с собакой» привела к появлению трёх подряд изображений двух людей азиатской расы. Замена слова «белая» на «европейка» дала тот же результат. По запросу «мужчина-азиат и женщина-европейка в день свадьбы» ИИ предложил изображение мужчины-азиата в костюме и женщины-азиатки в традиционной одежде — причём это было нечто среднее между китайским платьем ципао и японским кимоно.

Перемены не наступили и с переходом в плоскость платонических отношений. По запросам «азиатский мужчина с европейским другом» и «азиатская женщина и белая подруга» генератор изображений Meta снова предложил одних азиатов. Двух азиатских женщин система предложила и по запросу «азиатская женщина с темнокожей подругой». Адекватный ответ появился лишь по запросу «женщина-азиатка с подругой-афроамериканкой». Не очень помогла и смена региона. По запросу «мужчина из Южной Азии с женой-европейкой» ИИ сначала представил корректное изображение, но за ним по тому же запросу последовала картинка с двумя представителями Южной Азии. Причём система обращался к стереотипам, украшая южноазиатских женщин бинди (красными точками на лбу) и сари (традиционной в Индии женской одеждой).

 Только одна попытка изобразить азиатку с подругой-афроамериканкой увенчалась успехом

Только одна попытка изобразить азиатку с подругой-афроамериканкой увенчалась успехом

Стоит отметить, что под «азиатскими женщинами» ИИ Meta понимает образы светлокожих женщин из Восточной Азии, хотя самой густонаселённой страной в Азии является Индия. Причём азиатские мужчины, принадлежащие, по мнению генератора изображений, к той же этнической группе, иногда оказываются пожилыми, зато женщины всегда изображаются молодыми.

Meta комментариев по данному вопросу пока не предоставила. К слову, жена главы компании Марка Цукерберга (Mark Zuckerberg), представителя европейской расы, — Присцила Чан (Priscilla Chan), по происхождению является китаянкой.

«Сбер» представил дообученный генератор изображений Kandinsky 3.1

«Сбер» официально представил усовершенствованную версию своей генеративной нейросети Kandinsky 3.1, которая позволяет создавать изображения по текстовому описанию на русском и английском языках. Обновлённый алгоритм дообучен на увеличенном наборе изображений, за счёт чего удалось повысить качество генераций.

 Источник изображения: sberbank.ru

Источник изображения: sberbank.ru

Одна из главных особенностей новой версии алгоритма заключается в повышении скорости генерации изображений. По данным компании, время создания одной картинки сократилось почти в 10 раз, а разрешение генераций можно повысить до формата 4K. В дополнение к этому пользователи теперь могут задействовать функцию улучшения текстового запроса с помощью языковой модели. Доступны функции создания разных вариантов изображений, смешивание картинок и текста, создание стикерпаков, а также возможность внесения локальных изменений на изображении без смены всей композиции.

Вместе с этим «Сбер» анонсировал скорое появление алгоритма Kandinsky Video 1.1, предназначенного для генерации видео по текстовому описанию. Разработчики сумели существенно повысить качество генераций благодаря увеличению объёма используемого для обучения датасета пар «текст-видео», а также изменениям в архитектуре модели. Внесённые изменения позволили повысить разрешение видео вдвое в сравнении с возможностями алгоритма Kandinsky 1.0. Модель разработана специалистами Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.

Nvidia и Shutterstock запустили ИИ-генератор 3D-моделей Edify

Архитектура визуального генеративного искусственного интеллекта Nvidia Edify вышла на новый уровень — она предложила генерацию 3D-объектов по текстовому описанию. Возможности платформы заинтересовали Shutterstock, Getty Images, Adobe, HP, Mattel и других партнёров Nvidia.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Фотобанк Shutterstock открыл ранний доступ к API на основе архитектуры Edify — платформа позволяет художникам создавать трёхмерные объекты или целые сцены по текстовому описанию. Разработчики смогут протестировать возможности предварительно обученных моделей ИИ на архитектуре Edify с использованием данных Getty Images и Shutterstock по API через набор микросервисов Nvidia NIM. Обученная на лицензионном контенте Shutterstock модель обладает встроенными средствами фильтрации генерируемого контента; поддерживается экспорт в наиболее популярные 3D-форматы. Доступно также обучение и развёртывание специализированных моделей генеративного ИИ на архитектуре Edify при помощи платформы Nvidia Picasso на ресурсах Nvidia DGX Cloud.

Предложенный Shutterstock 3D-генератор заинтересовал компанию HP: созданные по текстовому описанию объекты можно преобразовывать в модели для 3D-принтеров HP с возможностью их последующего вывода на печать. Проект оказался полезным и компании Mattel: инструменты ИИ помогают дизайнерам визуализировать свои идеи для создания новых игрушек посредством текстовых команд, снижая тем самым технический барьер при разработке дизайна. На архитектуре Nvidia Edify также работает запущенный Adobe генератор 3D-изображений для пользователей сервисов Firefly и Creative Cloud.

Технологическая консалтинговая компания Accenture Song, которая уже развернула в работе платформу Nvidia Omniverse, также внедрила решения Edify для создания при помощи текстовых команд 3D-сцен в реалистичной среде для цифрового двойника автомобиля Land Rover Defender.

Фотобанк Getty Images на январской выставке CES анонсировал API на базе Nvidia Edify — этот инструмент позволяет добавлять, удалять или заменять объекты на изображениях, и теперь эти функции доступны на платформах Gettyimages.com и iStock.com. С мая Getty Images предложит услуги по индивидуальной настройке модели Edify Foundation в соответствии с брендом и визуальным стилем выступающей заказчиком компании. Эти сервисы работают без необходимости использовать программный код: клиент сможет загрузить собственный набор данных, свериться с автоматически генерируемыми тегами, сформировать задачи по тонкой настройке модели и просмотреть результаты перед их окончательным развёртыванием. Наконец, Getty Images предложит средства API для точного контроля над выводом изображений: платформа сможет генерировать изображения по эскизам, контролируя глубину цвета и сегментируя фрагменты изображения для работы с каждым объектом сцены в индивидуальном порядке.

Midjourney теперь можно показать персонажа, чтобы он повторял его на генерируемых изображениях

Основанный на искусственном интеллекте генератор изображений Midjourney 6, доступный сейчас только в рамках альфа-тестирования на платформе Discord, предложил новую функцию «образец персонажа» (Character Reference), позволяющую зафиксировать один образ на разных созданных платформой изображениях.

 Источник изображения: youtube.com/@curtispyketech

Источник изображения: youtube.com/@curtispyketech

Чтобы задать образец, пользователь Midjourney может указать одну или несколько ссылок на картинку с интересующим его персонажем или загрузить его на платформу, и генератор будет учитывать эти данные при получении команды. Администрация сервиса отметила, что новая функция предназначается в первую очередь для персонажей, созданных ИИ. «Для реальных людей/фотографий она не предназначена», — заявил администратор Midjourney Discord и добавил, что это, «скорее всего, исказит их, как это делают обычные запросы на изображения».

Но пользователи платформы, конечно, не смогли не попробовать. Один из них загрузил в качестве образца фотографию футбольной звезды Криштиану Роналду (Cristiano Ronaldo), и результаты действительно сильно напоминали известного спортсмена. Функция пока тестируется, но уже демонстрирует убедительные результаты: доступен также параметр «силы» (strength), то есть степени соответствия образца и результата генерации.

Новая функция вызывает два противоположных этических вопроса. С одной стороны, возможность задать образец персонажа облегчит недобросовестным пользователям создание убедительных дипфейков. С другой, исключение отсылок на работы художников может вызвать проблемы с авторскими правами, если пользователи захотят коммерциализировать или опубликовать творения Midjourney.

Один апскейлинг на всех: Microsoft анонсировала DirectSR для унификации подходов Nvidia, AMD и Intel

Несколько дней назад сообщалось, что компания Microsoft разрабатывает некую технологию под названием DirectSR. На тот момент было выдвинуто предположение, что речь идёт об универсальной технологии масштабирования изображения в играх, которая будет поддерживаться всеми производителями видеокарт. К сожалению, DirectSR не является универсальным апскейлером.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

В Microsoft объяснили, что DirectSR — это новый API, предназначенный для игровых разработчиков. Он призван упростить и сделать более универсальным процесс интеграции уже существующих и будущих технологий масштабирования в игровые проекты.

DirectSR был разработан при поддержке ведущих производителей видеокарт в лице NVIDIA и AMD. Новый API собираются представить на конференции GDC 2024 в марте. DirectSR охватывает ключевые функции и особенности, присущие всем технологиям временного масштабирования. В большинстве случаев речь здесь идёт о векторах движения, буферах глубины и цвета, метках реакции и экспозиции. Для эффективной работы апскейлера в игре эти переменные (в случае той же AMD FSR) должны быть распределены между игровыми кадрами. Судя по всему, другие существующие технологии временного масштабирования имеют аналогичные требования и ключевые особенности. DirectSR с одной стороны сделает процесс интеграции различных апскейлеров более универсальным, а с другой — позволит расширить количество переменных для их использования в составе других возможных будущих технологий масштабирования.

«Мы рады анонсировать DirectSR — наш новый API, разработанный при поддержке производителей GPU и предназначенный для упрощения процесса интеграции технологий масштабирования (Super Resolution, SR) в новое поколение игр. Масштабирование изображения является передовой технологией, которая не только увеличивает разрешение в играх, но также позволяет повысить их визуальное качество. DirectSR представляет собой то недостающее звено, которого не хватало разработчикам игр при интеграции апскейлеров для обеспечения наиболее эффективного и плавного игрового процесса независимо от того или иного аппаратного обеспечения. Этот API позволяет использовать технологии масштабирования от разных вендоров через общий набор входных и выходных данных и с помощью одного пути выполнения кода активировать в играх различные решения, включая NVIDIA DLSS Super Resolution, AMD FidelityFX Super Resolution и Intel XeSS. API DirectSR скоро станет доступен в качестве превью-версии в составе пакета Agility SDK для тестирования и отзывов со стороны разработчиков игр», — сообщила Microsoft на своём сайте.

На данный момент самыми популярными технологиями масштабирования являются NVIDIA DLSS2 и DLSS 3 (закрытые технологии, работающие только на видеокартах GeForce RTX), AMD FSR 2 и FSR 3 (обе являются открытыми технологиями), а также Intel XeSS (так и не стала открытой, несмотря на обещания Intel). Также можно выделить TSR в составе Unreal Engine, которая тоже может получить поддержку DirectSR.

Tecno представила систему обработки изображений PolarAce c сенсором Sony

Бренд смартфонов и умных устройств Tecno представил на выставке MWC 2024 новую технологию обработки изображений Tecno PolarAce, которая будет доступна в смартфоне Tecno Camon 30 Premier 5G во втором квартале 2024 года.

Tecno PolarAce использует возможности процессора обработки изображений Sony CXD5622GG на основе вычислений с плавающей запятой, датчики изображения Sony Lytia, технологию получения изображений с несколькими оттенками кожи Tecno Universal Tone, а также новейшие технологии ИИ-визуализации Tecno.

Процессор Sony CXD5622GG выполняет искусственное шумоподавление и оптимизацию качества изображения на каждом кадре видео, обеспечивая чёткость динамичных кадров, контрастность, восстановление точных оттенков цветов и повышение качества видеозаписи даже в условиях недостаточного освещения. Благодаря поддержке вычислений с плавающей запятой производительность процессора составляет 4,6 Тфлопс на вычислениях FP16.

Разработка Tecno PolarAce была бы невозможна без сотрудничества с Sony Lytia, чьи CMOS-датчики созданы специально для улучшения возможностей мобильной съёмки.

Tecno PolarAce оптимизирует цветопередачу благодаря новой технологии Tecno Universal Tone, осуществляющей мобильную обработку изображений на основе ИИ для улучшения передачи текстуры и цвета кожи, а также других особенностей различных национальностей по всему миру. В её усовершенствовании участвовали учёные-колористы из различных университетов мира, а недавно собранные и проанализированные данные были интегрированы в систему искусственного интеллекта Universal Tone.

Также Tecno PolarAce дополнена функциями на базе ИИ. Встроенный портретный модуль AIGC (AI Generated-Content), позволяет генерировать изображения в любом сеттинге без загрузки стороннего приложения. А AI One Click Erase от Tecno позволяет одним движением удалять лишние объекты на фото.

Система обработки изображений Tecno PolarAce будет доступна в смартфоне Tecno Camon 30 Premier 5G, выход которого запланирован на II квартал 2024 года.

Camon 30 Premier 5G оснащён перископическим телеобъективом с эквивалентным фокусным расстоянием 70 мм и гибридным 60х зумом, обеспечивающим передачу естественных света и тени без размытия или обрезки кадра, а также снижающим шумы при ночной съёмке.

Смартфон построен на восьмиядерном 4-нм процессоре MediaTek Dimensity 8200 Ultimate 5G с графическими ускорителями Arm Mali-G610 MC6 и Imagiq 785 AI. LTPO-экран с разрешением 1,5К с пиковой яркостью 1400 кд/м2 и цветопередачей миллиона цветов является самым продвинутым в серии Camon.

Microsoft вскоре представит DirectSR — универсальную технологию апскейлинга для игр

В рамках грядущей конференции для игровых разработчиков GDC 2024, которая официально стартует 23 марта, компания Microsoft представит новую технологию масштабирования DirectSR или Direct Super Resolution.

 Источник изображений: VideoCardz

Источник изображений: VideoCardz

Подробности о новой технологии пока остаются неизвестными, но предполагается, что DirectSR станет универсальной программной технологией масштабирования изображения для видеокарт, реализованной на уровне операционной системы Windows и работающей при поддержке графических ядер. Каких именно графический ядер — Microsoft объяснит в марте.

Весьма вероятно, что основная цель технологии DirectSR заключается в обеспечении универсальной совместимости с новейшими архитектурами графических процессоров, которые уже поддерживают собственные технологии масштабирования Intel XeSS, AMD FSR и NVIDIA DLSS. Примеры тех же AMD FSR и Intel XeSS показывают, что такие технологии не обязательно привязаны к видеокартам тех или иных вендоров, и могут работать на оборудовании сторонних разработчиков, хотя их эффективность при этом может сильно отличаться.

В настоящее время разработчикам игр приходится добавлять каждую технологию масштабирования в свои игры по отдельности. Microsoft же со своей стороны может представить технологию, которая будет поддерживаться всеми современными архитектурами GPU одновременно и которую будет значительно проще реализовать в играх.

Презентация Microsoft запланирована на 21 марта. Вместе с Microsoft в ней примут участие представители компаний AMD и NVIDIA. Недавно из утечек также стало известно, что Microsoft работает над внедрением в Windows 11 новой функции масштабирования под названием Auto SR.

На данный момент непонятно, связана ли Auto SR каким-то образом с DirectSR. Однако из доступного описания следует, что она использует для работы алгоритмы ИИ.

TECNO представит на MWC 2024 технологию обработки изображений на базе ИИ и чипа собственной разработки

Бренд смартфонов и умных устройств TECNO представит 27 февраля на выставке MWС 2024 в Барселоне технологию обработки изображений TECNO PolarAce для смартфонов, которая опирается на искусственный интеллект и чип собственной разработки производителя. Для компании это будет первая подобная проприетарная технология.

 Источник изображения: TECNO

Источник изображения: TECNO

В компании объясняют, что несмотря на все значительные достижения в области технологий мобильной съёмки, традиционным CPU по-прежнему не хватает вычислительной мощности, необходимой для создания видео максимально высокого качества. Современные решения по-прежнему не позволяют создавать плавные чёткие кадры в ночное время и имеют ограниченные возможности полноэкранного HDR. TECNO PolarAce за счёт использования новейших ИИ-технологий призвана устранить эти и другие распространённые проблемы, и удовлетворить постоянно растущие требования современных пользователей.

Вместе с технологией PolarAce для обработки изображений производитель представит на MWC новый флагманский ноутбук TECNO MEGABOOK T16 Pro 2024 Ultra, а также свои последние разработки в области искусственного интеллекта для смартфонов.

TECNO приглашает всех участников MWC 2024 посетить свой стенд и познакомиться со всем ассортиментом инновационных продуктов и технологий, основанных на искусственном интеллекте. Стенд расположен по адресу: 6B11, зал 6, Fira Gran Via.

Посетители смогут ознакомиться с TECNO PolarAce на стенде 27 февраля с 18:00 после официальной презентации. Желающие посетить мероприятие могут зарегистрироваться по ссылке.

Google экстренно чинит генератор изображений в Gemini — он переборщил с расовой инклюзивностью

Google сообщила, что на время частично приостановила работу генератора изображений в чат-боте Gemini, когда выяснилось, что она допускает исторические неточности в изображении людей, связанные с расовыми вопросами. Так, при попытке изобразить американских отцов-основателей и солдат нацистской Германии она как будто ниспровергает гендерные и расовые стереотипы, что расценивают как попытку фальсификации истории.

 Такими Gemini представляет себе американских отцов-основателей. Источник изображения: Google

Такими Gemini представляет себе американских отцов-основателей. Источник изображения: Google

Компания приняла решение направить генератор изображений Gemini на доработку менее чем через сутки после поступления первых жалоб. Пользователи чат-бота запрашивали у искусственного интеллекта картинки с историческими группами или лицами и получали на выходе изображения, на которых в основном были представители рас, отличных от европеоидной. Это спровоцировало появление в интернете теорий заговора, что Google намеренно избегает показывать белых людей.

 Сенатор США в 19-м веке по мнению Gemini. Источник изображения: Google

Сенатор США в 19-м веке по мнению Gemini. Источник изображения: Google

К примеру, когда Gemini попросили создать изображение американского сенатора XIX века, ИИ предложил картинки чернокожих женщин и женщин коренных американских наций. В действительности женщина впервые стала сенатором в США лишь в 1922 году, и она была белой. Таким образом, генератор изображений Gemini стирал историю расовой и гендерной дискриминации.

Сейчас, когда Gemini просят создать изображение человека или нескольких, тот выводит сообщение следующего содержания: «Мы работаем над улучшением способности генерировать изображения людей. Ожидаем, что эта функция скоро вернётся, и мы сообщим об обновлении выпуска, когда это произойдёт». Генератор изображений появился в чат-боте Gemini (ранее Bard) в начале месяца как ответ на аналогичные продукты OpenAI и Microsoft Copilot — он создаёт картинки по текстовому запросу.

Intel Lunar Lake получат технологию повышения резкости для своей встроенной графики Xe2

Intel ведёт разработку технологии улучшения графики в играх, которая будет использоваться встроенным графическим ядром будущих процессоров Lunar Lake, а также видеокартами на основе будущих архитектур Xe. Речь идёт об адаптивном фильтре изменения резкости изображения.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

Адаптивный фильтр резкости изображения в целом работает как обычный, использующийся сегодня в играх для повышения чёткости изображения. Однако он будет более интеллектуальным. Технология сможет повышать чёткость не для всего кадра игры в целом, а лишь в отдельных его областях (например, персонажи в кадре), избегая повышения резкости в областях изображения, где не требуется применение этого фильтра (например, задний фон). Как отметила инженер Intel Немеса Гарг (Nemesa Garg), новую технологию адаптивного фильтра резкости можно будет использовать не только в играх, но и в программах, а также для видео внутри операционной системы.

 Источник изображения: Intel

Источник изображения: Intel

За работу адаптивного фильтра резкости будет отвечать аппаратный блок Display Engine. Технология предназначена для работы на архитектуре графического ядра процессоров Lunar Lake и любых будущих версий графической архитектуры Xe. Фильтр имеет минимальные требования к энергопотреблению и практически не оказывает никакого влияния на производительность, что важно для Lunar Lake, поскольку речь идёт об энергоэффективных мобильных чипах.

Intel не сообщила точной информации о том, когда представит процессоры Lunar Lake. Но это практически наверняка случится во второй половине этого года. Указанные чипы появятся одновременно с настольными и мобильными процессорами Arrow Lake. И если в последних будет использоваться графическая архитектура Xe-LPG, то в Lunar Lake будет реализована более передовая графика Xe2-LPG.

Google выпустила передовой ИИ-генератор изображений Imagen 2 — он доступен отдельно и через Bard

Google представила передовой генератор изображений Imagen 2, который, как уверяет разработчик, отличается высоким реализмом и избавлен от свойственных системам искусственного интеллекта артефактов. Система доступна как в составе чат-бота Bard, так и в качестве отдельного сервиса ImageFX на платформе бета-тестирования AI Test Kitchen.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

Google всесторонне улучшила Bard: теперь в основе чат-бота лежит большая языковая модель Gemini Pro — она была представлена ещё в декабре, но до настоящего момента работала лишь у небольшой части пользователей. Теперь Gemini Pro доступна везде, где работает Bard — на всех поддерживаемых языках, во всех странах и на всех территориях.

Но чего в Bard пока не было, так это генератора изображений. Раньше компания уступала в этом сегменте как Bing Image Creator, так и Midjourney. Но с выходом Imagen 2 силы, похоже, сравнялись — эта нейросеть теперь работает и в составе чат-бота, и как отдельный сервис ImageFX. Правда, в последнем случае потребуется регистрация в программе AI Test Kitchen — наряду с MusicFX, качество которой Google тоже улучшила. ImageFX позволяет не только генерировать реалистичные изображения по текстовому описанию, но и редактировать их, в том числе изменяя стиль.

В компании подчеркнули, что созданные ImageFX изображения маркируются как созданные ИИ посредством метаданных и цифровых водяных знаков SynthID; если эти картинки появятся в поиске Google, то они получат соответствующую пометку и там. Модель Imagen 2 «предлагает изображения самого высокого на сегодня качества, а также улучшения в проблемных областях систем преобразования текста в изображение, таких как прорисовка реалистичных человеческих рук и лиц, избавляя картинки от отвлекающих визуальных артефактов», пояснил вице-президент подразделения Google DeepMind Эли Коллинз (Eli Collins). Разработчик также заверил, что принял защитные меры, которые не позволят платформе генерировать неприемлемый контент.


window-new
Soft
Hard
Тренды 🔥
Из Git в RuStore: «РеСолют» интегрировала платформу GitFlic с российским магазином приложений 36 мин.
Ожившая настольная игра Baladins с кооперативом на четверых предложит спасать мир от пожирающего время дракона — дата выхода и новый трейлер 42 мин.
Минцифры: доля Telegram в российском мобильном трафике составляет 10 % 2 ч.
Росфинмониторинг и банки научились отслеживать связи между банковскими операциями и криптовалютой 2 ч.
VK Play исполнилось два года: 16,4 млн активных пользователей, программы поддержки разработчиков и кое-что ещё 3 ч.
8К-гейминг: в турецких PS Store и Microsoft резко подорожали игры Electronic Arts 3 ч.
Meta не ждёт быстрой отдачи от генеративного ИИ 3 ч.
Аудитория Threads превысила 150 млн, и в США стала больше, чем у X 5 ч.
Meta подешевела на $200 млрд — инвесторам не понравились вложения в ИИ без явной отдачи 6 ч.
Метавселенная опять принесла Meta огромные убытки — в сумме на неё спустили более $45 млрд 7 ч.
Вычислительный модуль Raspberry Pi Compute Module 4S получил до 8 Гбайт ОЗУ 48 мин.
ЦОД на самообеспечении: Vantage намерена построить в Ирландии за $1 млрд кампус с собственной электростанцией 48 мин.
Корейские учёные научились быстро и просто выращивать искусственные алмазы — алмазные чипы уже рядом 2 ч.
США задумались о возможности ограничения Китаю доступа к открытой архитектуре RISC-V 2 ч.
Телескоп «Хаббл» отметил 34-ю годовщину работы красочным изображением туманности Гантель 5 ч.
Контрактное производство электроники в России выросло за прошлый год в полтора раза 5 ч.
Micron получит $6,1 млрд госсредств на строительство полупроводниковых заводов в США 5 ч.
Seagate: надёжность HAMR HDD ничуть не хуже, чем у PMR-дисков 5 ч.
Xiaomi набрала 75 723 заказа на электромобиль SU7 и к июню намерена выпускать по 10 000 машин в месяц 6 ч.
У Seagate упала квартальная выручка, но компания показала чистую прибыль 6 ч.