|
Опрос
|
реклама
Быстрый переход
YouTube начнёт автоматически улучшать видео низкого качества — от этого можно будет отказаться
29.10.2025 [23:10],
Николай Хижняк
YouTube анонсировал несколько новых функций, призванных улучшить качество просмотра на экранах телевизоров. В частности, YouTube начнёт автоматически масштабировать видео, загруженные с разрешением ниже 1080p, используя ИИ для повышения их до HD-разрешения, и планирует добавить поддержку масштабирования до 4K «в ближайшем будущем». При желании, авторы видео и зрители смогут отказаться от этой функции.
Источник изображения: Alexander Shatov / unsplash.com «Авторы сохранят полный контроль над своей библиотекой, поскольку исходные файлы и исходное разрешение видео будут сохранены без изменений, с чёткой возможностью отказаться от этих улучшений. А зрители по-прежнему смогут смотреть видео создателей в исходном загруженном разрешении, поскольку выбор суперразрешения будет чётко указан в настройках», — говорится в объявлении YouTube. Как сообщила The Verge представитель YouTube Вероника Наваррете (Veronica Navarrete), автоматическое масштабирование будет применяться только к видео, загруженным с разрешением от 240p до 720p. Это означает, что функция не будет применяться к старым видео, которые авторы или каналы уже самостоятельно оцифровали до 1080p. Почти каждый крупный бренд телевизоров предлагает свою собственную технологию масштабирования с использованием ИИ. Nvidia также предлагает аналогичную функцию на своих устройствах для потоковой передачи Shield TV. Однако возможность отказа от использования этой функции на YouTube примечательна, поскольку авторы видео нередко жалуются на то, что платформа применяет улучшения к их видео без их согласия, что иногда приводит к нежелательным визуальным искажениям. YouTube также увеличит текущий лимит размера миниатюр для видео с 2 до 50 Мбайт для поддержки изображений 4K. Также платформа в настоящее время тестирует загрузку видео большего размера с участием отдельных авторов. В видеороликах с тегами товаров зрители смогут быстро купить всё, что им понравится, отсканировав QR-код на экране телевизора с помощью телефона, который перенаправит их прямо на страницу товара. YouTube также тестирует возможность для авторов показывать товары в определённые моменты своих видео. Обновления также включают иммерсивные превью на главной странице, которые упрощают просмотр любимых каналов YouTube, и улучшение качества контекстного поиска на телевизоре, когда зрители ищут контент со страницы канала автора. Теперь приоритет отдаётся видео с этого канала, а не контенту со всей платформы. В Adobe Express появился ИИ-помощник, способный самостоятельно редактировать проекты
28.10.2025 [20:00],
Владимир Фетисов
Облачная платформа для дизайнеров Adobe Express получила новые функции на базе искусственного интеллекта. Наиболее заметным выглядит появление ИИ-помощника, который может преображать пользовательские проекты на основе простого текстового описания. Разработчики уверены, что этот инструмент «расширит возможности людей с любым уровнем навыков» создания визуального контента без необходимости разбираться в специальных дизайнерских терминах и инструментах.
Источник изображения: Adobe ИИ-помощник доступен в веб-приложении Adobe Express. Для начала взаимодействия с ним достаточно активировать соответствующую опцию в левом верхнем углу рабочего пространства. После активации обычный интерфейс домашней страницы и панели инструментов изменится на текстовое поле, подобное тому, что можно увидеть при работе с каким-либо чат-ботом. Здесь же можно найти дополнительные опции генерации нового дизайнерского проекта или редактирования уже существующих изображений. ИИ-помощник может сгенерировать подборку готовых пресетов на основе текстового описания. После этого пользователь может выбрать один из предложенных вариантов и продолжить его редактирование посредством запросов на естественном языке. Для тех, кто не имеет опыта работы с дизайнерскими инструментами, ИИ-помощник способен выполнять корректировки на основе расплывчатых запросов, таких как «сделай лучше» или «придумай тему». В дополнение к этому можно указать отдельные части концепции для их корректировки, например заменить фон, шрифты или какие-то другие элементы. ИИ-помощник в Adobe Express в процессе работы взаимодействует с разными источниками, включая библиотеку шрифтов и стоковых изображений Adobe. Он также может генерировать изображения с нуля по текстовому описанию, для чего используется ИИ-модель Adobe Firefly. Пользователь может создать весь дизайн с помощью генеративных нейросетей или же задействовать их только в определённые моменты. ИИ-помощник также пригодится для выполнения задач, в которых требуется комбинировать инструменты, например, изменять размер и формат готовых проектов или преобразовывать их в анимации. ByteDance представила компактную ИИ-модель, которая превратит любое фото в качественную 3D-модель
27.10.2025 [11:42],
Владимир Мироненко
ByteDance, материнская компания TikTok, представила ИИ-инструмент для создания 3D-контента Seed3D 1.0, с помощью которого на основе одного 2D-изображения можно создать полноценную 3D-модель уровня симуляции, с детальной геометрией, фотореалистичными текстурами и физически корректными материалами для рендеринга (PBR), в которых учтены реальные свойства отражения, преломления и рассеивания света.
Источник изображений: seed.bytedance.com По словам компании, основанный на архитектуре диффузионного преобразователя (Diffusion Transformer, DiT), сочетающей свойства диффузионных моделей и трансформеров, Seed3D 1.0 превосходит конкурентов как с открытым, так и с закрытым исходным кодом по качеству текстур и геометрической точности. Используя всего лишь 1,5 млрд параметров, Seed3D 1.0 превосходит даже более крупные модели, такие как Hunyuan3D 2.1 с 3 млрд параметров. Главная особенность нового ИИ-инструмента заключается в сочетании мультимодального диффузионного преобразователя (Multimodal Diffusion Transformer, MMDiT) и пошаговой стратегии генерации. Сначала система анализирует изображение с помощью визуально-языковой модели (Vision-Language Model, VLM) для извлечения объектных и пространственных параметров. Затем для каждого локализованного объекта Seed3D 1.0 синтезирует соответствующие геометрию и материалы. Финальная сцена собирается путём позиционирования каждого сгенерированного объекта в соответствии с пространственной конфигурацией, предсказанной VLM. Эта структура позволяет генерировать сцены в различных масштабах, от помещений, таких как офисы, до крупномасштабных городских сцен. Сообщается, что Seed3D 1.0 обеспечивает согласованность текстур при различных ракурсах. Вместо применения стандартных текстур ИИ-инструмент создаёт материалы, согласованные по виду, причём со всех ракурсов, обеспечивая как реализм, так и структурную точность для использования на уровне симуляции. Компания отметила, что модели, созданные с помощью Seed3D, можно напрямую интегрировать в платформы моделирования, такие как Isaac Sim, для обучения ИИ. ИИ-бот Google Gemini успешно конкурирует в области редактирования фото с инструментами Adobe
18.10.2025 [08:19],
Владимир Фетисов
В августе Google представила ИИ-модель Gemini 2.5 Flash Image, которая позволяет с высокой точностью контролировать процесс редактирования фотографий. Этот инструмент стал доступен всем пользователям приложения Gemini бесплатно, а разработчики могут задействовать соответствующий API для интеграции сервиса в свои продукты за относительно невысокую плату. За прошедшие с тех пор несколько месяцев алгоритм превратился в конкурента ИИ-инструментам для работы с медиаконтентом компании Adobe.
Источник изображения: Google Об этом пишет Business Insider со ссылкой на данные аналитической компании Appfigures, которая подсчитала, что по мере стремительного роста числа загрузок приложения Gemini после интеграции в него новых функций для редактирования изображений, количество скачиваний приложения Firefly, в котором реализованы ИИ-инструменты Adobe для генерации изображений и видео, постепенно снижается. Невозможно точно сказать, связаны ли эти два события между собой. По данным Appfigures, после запуска в июне приложение Firefly показало «впечатляющий» рост, а в августе количество его загрузок выросло на 150 % по сравнению с июлем. За тот же период количество скачивания Gemini выросло лишь на 20 %. Эта статистика включает в себя данные о загрузках приложений из магазинов Google Play Маркет и Apple App Store. После обновления приложения Gemini 26 августа, когда в нём появились новые возможности в плане ИИ-редактирования фото, количество загрузок Firefly упало более чем вдвое в течение следующей недели. В это же время количество скачиваний Gemini стремительно росло. По данным Appfigures, по состоянию на 6 октября количество загрузок Gemini выросло на 331 % по сравнению с последней неделей июля, тогда как количество скачиваний Firefly снизилось на 68 %, что стало самым низким показателям с момента обновления Gemini в августе. Для лучшего понимания масштабов следует учитывать, что на прошлой неделе Gemini скачивали на 6,1 млн раз больше, чем на неделе, когда в приложение была интегрирована новая ИИ-модель для точного редактирования фото. За этот же период количество скачиваний Firefly снизилось на 2 млн. Данные Appfigures по разным регионам указывают на то, что в США количество скачиваний Gemini в октябре подскочило на 88 % по сравнению с сентябрём. За этот же период популярность Firefly в стране упала на 82 %. Это указывает на то, что Gemini превращается в серьёзного конкурента в сфере обработки изображений. Китайцы создали «полароид» для астрономии — он делает мгновенные снимки Вселенной с рекордной точностью
17.10.2025 [21:10],
Геннадий Детинич
Китайские учёные из Университета Цинхуа (Tsinghua University) разработали инновационный оптический чип Yuheng (Rafael) размером с ноготь, способный анализировать свет в режиме реального времени с высочайшей спектральной точностью, ранее доступной лишь для громоздких лабораторных установок. На основе чипа они создают прибор для установки на Большой Канарский телескоп с самым большим в мире зеркалом — 10,4 м, и обещают революцию в астрономии и не только.
Источник изображения: Tsinghua University Разработка на несколько порядков ускорит сбор информации о Вселенной. Например, данные обо всех звёздах Млечного Пути, доступных для наблюдения в телескоп GTC (Gran Telescopio CANARIAS), с помощью прибора с чипом Rafael можно будет собрать менее чем за десять лет, тогда как в случае альтернативных наблюдений на это понадобятся несколько тысячелетий. Прорывная технология создана благодаря сочетанию знаний в области оптики, искусственного интеллекта и материаловедения, что позволило преодолеть традиционный компромисс между разрешением и эффективностью. Иначе говоря, либо данные получаются быстро, но с низким разрешением, либо — медленно, но с множеством деталей. Новая разработка позволит собирать данные с невообразимым разрешением в реальном времени и в компактном форм-факторе. Эта компактность может проявить себя также в роботизированном зрении, автопилотах и анализаторах чего угодно — от дистанционного зондирования состава почв коптерами до проверки качества продуктов на полках магазинов. Однако самым первым проектом китайской команды станет разработка оптического анализатора для крупнейшего в мире наземного телескопа с одним зеркалом — Большого Канарского телескопа, расположенного на Канарских островах в Испании. Китайские учёные посетили эту площадку в мае текущего года и договорились о партнёрстве. Этот телескоп используется для изучения звёзд, галактик, тёмной материи и чёрных дыр, и тестирование, о чём также заявлено в свежей публикации в журнале Nature, станет ключевым шагом на пути от лабораторного прототипа к практическому применению. Чип Yuheng демонстрирует выдающиеся характеристики: он способен различать цвета (обладает спектральной чувствительностью) с шагом менее 0,1 нм, обеспечивая разрешение в 100 раз выше, чем у аналогичных устройств для моментальной спектроскопии. Благодаря высокой скорости обработки — до 10 000 звёзд в секунду — технология позволит кратно сократить время наблюдений. Исследователи подчёркивают, что заявленная производительность достигается без значительных потерь света, что делает решение идеальным для интеграции в компактные системы. Принцип работы чипа Rafael основан на вычислительной оптике, где вместо традиционного расщепления света на спектральные компоненты применяется кодирование всего пучка света уникальным паттерном внутри устройства. Тем самым возникает явление интерференции между опорным и анализируемым потоком. В основе чипа лежит кристалл ниобата лития, который под напряжением способен изменять направление света, а для последующего декодирования и восстановления спектральной информации используются ИИ-алгоритмы. Весь анализ происходит на лету, без задержек. Чип пропускает 73 % входящего света и работает на скорости 88 кадров в секунду, минимизируя потери яркости и обеспечивая сверхвысокое цветовое разрешение в видимом и ближнем инфракрасном диапазонах. Потенциальные применения Yuheng выходят далеко за рамки астрономии: в медицине он позволит разрабатывать неинвазивные методы анализа тканей для диагностики (с проникновением в ткани в инфракрасном диапазоне), в сельском хозяйстве и экологии — определять загрязнители и качество почвы с помощью дронов, а в автономных автомобилях — точнее различать дорожные знаки, покрытие и препятствия в сложных условиях освещения. Роботы и медицинские сканеры также выиграют от такого «сверхзрения». В будущем команда сосредоточится на повышении стабильности чипа, интеграции встроенных вычислений для ускорения обработки данных и адаптации дизайна для широкого коммерческого и научного использования, тем самым обещая революцию в оптических технологиях. Microsoft представила первый ИИ-генератор изображений собственной разработки — MAI-Image-1
14.10.2025 [11:19],
Владимир Фетисов
Подразделение Microsoft AI, отвечающее за разработки в сфере искусственного интеллекта, анонсировало алгоритм MAI-Image-1 — первый ИИ-генератор изображений по текстовому описанию, полностью созданный внутри компании. Софтверный гигант, не так давно представивший свои первые ИИ-модели, назвал новый генератор изображений «следующим шагом на нашем пути».
Источник изображения: Microsoft Microsoft заявила, что собирала отзывы профессиональных создателей контента, чтобы избежать «повторяющихся или шаблонно-стилизованных результатов». Компания утверждает, что MAI-Image-1 «превосходно справляется» с созданием фотореалистичных изображений. Кроме того, алгоритм способен обрабатывать запросы и генерировать изображения быстрее, чем «более крупные и медленные модели». MAI-image-1 уже занял место в топ-10 рейтинга бенчмарка LMArena, пользователи которого могут сравнивать результаты работы разных нейросетей и выбирать лучшие из них. Алгоритм MAI-Image-1 присоединился к списку других ИИ-продуктов Microsoft, таким как генератор голоса MAI-Voice-1 и чат-бот MAI-1-preview. Microsoft была одним из первых и крупнейших инвесторов OpenAI, но со временем отношения между компаниями стали всё более сложными. На этом фоне Microsoft начала использовать ИИ-модели Anthropic для обеспечения работоспособности некоторых функций на платформе Microsoft 365, а также делать существенные инвестиции в разработку собственных нейросетей. FSR 4 заработала на старых Radeon — но качество и производительность слегка пострадали
13.10.2025 [18:20],
Николай Хижняк
Портал ComputerBase провёл глубокий анализ INT8-реализации технологии масштабирования FSR 4, ранее случайно утекшей в Сеть из-за ошибки AMD. Данная версия FSR 4 теоретически не требует видеокарты на архитектуре RDNA 4 (Radeon RX 9000), а потому может работать и на более старших поколениях видеокарт Radeon.
Источник изображений: ComputerBase В августе AMD по ошибке опубликовала исходный код технологии апскейлинга в играх FSR 4. Он был загружен в репозиторий на GitHub, но в последствии удалён. Несмотря на оперативное изъятие файлов, их копии уже распространились в открытом доступе. В опубликованных файлах были представлены веса моделей ИИ, которые сами по себе были малополезны для геймеров. Позже моддеры скомпилировали полноценные DLL-файлы, которые служили заменой оригинальным библиотекам и корректно работали с играми, поддерживающими предыдущие версии технологии масштабирования AMD. INT8-реализация технологии масштабирования FSR 4 считается неофициально совместимой с RDNA 2 и RDNA 3, поскольку эти архитектуры не поддерживают аппаратное ускорение FP8 (Floating Point 8-bit), формата, используемого видеокартами серии Radeon RX 9000. В результате обе версии FSR 4 различаются по производительности и качеству изображения. Хотя анализ ComputerBase в основном сосредоточен на оценке влияния INT8-реализации FSR 4 на частоту кадров, портал также подробно исследовал качество изображения, которое она обеспечивает. Журналисты установили, что утекшая в Сеть INT8-реализация FSR 4 обеспечивает немного менее стабильное изображение, чем официальная сборка FP8 для RDNA 4. Различия зависят от игры и сцены, но достаточно заметны в динамичных эпизодах. Мелкие детали, такие как заборы, крыши и растительность, как правило, мерцают сильнее на RDNA 2 и RDNA 3. В движении у таких персонажей, как Элой в Horizon Forbidden West, появляется больше артефактов, а листва выглядит менее чёткой. «Мы провели анализ нескольких игр, и вывод очевиден: FSR 4 для RDNA 4 визуально не соответствует утекшей в Сеть FSR 4 для RDNA 3 и RDNA 2. У первой есть преимущество, которое заметно в некоторых играх, но едва заметно в других. Однако есть и хорошая новость: FSR 4 Light стабильно выглядит значительно лучше FSR 3.1, пусть это и не такое уж большое достижение. Однако по визуальным причинам её всё равно стоит использовать, несмотря на отставание от версии FP8», — сообщает ComputerBase. В целом FSR 4 INT8 сохраняет многие преимущества алгоритма, но ей не хватает плавности и точности рендеринга версии FP8 для RDNA 4. Журналисты также опубликовали два видеосравнения, с которыми можно ознакомиться на их сайте. Что касается производительности, то она зависит от видеокарты. В среднем FSR 4 INT8 снижает частоту кадров примерно на 9–13 % на видеокартах RDNA 3 (Radeon RX 7800 XT) и RDNA 2 (Radeon RX 6800 XT), тогда как официальная версия FP8 на RDNA 4 (Radeon RX 9060 XT) демонстрирует снижение всего на 3–5 %. Наиболее заметна разница на Radeon RX 9060 XT — по сравнению с FSR 3.1 она составляет до 17 %. ![]() Производительность при использовании FSR 4 снижается при более низком исходном разрешении и агрессивных настройках — например, при выборе режима «Производительность» для масштабирования. В таких случаях в некоторых играх видеокарты на базе RDNA 2 даже превосходят модели RDNA 3, как, например, в Cronos. В других проектах, например в God of War Ragnarok, RDNA 3 имеют преимущество. Но в целом закономерность очевидна: архитектура RDNA 4 эффективно справляется с FSR 4, RDNA 3 демонстрирует умеренное снижение производительности с данной версией апскейлера, а RDNA 2 фактически работает на пределе своих возможностей. Модульная компактная экшн-камера DJI Osmo Nano показалась на фото до анонса
10.09.2025 [21:17],
Сергей Сурабекянц
Хотя DJI пока не делала официального заявления, утёкшие в интернет изображения подтверждают скорый выход модульной компактной экшн-камеры Osmo Nano, идейного продолжателя модели Action 2, дебютировавшей в 2021 году. Новинка DJI сохранила модульный принцип Action 2, например, экран с магнитным креплением, но при этом значительно меньше предшественницы — по размеру она ближе к Insta360 Go Ultra, анонсированной в прошлом месяце.
Источник изображения: The Product Village Вчера инсайдер Роланд Квандт (Roland Quandt) опубликовал официальные фотографии DJI Osmo Nano, на которых показан модуль камеры без собственного экрана с дополнительным модулем для съёмок в реальном времени или показа уже отснятого материала. Игр с FSR 4 станет куда больше: AMD выпустила FidelityFX SDK 2.0, что упростит интеграцию новейшего ИИ-масштабирования
21.08.2025 [21:14],
Николай Хижняк
Компания AMD выпустила FidelityFX SDK 2.0, тем самым открыв разработчикам игр доступ к своей технологии ИИ-масштабирования FSR 4 (FidelityFX Super Resolution 4). Теперь разработчики могут напрямую интегрировать FSR 4 в свои проекты, используя готовые подписанные DLL-библиотеки. Однако в будущем API AMD FidelityFX позволит обновлять FSR 4 через драйверы с помощью функции AMD FSR Upgrade.
Источник изображений: AMD Выпуск SDK открывает возможности для прямой интеграции AMD FSR 4 в игры. До сих пор поддержка FSR 4 зависела от API AMD FidelityFX, который использовался для обновления игр с FSR 3.1 до FSR 4. Вскоре игры смогут поддерживать технологию AMD FSR 4 по умолчанию. Это означает, что будущим проектам не потребуются драйверы, оптимизированные специально для FSR 4. Вместе с выпуском SDK для FSR 4 компания AMD представила новый плагин для Unreal Engine 5, который позволяет использовать FSR 4 в версиях Unreal Engine 5.1–5.6. «Обновление AMD FidelityFX SDK v2.0 включает в себя наш передовой алгоритм масштабирования на основе машинного обучения AMD FidelityFX Super Resolution 4 (FSR 4). Новый алгоритм масштабирования AMD FSR 4 с машинным обучением обучен на высококачественных игровых данных, полученных с помощью реального игрового процесса на графических процессорах AMD Instinct. FSR 4 использует аппаратно-ускоренные функции архитектуры AMD RDNA 4, разработанные для обеспечения максимального качества масштабирования и существенного прироста производительности. AMD FSR 4 обеспечивает значительное улучшение качества изображения по сравнению с масштабированием FSR 3.1 благодаря алгоритму на основе машинного обучения, разработанному для повышения временной стабильности, лучшей детализации и уменьшения ореолов. По сравнению с FSR 3.1 технология FSR 4 сокращает ореолы на движущихся объектах и устраняет артефакты на поверхностях, которые отсутствуют в исходном изображении. Это значительно улучшает качество картинки во время игры», — сообщает AMD в своём официальном блоге. ![]() Для поддержки технологии FSR 4 требуются видеокарты Radeon RX 9000 на архитектуре RDNA 4. «Космический виноград»: древняя галактика сломала представления учёных о процессах в ранней Вселенной
11.08.2025 [23:08],
Николай Хижняк
Астрономы обнаружили далёкую галактику, в которой, по всей видимости, расположены дюжины плотно упакованных областей звездообразования, из-за чего она напоминает виноградную гроздь. Результаты исследования были опубликованы 7 августа в журнале Nature Astronomy, пишет Space.com.
Художественное представление галактики «Космический виноград». Источник изображения: NSF/AUI/NSF NRAO/B.Saxton Из-за своей формы и структуры объект получил название «Космический виноград». Новое исследование показало, что во вращающемся диске галактики находится как минимум 15 массивных сгустков звездообразования, образующих нечто, напоминающее гроздь ярко-фиолетового винограда в космосе. Учёные полагают, что галактика сформировалась всего через 930 млн лет после Большого взрыва. Наблюдения проводились с помощью космического телескопа имени Джеймса Уэбба (JWST) и Атакамской большой миллиметровой/субмиллиметровой антенной решётки (ALMA) с применением метода гравитационного линзирования. В нём галактическое скопление RXCJ0600-2007, расположенное перед объектом, сыграло роль «увеличительного стекла» для более далёких структур. «Этот объект известен как одна из самых сильно гравитационно линзированных дальних галактик, когда-либо обнаруженных», — отметил руководитель исследования Сэйдзи Фудзимото (Seiji Fujimoto) в заявлении обсерватории Макдональда Техасского университета в Остине (UT Austin). «Благодаря этому мощному естественному увеличению в сочетании с наблюдениями, выполненными с помощью одних из самых современных телескопов мира, мы получили уникальную возможность изучить внутреннюю структуру далёкой галактики с беспрецедентной чувствительностью и разрешением», — добавил Фудзимото, начавший исследование в Техасском университете в Остине и ныне работающий в Университете Торонто. Для изучения «Космического винограда» учёные проанализировали более 100 часов телескопических наблюдений. Ранее полученные космическим телескопом «Хаббл» изображения предполагали наличие внутри неё гладкого вращающегося диска, однако высокое разрешение ALMA и JWST позволило увидеть гораздо более сложную картину — детальнейшее на сегодняшний день изображение внутренней структуры далёкой галактики и массивных сгустков плотного газа, готовых к звездообразованию.
Источник изображения: NASA/ESA/CSA/Fujimoto и др. Выше представлены изображения скопления галактик RXCJ0600-2007, полученные телескопом JWST в ближнем инфракрасном диапазоне, демонстрирующие мощный эффект гравитационного линзирования. Эти наблюдения с рекордным разрешением раскрыли структуру далёкой галактики ранней Вселенной, состоящей более чем из 15 компактных сгустков звездообразования, расположенных подобно виноградной грозди. «Наши наблюдения показывают, что в свете молодых звёзд некоторых ранних галактик доминируют несколько массивных, плотных, компактных скоплений, а не однородная звёздная структура», — отметил соавтор исследования Майк Бойлан-Колчин (Mike Boylan-Kolchin), профессор астрономии Техасского университета в Остине. По мнению исследователей, это открытие меняет представления о раннем формировании галактик. Оно впервые демонстрирует чёткую связь между их малыми внутренними структурами — в данном случае массивными сгустками звездообразования — и общим вращением, что позволяет предположить: многие ранее наблюдавшиеся как гладкие галактики на самом деле могут быть заполнены подобными скрытыми скоплениями звёзд. Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности
05.08.2025 [16:49],
Павел Котов
Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.
Источник изображения: huggingface.co/Qwen Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма. Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом. Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения. xAI запустила Grok Imagine — платный ИИ-генератор изображений и видео с «пикантным режимом»
04.08.2025 [19:36],
Сергей Сурабекянц
Компания xAI Илона Маска (Elon Musk) официально представила Grok Imagine — генератор изображений и видео, доступный для подписчиков тарифных планов SuperGrok и Premium+. Как и обещал Маск, позиционирующий Grok как ИИ, свободный от цензуры, Grok Imagine позволяет создавать контент, который обычно в интернете маркируется аббревиатурой NSFW (not safe/suitable for work — «небезопасно/неподходяще для демонстрации на работе»).
Источник изображения: @elonmusk Grok Imagine преобразовывает текстовые или графические запросы в 15-секундные видеоролики с оригинальным звуком и предлагает «пикантный режим», позволяющий пользователям создавать контент сексуального характера, включая частичную наготу. Пример такого видео опубликовал в своём аккаунте X Илон Маск. Журналисты TechCrunch сообщили, что многие из опробованных ими (во имя журналистики, конечно!) пикантных запросов привели к появлению «модерированных» размытых изображений, однако изображения полуобнажённых тел им получить удалось. NSFW-контент неудивителен для xAI, учитывая выход в прошлом месяце пикантного аниме-компаньона Ani с искусственным интеллектом. Но так же, как необузданная натура Grok была забавной, пока он не начал изрыгать оскорбительный, антисемитский и женоненавистнический контент, появление Grok Imagine может повлечь за собой свои непредвиденные последствия. При этом в Grok Imagine предусмотрены серьёзные ограничения, особенно учитывая, что модель позволяет создавать контент с изображениями знаменитостей. Так, попытки журналистов TechCrunch сгенерировать изображение беременного Дональда Трампа (Donald Trump) успехом не увенчались — Grok Imagine создавал либо изображения Трампа с младенцем на руках, либо рядом с беременной женщиной. Grok Imagine стремится конкурировать с такими игроками, как Google DeepMind, OpenAI, Runway и китайские нейросети, но пока находится на начальном этапе развития. По отзывам тестировщиков, генерируемые им изображения и видео людей нередко выглядят мультяшно, особенно из-за неестественной текстуры кожи. Тем не менее, генератор впечатляет: изображения создаются за считаные секунды и продолжают формироваться автоматически по мере прокрутки страницы. Затем их можно анимировать в стилизованные видеоролики. Пользовательский интерфейс удобен и интуитивно понятен. Недавно Маск заявил о намерении создать Baby Grok — чат-бот, пригодный для работы с детским контентом. Учитывая, насколько скандально развивается «взрослая версия» Grok, подобное направление экспансии довольно рискованно. Тем не менее, с точки зрения охвата аудитории эта ставка вполне может себя оправдать. Популярность Baby Grok может стать дополнительным источником дохода для xAI и новой статьёй расходов для родителей. Sony работает над трёхслойным датчиком изображения для фотокамер, который должен совершить революцию
02.08.2025 [13:11],
Владимир Фетисов
Подразделение Sony Imaging & Sensing Solution недавно провела встречу с инвесторами, в рамках которой представители направления Sony Semiconductor Solutions рассказали о перспективном трёхслойном датчике изображения, который обещает значительные улучшения при фото- и видеосъёмке. В настоящее время Sony выпускает матрицы для камер, основанные на двухслойной архитектуре.
Источник изображений: petapixel.com По данным источника, в рамках прошедшей встречи с инвесторами компания подвела итоги 2024 финансового года, в ходе которого были зафиксированы рекордно высокие продажи и операционная прибыль. Вместе с этим представители компании рассказали о дальнейших планах по развитию бизнеса. Sony намерена инвестировать значительные средства в новые технологии, связанные с производством датчиков изображения. Одним из направлений станет развитие направления многослойных матриц для камер. ![]() Sony уже использует многослойные датчики во многих камерах, но на данном этапе даже во флагманских моделях используются двухслойные матрицы. Речь идёт о датчиках, в которых один слой фотодиодов содержит все пиксели, используемые для съёмки изображений, а нижний транзисторный слой отвечает за обработку данных. Долгосрочные планы Sony по добавлению третьего слоя, по сути, означают расширение возможностей в плане обработки и повышения качества изображений. Чем выше вычислительная мощность матрицы, тем качественнее будут изображения при прочих равных условиях. ![]() По данным Sony, увеличение вычислительной мощности на уровне сенсора может улучшить видимый динамический диапазон, чувствительность, шумоподавление, эффективность, скорость считывания и разрешение, хотя последнее больше касается видео, а не фотосъёмки. Появление нового слоя само по себе не изменит разрешение, но увеличение скорости считывания и производительности может дать возможность съёмки видео более высокого качества. Существующие камеры с датчиками высокого разрешения, как правило, не могут использовать его в полной мере при съёмке видео как раз из-за проблем со скоростью обработки данных. ![]() Более высокая скорость считывания благоприятно повлияет на многие аспекты работы камер, в том числе в режиме скользящего затвора, при скоростной серийной съёмке, а также повысит эффективность автофокуса. Повышение производительности может улучшить видимый динамический диапазон, но на практике динамический диапазон сенсора зависит от многих факторов, включая полную ёмкость пикселей матрицы и её шумовые характеристики. Хотя обработка и влияет на уровень шума, полная ёмкость пикселей остаётся неизменным физическим состоянием, из-за чего добавление ещё одного слоя может привести к снижению этого показателя в результате сжатия размеров пикселей. ![]() Вопрос о том, когда трёхслойный датчик изображения может появиться в флагманских камерах Sony, остаётся открытым. Однако история компании говорит о том, что она умеет создавать инновационные матрицы и быстрые сенсоры с высоким разрешением. Sony остаётся привержена разработке полнокадровых датчиков, что позволяет с оптимизмом смотреть в будущее фото- и видеосъёмки. Photoshop сделал редактирование объектов и людей на фото удивительно простым
30.07.2025 [15:53],
Николай Хижняк
Компания Adobe запустила новые функции генеративного ИИ для Photoshop, упрощающие добавление и удаление людей и объектов на фотографиях. Обновление включает функции масштабирования изображений с помощью ИИ, улучшенный инструмент удаления объектов, а также средства автоматической композиции, которые позволяют плавно вписывать новые элементы в изображения всего за несколько кликов.
Источник изображений: Adobe Функция Harmonize основана на экспериментальной разработке Project Perfect Blend, представленной Adobe в прошлом году. При добавлении нового объекта на фотографию Harmonize автоматически корректирует цвет, освещение, тени и визуальный тон добавленного элемента, чтобы он естественным образом вписался в основное изображение. Обычно это требует определённых навыков и опыта работы с программами для редактирования фотографий. Бета-версия инструмента доступна для пользователей как веб-версии Photoshop, так и в приложении для ПК, а также в раннем доступе в мобильном приложении Photoshop для iOS. ![]() Новый инструмент генеративного ИИ для масштабирования изображений также доступен в бета-версии для Photoshop в веб-версии и версии для ПК. По словам Adobe, он обеспечивает «высококачественное улучшение разрешения до восьми мегапикселей без ущерба для чёткости изображения», что позволяет улучшить детализацию изображений низкого качества. Это будет полезно, например, при восстановлении старых фотографий или адаптации изображений для различных платформ. Инструмент автоматического удаления объектов для пользователей настольных и веб-версий Photoshop также был обновлён. По словам разработчиков, он «очищает изображения с большей точностью». Улучшения должны привести к уменьшению количества нежелательных фоновых элементов на изображении и созданию более реалистичного контента для заполнения любых нежелательных пробелов. В частности, теперь он будет удалять нужный объект с изображения и редактировать получившийся пробел на снимке, добавляя максимально логичные детали. В Photoshop уже были функции генеративного ИИ, которые позволяют добавлять новые объекты к изображениям на основе подсказок. Результаты могут быть непредсказуемыми, поэтому компания добавила меры предосторожности, предотвращающие создание чего-либо подозрительного, например, фейков известных публичных личностей, сцен насилия или материалов сексуального характера. Единственным ограничением той же новой функции Harmonize является то, что пользователю придётся найти изображения, которые он хочет объединить. Photoshop будет применять к отредактированным изображениям метки Content Credentials (учётные данные контента), содержащие информацию о том, как они были обработаны, но не предотвращать создание потенциально спорного контента. «Пользователи, использующие функцию Harmonize, должны соблюдать условия использования Adobe, которые запрещают создание незаконного или вредоносного контента. Adobe серьёзно относится к безопасности контента во всех своих продуктах и внедрила такие меры безопасности, как настройки Content Credentials, для защиты пользователей и борьбы с вредоносным и вводящим в заблуждение контентом. Учётные данные контента позволяют добросовестным пользователям добавлять историю редактирования к своей работе и создавать цифровую цепочку доверия и подлинности», — отметил в разговоре с порталом The Verge менеджер по продукту Photoshop Джоэл Баер (Joel Baer). Photoshop получил ИИ-инструмент для быстрого повышения качества старых фотографий
29.07.2025 [19:37],
Сергей Сурабекянц
Adobe представила в последней бета-версии Photoshop серию новых инструментов, которые, по заявлению компании, устранят «утомительные шаги, снизят уровень сложности и сделают точное редактирование более быстрым и интуитивно понятным». Самой востребованной среди пользователей, по словам Adobe, является ИИ-функция Generative Upscale («Генеративное Масштабирование»), позволяющая увеличивать изображения до 8 мегапикселей без потери качества.
Источник изображений: Adobe В последней версии программы также появился обновлённый инструмент Remove («Удаление»), созданный на основе последней ИИ-модели Adobe Firefly. Он выполняет все ожидаемые функции стирания и удаления объектов, но при этом, по утверждению Adobe, обеспечивает более реалистичное изображение — на фотографии остаётся «меньше артефактов от удалённых объектов». Этот инструмент, как и Generative Upscale, доступен в бета-версии для настольных компьютеров и в веб-приложении. Adobe также запускает функцию Harmonize («Гармонизация»), ранее анонсированную под названием Project Perfect Blend на конференции Max в октябре 2024 года. Используя ИИ-модель Adobe Firefly, Harmonize «интеллектуально анализирует окружающий контекст, автоматически корректируя цвет, освещение, тени и визуальный тон для создания бесшовных, цельных композиций». Adobe утверждает, что новая функция существенно сократит необходимость ручной корректировки. Помимо бета-версии на настольном компьютере или в веб-браузере, она также доступна для пользователей мобильных устройств iOS. ![]() Теперь пользователи получили возможность переключаться между различными ИИ-моделями Adobe Firefly. Кроме того, в этой бета-версии Photoshop появилась функция Projects («Проекты»), которая обеспечит сохранение всех файлов пользователя в едином пространстве и позволит отправлять заказчику целые коллекции, а не одну версию за раз. |