Сегодня 09 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → imaging
Быстрый переход

OpenAI выпустила ИИ-модель ChatGPT Images 2.0, которая отлично генерирует текст на картинках

OpenAI представила модель генерации изображений ChatGPT Images 2.0, которая впервые среди массовых ИИ корректно отрисовывает текст на картинках. Если два года назад диффузионные ИИ-модели не могли составить меню мексиканского ресторана без выдуманных слов вроде «enchuita» и «burrto», то новая модель создаёт изображения с надписями, пригодными к использованию без правок.

Ещё в 2024 году диффузионные ИИ-модели систематически искажали надписи. По словам Асмелаша Тека Хадгу (Asmelash Teka Hadgu), основателя и гендиректора Lesan AI, модели восстанавливают изображение из шума и усваивают паттерны, покрывающие основную массу пикселей, а текст занимает ничтожную долю площади.

 Слева — меню, сгенерированное ChatGPT Images 2.0: все надписи читаемы, ни одного выдуманного слова. Справа — три варианта от Microsoft Designer на основе DALL-E 3: «Enchidas», «Tamrielo», «Churiros», «Margartas» и десятки других искажений. Источник изображений: ChatGPT Images 2.0, Microsoft Designer (DALL-E 3) / techcrunch.com

Слева — меню, сгенерированное ChatGPT Images 2.0: все надписи читаемы, ни одного выдуманного слова. Справа — три варианта от Microsoft Designer на основе DALL-E 3: «Enchidas», «Tamrielo», «Churiros», «Margartas» и десятки других искажений. Источник изображений: ChatGPT Images 2.0, Microsoft Designer (DALL-E 3) / techcrunch.com

С тех пор исследователи опробовали альтернативные подходы — в частности, авторегрессионные модели, которые предсказывают содержание изображения и работают по принципу, близкому к большим языковым моделям (LLM).

OpenAI не раскрыла, какая архитектура лежит в основе Images 2.0. Компания пояснила лишь, что новинка умеет «рассуждать» — искать информацию в интернете, генерировать несколько изображений по одному запросу и перепроверять результаты. Благодаря этому Images 2.0 создаёт маркетинговые материалы в разных размерах и даже комиксы. У ИИ-модели также улучшена работа с нелатинскими шрифтами — японским, корейским, хинди и бенгальским. Однако знания Images 2.0 ограничены декабрём 2025 года, что может сказаться на точности генерации по запросам о недавних событиях.

 Источник изображения: ChatGPT Images 2.0 / openai.com

Источник изображения: ChatGPT Images 2.0 / openai.com

«Images 2.0 выводит детализацию и точность генерации на беспрецедентный уровень. Модель способна продумать сложную композицию и воплотить её на практике: следовать инструкциям, сохранять заданные детали и отрисовывать элементы, на которых обычно спотыкаются генераторы, — мелкий текст, пиктограммы, элементы интерфейса, насыщенные композиции и тонкие стилистические ограничения, — и всё это в разрешении до 2K», — говорится в пресс-релизе компании. Генерация при этом занимает больше времени, чем обычный текстовый запрос к ChatGPT, но даже многопанельный комикс укладывается в несколько минут.

 Источник изображения: ChatGPT Images 2.0 / openai.com

Источник изображения: ChatGPT Images 2.0 / openai.com

Доступ к Images 2.0 получат все пользователи ChatGPT и Codex. Платные подписчики смогут генерировать более сложные изображения. OpenAI также откроет программный интерфейс (API) gpt-image-2 — стоимость будет зависеть от качества и разрешения выходных изображений.

Microsoft представила MAI-Image-2 — ИИ-генератор изображений, который оказался неожиданно хорош в фотореализме и инфографике

В октябре прошлого года Microsoft представила ИИ-модель для генерации изображений MAI-Image-1, которая заняла девятое место рейтинга на платформе Arena.ai. Теперь же софтверный гигант объявил о запуске алгоритма второго поколения MAI-Image-2, способного создавать изображения с более естественным освещением, точной передачей тонов кожи и реалистичными деталями. Эта версия ИИ-модели поднялась на третью строчку рейтинга Arena.ai.

 Источник изображения: microsoft.ai

Источник изображения: microsoft.ai

Microsoft существенно улучшила возможности модели в плане корректного отображения текста на генерируемых изображениях. За счёт этого алгоритм лучше подходит для создания инфографики, слайдов, диаграмм и др. Microsoft заявила, что MAI-Image-2 лучше справляется с генерацией кинематографичных и гипердетализированных изображений, включая сюрреалистические концепции, замысловатые композиции и фантастические миры.

«Вышел наш новый генератор изображений MAI-Image-2! Он уже доступен на MAI Playground для создания всего: от фотореализма до детализированной инфографики. Наша команда приложила невероятные усилия для этого релиза», — написал в соцсети X глава ИИ-подразделения Microsoft Мустафа Сулейман (Mustafa Suleyman).

В рейтинге на платформе Arena.ai MAI-Image-2 занимает третье место. Лидерами остаются алгоритмы Google gemini-3.1-flash-image-preview и OpenAI gpt-image-1.5-high-fidelity. Пользователи Copilot и Bing Image Creator смогут задействовать модель MAI-Image-2 в ближайшее время. В настоящее время алгоритм доступен через платформу MAI Playground, а разработчик могут получить доступ к модели через соответствующий API на Microsoft Foundry.

OpenAI выпустила генератор изображений ChatGPT Images 1.5 — более высокая скорость и новые возможности

На прошлой неделе OpenAI выпустила модель искусственного интеллекта GPT-5.2, а теперь она стала основой фирменного генератора изображений ChatGPT Images 1.5. По словам разработчиков, это позволило в четыре раза повысить скорость работы сервиса по сравнению с предыдущей версией, а также реализовать несколько полезных нововведений.

 Источник изображения: ChatGPT Images

Источник изображения: ChatGPT Images

ChatGPT Images стал лучше следовать пользовательским инструкциям, в том числе в случаях, когда дело доходит до редактирования только что созданного изображения. Пользователь может попросить алгоритм добавить, убрать, объединить, смешать или даже перенести какие-то элементы на картинке. OpenAI заявила, что обновлённый ChatGPT Images лучше справляется с отображением текста, что традиционно является слабым местом многих генераторов изображений. По данным OpenAI, повысилось качество генерации читаемого текста, а также появилась возможность работы с более мелким и плотным тестом.

В рамках этого обновления фирменного генератора изображения OpenAI добавила в боковую панель ChatGPT отдельный раздел Images. В нём собраны готовые к использованию фильтры и промпты, призванные помочь в поиске вдохновения. «Мы считаем, что всё ещё находимся в самом начале пути к тому, что может дать генерация изображений. Сегодняшнее обновление — это значительный шаг вперёд, и впереди нас ждёт многое: от более детальных правок до более насыщенных и подробных результатов на разных языках», — говорится в сообщении OpenAI.

Разработчики приступили к развёртыванию ChatGPT Images 1.5 и в скором времени обновлённая версия сервиса станет доступна всем пользователям. Отмечается, что пользователи также смогут продолжить взаимодействие с моделью GPT-4o через пользовательский интерфейс чат-бота компании.

Новый ChatGPT Images появляется как раз в тот момент, когда его главный конкурент Google Nano Banana Pro вызвал всплеск популярности Gemini среди пользователей. В октябре Google заявила, что пользовательская база фирменного чат-бота выросла до 650 млн человек, что существенно больше 450 млн человек, о которых компания сообщала в июле. Nano Banana Pro оказалась настолько популярной, что Google для снижения нагрузки на инфраструктуру пришлось ограничить бесплатных пользователей всего двумя генерациями изображений в день. Для OpenAI, вероятно, было не столь важно дать сильный ответ на появление Nano Banana Pro, сколько обеспечить сильную конкуренцию чат-боту Gemini 3 Pro. Это связано с тем, что наличие в арсенале компании ChatGPT Images является одним из основных факторов, обеспечивающих ИИ-боту ChatGPT пользовательскую базу в 800 млн человек.

Microsoft открыла доступ к своему первому ИИ-генератору изображений MAI-Image-1

В прошлом месяце Microsoft анонсировала первый генератор изображений на базе искусственного интеллекта собственной разработки. Теперь же софтверный гигант открыл доступ к алгоритму MAI-Image-1 на платформах Bing Image Creator и Copilot Audio Expressions.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Глава ИИ-подразделения Microsoft Мустафа Сулейман (Mustafa Suleyman) также анонсировал скорое появление ИИ-генератора компании в Евросоюзе. Он добавил, что ИИ-модель «превосходно» справляется с созданием изображений еды и природных пейзажей, а также художественного освещения и фотореалистичных деталей.

«MAI-Image-1 генерирует фотореалистичные изображения, в том числе освещение (например, отражённый свет, блики), ландшафты и многое другое. Это особенно заметно в сравнении со многими более крупными и медленными моделями. Комбинация скорости и качества означает, что пользователи могут быстрее воплощать свои идеи на экране, быстро их просматривать, а затем переносить свою работу в другие инструменты для последующей доработки», — говорится в сообщении Microsoft. Алгоритм MAI-Image-1 также будет задействован для создания изображений для сгенерированных ИИ аудиорассказов на платформе преобразования текста в речь Copilot Audio Expressions.

Напомним, Microsoft анонсировала первые генеративные ИИ-модели собственной разработки в августе этого года. Тогда были представлены речевая модель MAI-Voice-1 и текстовая MAI-1-preview. Тогда же компания объявила о планах задействовать MAI-1-preview в своём ИИ-помощнике Copilot в определённых сценариях использования. Это может означать, что Microsoft стремиться снизить свою зависимость от ИИ-моделей OpenAI. При этом чат-бот Copilot переходит на использование новейшей ИИ-модели OpenAI GPT-5, одновременно предлагая пользователям в качестве альтернативы задействовать алгоритм Anthropic Claude.

Perplexity договорилась с Getty Images — ИИ-поиск получит легальный контент

Perplexity подписала многолетнее лицензионное соглашение с Getty Images, которое позволяет Perplexity отображать защищённый авторским правом контент в результатах своего поиска на основе искусственного интеллекта. Эта сделка знаменует заметный сдвиг в политике Perplexity, которая неоднократно подвергалась обвинениям в нарушении авторских прав и плагиате, и сигнализирует о стремлении компании к установлению более формальных партнёрских отношений в сфере контента.

 Источник изображения: Perplexity

Источник изображения: Perplexity

Сообщается, что Perplexity и Getty Images сотрудничают уже более года в рамках программы для издателей, которая предполагает разделение доходов от рекламы с издателями при появлении их контента в результатах поискового запроса. Но теперь компании заключили новое соглашение, которое, по всей видимости, легализует некоторые из предыдущих случаев использования стоковых фотографий.

Perplexity неоднократно обвинялась в плагиате со стороны нескольких новостных агентств, хотя некоторые эксперты сомневались, является ли деятельность Perplexity нарушением авторских прав. Компания была оштрафована за использование контента из Wall Street Journal, включая фотографии Getty Images. В октябре 2025 года социальная сеть Reddit подала в суд на Perplexity из-за «незаконного сбора пользовательского контента в промышленных масштабах и обходе технических средств доступа к данным».

«Британская энциклопедия» подала иск в федеральный суд Нью-Йорка против Perplexity, обвинив её в нарушении авторских прав и товарных знаков. Британская корпорация BBC пока лишь пригрозила иском. Cloudflare обвинила Perplexity в массовом скрапинге веб-сайтов, которые явным образом запрещают сбор данных.

Сделка с Getty Images позволит Perplexity показывать изображения, не нарушая авторские права, и включать ссылки на первоисточник при каждом появлении изображений в результатах поиска. Вице-президент по стратегическому развитию Getty Images Ник Ансворт (Nick Unsworth), заявил, что соглашение «признаёт важность правильно оформленного согласия и его ценность для улучшения продуктов на базе ИИ».

«Атрибуция и точность имеют основополагающее значение для того, как люди должны понимать мир в эпоху ИИ, — уверена руководитель отдела контента Perplexity Джессика Чан (Jessica Chan). — Вместе мы помогаем людям находить ответы с помощью впечатляющего визуального повествования, гарантируя при этом, что они всегда знают, откуда взялся этот контент и кто его создал».

Акцент Perplexity на атрибуции является частью стратегии компании по защите от обвинений в нарушении авторских прав. Компания подчёркивает, что использование контента издателей, содержащего общедоступные факты, представляет собой «добросовестное использование», так как подобная информация не защищается авторским правом.

Microsoft представила первый ИИ-генератор изображений собственной разработки — MAI-Image-1

Подразделение Microsoft AI, отвечающее за разработки в сфере искусственного интеллекта, анонсировало алгоритм MAI-Image-1 — первый ИИ-генератор изображений по текстовому описанию, полностью созданный внутри компании. Софтверный гигант, не так давно представивший свои первые ИИ-модели, назвал новый генератор изображений «следующим шагом на нашем пути».

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft заявила, что собирала отзывы профессиональных создателей контента, чтобы избежать «повторяющихся или шаблонно-стилизованных результатов». Компания утверждает, что MAI-Image-1 «превосходно справляется» с созданием фотореалистичных изображений. Кроме того, алгоритм способен обрабатывать запросы и генерировать изображения быстрее, чем «более крупные и медленные модели». MAI-image-1 уже занял место в топ-10 рейтинга бенчмарка LMArena, пользователи которого могут сравнивать результаты работы разных нейросетей и выбирать лучшие из них.

Алгоритм MAI-Image-1 присоединился к списку других ИИ-продуктов Microsoft, таким как генератор голоса MAI-Voice-1 и чат-бот MAI-1-preview. Microsoft была одним из первых и крупнейших инвесторов OpenAI, но со временем отношения между компаниями стали всё более сложными. На этом фоне Microsoft начала использовать ИИ-модели Anthropic для обеспечения работоспособности некоторых функций на платформе Microsoft 365, а также делать существенные инвестиции в разработку собственных нейросетей.

«Мы сражаемся с миром риторики», — фотобанк Getty Images не верит, что сможет победить в судах разработчиков ИИ

Американское фотоагентство Getty Images, владеющее крупнейшим в мире банком изображений, подало в суд в США и Великобритании на Stability AI, разработчика популярной ИИ-модели для генерации изображений на основе текста Stable Diffusion, обвинив его в воровстве и нечестной конкуренции.

 Источник изображения: Tingey Injury Law Firm/unsplash.com

Источник изображения: Tingey Injury Law Firm/unsplash.com

В своих исках компания Getty обвинила Stability AI в незаконном копировании 12 млн изображений из своего фотобанка без разрешения или предоставления компенсации в своих коммерческих интересах и в ущерб создателям контента.

Глава Getty Крейг Питерс (Craig Peters) рассказал в интервью ресурсу CNBC, что Stability AI и другие компании в сфере ИИ воруют защищённые авторским правом материалы фотобанка для обучения создаваемых ИИ-моделей с целью получения коммерческой выгоды.

По его словам, эти фирмы берут и используют защищённые авторским правом материалы для разработки своих мощных ИИ-моделей под видом инноваций, а затем «просто возвращают эти сервисы на существующие коммерческие рынки».

Крейг Питерс выразил несогласие с тем, что фирмы считают возможным совершать ошибки и нарушать нормы во имя ускорения развития и внедрения инноваций, и назвал это нечестной конкуренцией. «Мы не против конкуренции. Постоянно появляются новые конкуренты со стороны новых технологий или просто новых компаний. Но это просто нечестная конкуренция, это воровство», — отметил он.

Питерс заявил, что аргумент ИИ-индустрии по поводу того, что если разработчиков заставят платить за доступ к творческим работам, это убьёт инновации, выглядит неубедительным. «Мы сражаемся с миром риторики», — сказал он

Stability AI оспорила судебный иск Getty, заявив, что не считает претензии Getty обоснованными. Компания признала, что использовала некоторые изображения из фотобанка Getty Images для обучения Stable Diffusion, но вместе с тем она отрицает любую ответственность в отношении претензий истца.

Питерс сообщил, что Getty Images подала иск именно против Stability AI, а не против других фирм, по той причине, что такие судебные разбирательства обходятся чрезвычайно дорого. «Даже такая компания, как Getty Images, не может себе позволить преследовать все нарушения, которые происходят за одну неделю», — сказал он.

«Мы не можем преследовать их, потому что суды просто непомерно дороги, — говорит Питерс. — Мы тратим миллионы долларов на одно судебное разбирательство».

OpenAI решила попридержать запуск 4o Image Generation для бесплатных пользователей

Компания OpenAI вынуждена перенести сроки предоставления доступа к встроенному генератору изображений в ChatGPT для пользователей бесплатной версии. Сэм Альтман (Sam Altman) в своём сообщении признал, что новый инструмент 4o Image Generation оказался популярнее, чем ожидалось, поэтому развёртывание для бесплатного использования будет отложено на некоторое время, сообщает The Verge.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Новый ИИ-генератор изображений был интегрирован в ChatGPT буквально на днях. С его помощью можно создавать картинки непосредственно в приложении, используя новейшую модель рассуждений GPT-4o. Функция так понравилась пользователям, что они уже вовсю стали делиться в социальных сетях изображениями, в частности, стилизованными под работы студии Ghibli, — тренд, к которому присоединился даже сам Альтман.

По словам разработчиков, 4o Image Generation отличается улучшенным рендерингом текста и использует для генерации изображений так называемый авторегрессионный подход, когда изображение создаётся последовательно, слева направо и сверху вниз, а не одномоментно целиком, что позволяет создавать картинки без каких-либо ошибок или искажений в тексте, чего раньше добиться в других генераторах не удавалось.

В настоящее время доступ к функции имеют только подписчики платных тарифов ChatGPT Plus, Pro и Team. Когда именно пользователи бесплатной версии смогут опробовать новый ИИ-генератор, пока не совсем ясно из-за неожиданно высокого спроса на эту функцию.

Microsoft вернула старый ИИ-генератор картинок Bing Image Creator, потому что новый работал хуже

Компания Microsoft решила откатить обновление ИИ-генератора изображений Bing Image Creator. Это произошло после того, как в течение нескольких недель пользователи сервиса активно жаловались на снижение качества его работы, которое возникло после обновления большой языковой модели DALL-E 3 18 декабря. Microsoft отказалась от комментариев по поводу причин решения откатить обновление.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Сегодня корпоративный вице-президент Microsoft по поиску и искусственному интеллекту Жорди Рибас (Jordi Ribas) опубликовал пост в соцсети X, в котором сообщил, что разработчикам удалось воспроизвести «некоторые из обнаруженных проблем». Он также добавил, что было принято решение вернуться к использованию более старой версии модели DALL-E.

В декабре Рибас сообщил о развёртывании обновления для модели DALL-E, которая является основой генератора изображений Bing Image Creator. Почти сразу после этого в интернете появились жалобы от пользователей сервиса, которые писали, что ИИ-генератор стал менее точно следовать текстовым подсказкам при создании изображений. На тот момент Рибас заявил, что качество работы обновлённого продукта «в среднем должно быть немного лучше», чем раньше.

Жалобы пользователей стали появляться не только на форумах поддержки Microsoft, но и на других платформах, включая Reddit и форум OpenAI. Очевидно, что в конечном счёте Microsoft пришлось признать наличие проблемы и откатить обновление, чтобы вернуть Bing Image Creator к прежнему состоянию. Когда софтверный гигант может снова обновить языковую модель DALL-E, пока неизвестно.

Фотобанки Getty Images и Shutterstock объявили о слиянии для выживания в эпоху ИИ — сделка оценена в $3,7 млрд

Фотобанки Getty Images и Shutterstock объявили о слиянии, сумма сделки составит $3,7 млрд. Слияние позволит компаниям расширить свои библиотеки фотоснимков, что важно на фоне растущей конкуренции со стороны генеративных нейросетей, позволяющих создавать изображения по текстовому описанию.

 Источник изображения: The Verge

Источник изображения: The Verge

Генеральный директор Getty Images Крейг Питерс (Craig Peters) станет главой объединённой компании после завершения слияния. Обновлённый совет директоров будет состоять из топ-менеджеров Getty Images и Shutterstock, включая гендиректора Shutterstock Пола Хеннесси (Paul Hennessy).

В опубликованном сегодня пресс-релизе Питерс заявил, что слияние укрепит компании благодаря «улучшению наших контентных предложений, увеличению количества освещаемых событий и предоставлению новых технологий для повышения качества обслуживания наших клиентов». В Getty Images подтвердили, что после слияния Shutterstock сохранит свой веб-сайт.

Слияние Getty Images и Shutterstock происходит на фоне массового распространения ИИ-алгоритмов для генерации изображений по текстовому описанию от разных компаний, таких как OpenAI, Google, Microsoft и Adobe. Также не исключается, что слияние двух фотобанков привлечёт внимание антимонопольных органов, которые захотят изучить последствия сделки для рынка.

Два крупнейших фотостока в мире задумали слияние, но антимонопольщики могут помешать

Getty Images и Shutterstock ведут переговоры о слиянии на фоне растущего спроса на визуальный контент и влияния искусственного интеллекта (ИИ) на индустрию. Это объединение может создать компанию стоимостью более $2 млрд, но уже сейчас сделка вызывает вопросы у антимонопольных служб. На фоне новостей акции Getty Images выросли на 32 %, что явилось самым значительным ростом с 2023 года.

 Источник изображения: Burst/Unsplash

Источник изображения: Burst/Unsplash

По данным Bloomberg, крупнейшие поставщики лицензионного визуального контента, Getty Images и Shutterstock, обсуждают возможное слияние. Getty Images активно ищет варианты объединения с конкурентом, однако отмечается, что компания может отказаться от сделки. Представители Getty Images воздержались от комментариев, тогда как представители Shutterstock не ответили на запросы журналистов.

Эксперты подчёркивают, что потенциальное слияние двух крупных игроков на рынке может привлечь пристальное внимание антимонопольных органов. Хотя компании рассчитывают на более благоприятные условия для сделки при новой администрации Дональда Трампа (Donald Trump), специалисты отмечают, что слияние такого масштаба неизбежно подвергнется тщательной проверке. Ожидается, что назначенные Трампом представители Министерства юстиции и Федеральной торговой комиссии, Гейл Слейтер (Gail Slater) и Эндрю Фергюсон (Andrew Ferguson), не проявят мягкости в подобных вопросах.

Интерес Getty Images к слиянию обусловлен растущим спросом на визуальный контент, так как потребители всё больше времени проводят в интернете. В то же время, развитие искусственного интеллекта и широкое распространение высококачественных камер в смартфонах меняют ландшафт рынка, снижая ценность стоковой фотографии. Основанная в 1995 году Getty Images обладает огромной библиотекой фотографий, видео, иллюстраций и музыки, используемой в новостях, рекламе и индустрии развлечений. В свою очередь, Shutterstock, вышедшая на биржу в 2012 году, предоставляет платформу, позволяющую авторам загружать свой контент и получать роялти за скачивания. Однако за последний год акции Getty Images упали на 56 %, а Shutterstock — на 37 %, согласно данным Bloomberg. Не исключено, что слияние приведёт к положительным корректировкам этих цифр.

Акции Getty Images в пятницу закрылись с ростом на 13 %, достигнув $2,39, что соответствует рыночной капитализации компании в $983 млн. Акции Shutterstock также выросли на 7,9 %, до $31,47, увеличив капитализацию компании до $1,1 млрд.


window-new
Soft
Hard
Тренды 🔥
OpenAI запустила проект Economic Research Exchange для изучения влияния ИИ на экономику 4 ч.
Новая статья: Компьютер месяца — июнь 2026 года 7 ч.
Google заказала у Intel изготовление 3 млн TPU — у TSMC спрос превысил возможности производства 8 ч.
Новая статья: Крах доктрины: авария тяжелой ракеты New Glenn оставила NASA в полной зависимости от SpaceX 9 ч.
Google заказала у Intel производство 3 млн ИИ-процессоров TPU 13 ч.
Геймерам придётся подождать: графические процессоры AMD RDNA 5 появятся не раньше, чем через год 15 ч.
Акции TSMC и других азиатских техногигантов массово дешевеют вслед за американскими 15 ч.
Россиян не будут заставлять регистрировать аккаунты через отечественные e-mail — «Антифрод 2.0» доработали 16 ч.
Эстонская Skeleton Technologies представила суперконденсаторные ИБП GrapheneUPS для ИИ ЦОД 17 ч.
Российский рынок радиоэлектроники достиг 4 трлн рублей, но зависимость от импорта остаётся высокой 17 ч.