Сегодня 13 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» запустил нейросеть Kandinsky 2.1 — она генерирует изображения по описанию на русском и других языках

Разработчики из «Сбера» представили новую версию нейросети Kandinsky, которая является отечественным аналогом популярного алгоритма Midjourney. Генеративная модель Kandinsky 2.1 может использоваться для создания высококачественных изображений на основе текстового описания, дорисовки картинок и др. Нейросеть доступна всем желающим

 Источник изображений: sberbank.com

Источник изображений: sberbank.com

«Новая генеративная модель "Сбера" — Kandinsky 2.1 — способна всего за несколько секунд создавать высококачественные изображения по текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях», — сказано в сообщении «Сбера».

Разработкой и обучением алгоритма занимались специалисты Sber AI совместно с учёными из Института искусственного интеллекта AIRI, задействовав для этого объединённый датасет Sber AI и SberDevices. Модель Kandinsky 2.1 является усовершенствованной версией предыдущей версии алгоритма, которая была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. В дополнение к этому алгоритм дополнительно обучался на отдельном датасете из двух миллионов пар качественных изображений. Этот датасет состоял из изображений с описаниями в сложных для нейросетей областях, таких как тексты и лица людей.

Представленный алгоритм усовершенствован за счёт новой модели автоэнкодера, используемой в том числе в качестве декодера векторных представлений изображений. За счёт этого удалось кардинально улучшить генерацию изображений в высоком разрешении. Модель Kandinsky 2.1 содержит 3,3 млрд параметров, что значительно больше по сравнению с 2 млрд параметров модели Kandinsky 2.0. Алгоритм использует закодированное текстовое описание и специальное представление изображения моделью CLIP. Он способен визуализировать любой контент и может применяться в разных отраслях.

Пользователи могут оценить возможности Kandinsky 2.1 на промо-странице, а также воспользовавшись командой «Запусти художника» на устройствах Sber, в мобильном приложении «Салют» и на платформе ML Space. Ещё нейросеть доступна через бота в Telegram. Правда, при попытке воспользоваться ею, через несколько минут появилось сообщение: «Произошла ошибка при работе модели:( Попробуй, пожалуйста, еще раз».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Сегодня в Fortnite ворвётся Metallica — новый режим, музыкальное шоу и не только 4 ч.
«Заперт в своём глупом тельце»: первый тизер-трейлер и подробности Goodnight Universe от соавторов Before Your Eyes 7 ч.
США запретили оказывать IT-услуги и продавать некоторое ПО любому лицу в России 8 ч.
Денег нет, сил держаться тоже: создатели Armello и Solium Infernum уходят в «гибернацию» и вернуться не обещают 8 ч.
Продажи Elden Ring взяли новую высоту — помог ажиотаж вокруг Shadow of the Erdtree 9 ч.
Представлен ИИ-генератор изображений Stable Diffusion Medium, которому достаточно видеокарты с 5 Гбайт памяти 10 ч.
В России резко подскочили продажи футбольных симуляторов — от EA Sports FC 24 до Football Manager 10 ч.
Уже рутина: NVIDIA снова улучшила результаты в ИИ-бенчмарке MLPerf Training 10 ч.
Apple не может на 100 % гарантировать отсутствие галлюцинаций у фирменного ИИ, заявил Тим Кук 11 ч.
Google начала тестировать в Бразилии ИИ-защиту от кражи Android-смартфонов 12 ч.
Учёные MIT разработали суперконденсатор из обычного бетона и сажи — запасать энергию можно будет прямо в фундаменте дома 2 ч.
Новая статья: ИИтоги мая 2024 г.: ничто человеческое ботам не чуждо 4 ч.
LG начнёт выпускать OLED-экраны для iPhone 16 Pro Max раньше Samsung 6 ч.
ASRock выпустила видеокарту Radeon RX 6500 XT Phantom Gaming с удвоенным объёмом памяти 6 ч.
На роль тёмной материи предложены сферические аналоги космических струн — топологических дефектов пространства-времени 7 ч.
США расширили антироссийские санкции в сфере полупроводников — они усложнят поставки чипов из Китая 9 ч.
Президент РФ утвердил соглашение о создании лунной станции совместно с Китаем 11 ч.
Jabra обновила наушники Elite 10 и Elite 8 Active и сообщила о закрытии серии Elite 11 ч.
ЕС собирается почти в пять раз поднять пошлины на китайские электромобили 12 ч.
Некоторые ноутбуки на процессорах Qualcomm Snapdragon X Elite получат 5G-модемы 12 ч.