Сегодня 29 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Китайская ИИ-модель Kimi k1.5 освоила мультимодальные рассуждения и превзошла OpenAI o1

Если 2024 год стал годом клонов ChatGPT, то 2025 год обещает стать эрой рассуждающих моделей ИИ, а лидерство в этой области захватывают китайские лаборатории. На прошлой неделе много шума наделала DeepSeek со своей рассуждающей моделью R1. А на днях Moonshot AI представила мультимодальную Kimi k1.5, которая обгоняет в тестах OpenAI o1, а стоит в разы меньше. Эти модели представляют собой смену представления о «мыслительном процессе» ИИ.

 Источник изображения: kimi.ai

Источник изображения: kimi.ai

Новые модели далеко ушли от банального пересказа Википедии. Им по силам сложные проблемы — от решения головоломок до объяснения квантовой физики. А Kimi k1.5 уже успела заработать звание «первого настоящего конкурента o1». По оценкам экспертов, Kimi k1.5 — это не просто ещё одна модель ИИ — это скачок вперёд в мультимодальном рассуждении и обучении с подкреплением. Kimi k1.5 от Moonshot AI объединяет текст, код и визуальные данные для решения сложных задач, порою в разы превосходя таких лидеров отрасли, как GPT-4o и Claude Sonnet 3.5 в ключевых тестах.

Контекстное окно Kimi k1.5 на 128 тыс. токенов позволяет модели «за один подход» обрабатывать объём информации, эквивалентный солидному роману. В математических задачах модель может планировать, отражать и корректировать свои шаги на протяжении сотен токенов, имитируя решение проблемы человеком. Вместо того, чтобы повторно генерировать полные ответы, Kimi использует фрагменты предыдущих траекторий, повышая эффективность и сокращая затраты на обучение.

 Источник изображений: medium.com

Источник изображений: medium.com

Традиционный подход, основанный на принципах обучения с подкреплением, предполагает использование сложных инструментов, таких как поиск по дереву Монте-Карло или сети ценностей. Команда Moonshot AI отказалась от них и создала упрощённый фреймворк на базе обучения с подкреплением, используя штраф за длину и баланс между исследованием и эксплуатацией. В результате разработчикам удалось создать модель, которая обучается быстрее и избегает «чрезмерного обдумывания» — распространённой ошибки, когда ИИ тратит вычислительные ресурсы на ненужные шаги.

Kimi k1.5 успела показать себя как мощный инструмент визуализации и одновременной работы с текстом. Модель умеет анализировать диаграммы, решать геометрические задачи и отлаживать код — в тесте MathVista модель показала точность 74,9 %, объединив текстовые подсказки с графическими диаграммами.

Исследователи Moonshot AI, вместо того чтобы полагаться на мощные, но медленные длинноцепочечные рассуждения (Long-CoT), использовали метод Long2Short («длинные-в-короткие»), добившись более лаконичных и быстрых ответов. Для этого применялись следующие методы:

  • Объединение моделей путём смешивания весов длинных и коротких версий CoT.
  • Выборка кратчайшего отклонения — отбор самого короткого и корректного ответа из восьми сгенерированных вариантов.
  • Оптимизация DPO — обучение модели предпочтению кратких ответов без потери смысла.

Даже при прямом сравнении Kimi K1.5 оставляет GPT-4o и Claude Sonnet 3.5 далеко позади. Разработчикам Moonshot AI удалось оптимизировать процесс обучения с подкреплением благодаря:

  • Гибридному развёртыванию — совместному использованию ресурсов GPU для обучения и вывода.
  • Частичным развёртываниям — разделению длинных траекторий на управляемые фрагменты для более эффективного обучения.
  • Песочницам кода — безопасным средам для тестирования выходных данных кода, что гарантирует их надёжность.

По мнению экспертов, Kimi K1.5 — это не просто технологический прорыв, а взгляд в будущее ИИ. Объединяя обучение с подкреплением с мультимодальным рассуждением, эта модель решает задачи быстрее, умнее и эффективнее.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Беспрецедентная бомбардировка»: Cloudflare рассказала о мощнейшей DDoS-атаке — до 31,4 Тбит/с 14 мин.
Только для настоящих людей: OpenAI разрабатывает соцсеть с биометрией 17 мин.
Лишь треть объектов критической инфраструктуры в России достигла минимального уровня киберзащиты 32 мин.
Telegram почти догнал WhatsApp в гонке за звание самого популярного мессенджера у россиян 39 мин.
Ветераны разработки Diablo анонсировали Darkhaven — мрачную экшен-RPG с динамичным миром и полной свободой передвижения 2 ч.
Исследователи предупредили об опасности ИИ-моделей с открытым исходным кодом 2 ч.
Microsoft превысила прогнозы Уолл-стрит, но её акции упали из-за замедления роста облачных сервисов 3 ч.
На пути к суперинтеллекту: Цукерберг анонсировал ИИ-шопинг, новые модели и другие функции 3 ч.
МТС Exolve представил новое поколение голосовых ИИ-роботов для бизнеса 4 ч.
Олдскульный боевик Scott Pilgrim EX от создателей Teenage Mutant Ninja Turtles: Shredder’s Revenge не заставит долго ждать — дата выхода и новый трейлер 6 ч.
Китай собрался обогнать SpaceX и развернуть на орбите мощные ИИ ЦОД в течение пяти лет 22 мин.
Gigabyte выпустила флагманскую плату X870E Aorus Xtreme X3D AI Top с большим экраном и ценой $1100 26 мин.
ИИ и облака вместо телефонов: Telefónica превратит десятки «медных» АТС в периферийные ЦОД 53 мин.
AMD запустила продажи Ryzen 7 9850X3D по цене $499 — Ryzen 7 7800X3D и 9800X3D подешевели 2 ч.
Астрономы разгадали тайну светящихся «маленьких красных точек» на заре Вселенной 2 ч.
Xiaomi представила смартфон Redmi Turbo 5 Max с батареей на 9000 мА·ч и чипом Dimensity 9500s 2 ч.
Samsung представила PM9E1 — самый компактный 4-Тбайт SSD с PCIe 5.0 2 ч.
Флагман Nothing Phone (4) в этом году не выйдет — Карл Пей объяснил причины и рассказал, что будет вместо него 2 ч.
DJI представила лёгкий стабилизатор RS 5 для камер весом до трёх килограмм 2 ч.
Китайский конкурент NVIDIA H20 — Alibaba представила ИИ-ускоритель Zhenwu 810E с 96 Гбайт HBM2e 3 ч.