Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI выпустила Grok 4.1 — ИИ-модель заняла первое место в независимых тестах LMArena

Компания xAI Илона Маска (Elon Musk) приступила к глобальному развёртыванию модели Grok 4.1 и «думающей версии» Grok 4.1 Thinking, которые представляют собой улучшенные версии предыдущей модели Grok 4. Оба продукта доступны для бесплатного использования, однако для пользователей с платной подпиской действуют менее строгие ограничения.

 Источник изображений: bleepingcomputer.com

Источник изображений: bleepingcomputer.com

По заявлению представителей компании, новая модель Grok 4.1 показала в тестах трёхкратное снижение вероятности генерации недостоверной информации, или, как сейчас принято говорить, «галлюцинаций», по сравнению со своими предшественниками, что позволяет назвать данное обновление одним из самых успешных в истории стартапа xAI.

Работа новых моделей была протестирована в рамках независимого открытого проекта LMArena, который специализируется на сравнительном анализе крупных языковых моделей (LLM) с помощью «слепых» рандомизированных тестов. Согласно полученным результатам, обе новинки показали выдающиеся результаты в самой конкурентной среде этой платформы. Так, модель Grok 4.1 Thinking возглавила экспертный рейтинг LMArena, набрав 1483 баллов, в то время как базовая версия Grok 4.1 заняла в этом же рейтинге 2-ю строчку с результатом в 1465 баллов. Специалисты платформы отметили, что данный результат означает улучшение более чем на 40 баллов по сравнению с моделью Grok 4 fast, которая была представлена двумя месяцами ранее.

Несмотря на значительный прогресс, аналитики полагают, что Grok 4.1 может не стать лучшей моделью года, поскольку компания Google готовит к выпуску версию Gemini 3.0, которая, по предварительным оценкам, имеет потенциал и получит звание самой мощной LLM на сегодняшний день.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Darkest Dungeon про альпинистов: анонсирована безжалостная пошаговая тактика Ascenders: Beyond the Peak 34 мин.
Власти обязали крупнейшие российские интернет-платформы закрыть доступ пользователям с VPN к 15 апреля 42 мин.
Rowhammer адаптировали для взлома компьютеров через видеокарты — разработаны эксплойты GDDRHammer и GeForge  45 мин.
Google обновила видеоредактор Vids новейшими ИИ-моделями Veo и Lyria, а также добавила управляемые ИИ-аватары 47 мин.
«Словно снова впервые играю в Mass Effect»: новый геймплейный тизер ролевого боевика Exodus от ветеранов BioWare заворожил фанатов 2 ч.
В Apple нашли способ быстро и эффективно строить 3D-сцены с помощью ИИ 3 ч.
Nvidia показала работу RTX Mega Geometry в The Witcher 4 — на RTX 5090 технодемо выдавало 80 кадров/с в 4K с DLSS 3 ч.
Subnautica стала временно бесплатной в Steam и Epic Games Store перед запуском Subnautica 2 5 ч.
Google выпустила семейство открытых моделей Gemma 4 с поддержкой 140 языков и лицензией Apache 2.0 9 ч.
IBM «подружит» мейнфреймы с Arm, но пока, похоже, сама не до конца понимает, зачем 13 ч.
МТС запустила полноценную сеть 5G, но не в России 37 мин.
Tesla впервые с конца 2024 года обошла BYD по объёму поставок электромобилей 40 мин.
Китайский производитель роботов UBTech готов платить ИИ-специалистам до $18 млн в год 3 ч.
Анонсирован защищённый смартфон Realme 16 5G с чипом Dimensity 6400 Turbo и батареей на 7000 мА·ч 3 ч.
Внутри американских человекоподобных роботов, включая Tesla Optimus, нашлось множество китайских компонентов 3 ч.
d-Matrix приобрела разработки GigaIO в области дата-центров, включая НРС-платформу SuperNODE 4 ч.
OpenAI внезапно решила потратить более сотни миллионов долларов на покупку популярного ток-шоу 6 ч.
Подготовка к 5G: Yadro инвестирует 135 млрд рублей в производство телеком-оборудования 9 ч.
Новая статья: Восьмеричный путь к AGI: от ложной нирваны к истинной 14 ч.
SpaceX пожаловалась, что запуски спутников-конкурентов Amazon Leo создали риск столкновения 15 ч.