Сегодня 21 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Максимально правдивый ИИ»: xAI Илона Маска выпустила флагманскую ИИ-модель Grok 3

Компания xAI, основанная Илоном Маском (Elon Musk), представила флагманскую ИИ-модель Grok 3, а также обновления для iOS-приложения Grok и веб-версии. Разработка Grok 3 велась несколько месяцев, а её запуск, первоначально запланированный на 2024 год, был отложен. Для обучения Grok 3 были использованы вычислительные мощности, в 10 раз превышающие ресурсы его предшественника, что позволило существенно повысить точность и глубину анализа данных новой ИИ-моделью.

 Источник изображений: xAI

Источник изображений: xAI

Grok 3 представляет собой третье поколение семейства ИИ-моделей xAI, созданного в противовес таким разработкам, как GPT-4o компании OpenAI и Gemini корпорации Google. Новая ИИ-модель серьёзный технологический шаг вперёд: усовершенствованные алгоритмы, увеличенные объёмы обучающих данных, возможность анализа изображений и даже интеграция ряда функций в социальной сети X. «Grok 3 на порядок мощнее Grok 2. Это максимально правдивый ИИ, даже если эта правда иногда расходится с политически корректной», — заявил Маск во время презентации.

Для обучения Grok 3 xAI использовала один из крупнейших в мире дата-центров, расположенный в Мемфисе. В нём задействованы около 200 000 графических процессоров (GPU), что позволило обрабатывать более сложные массивы данных и выполнять вычисления с беспрецедентной скоростью. По словам Маска, ресурсы, использованные при обучении Grok 3, оказались в 10 раз больше, чем потребовалось для Grok 2. Кроме того, в обучающую выборку вошли не только общедоступные данные, но и материалы судебных дел, что потенциально расширяет возможности новой ИИ-модели в области анализа юридических документов.

 Дата-центр xAI, использовавшийся для обучения Grok 3, оснащён 200 000 GPU, причём расширение с 100 000 до 200 000 GPU заняло 92 дня

Дата-центр xAI, где обучался Grok 3, оснащён 200 000 GPU, причём расширение с 100 000 до 200 000 GPU заняло 92 дня


Важно подчеркнуть, что новая версия Grok представляет собой не единственную ИИ-модель, а целое семейство нейросетей, адаптированных под различные сценарии использования. Например, Grok-3 mini Reasoning способен обрабатывать запросы с высокой скоростью, но за счёт этого снижается точность. Однако не все версии Grok 3 стали доступны сразу — часть функций остаётся в бета-тестировании, но их развёртывание начнётся уже сегодня.

 Grok 3 демонстрирует высокие результаты в тестах на математические, научные и задачи программирования, значительно опережая конкурентов в AIME'24, GPQA и LCB

Grok 3 демонстрирует высокие результаты в тестах на математические, научные и задачи программирования, значительно опережая конкурентов в AIME'24, GPQA и LCB

Компания xAI утверждает, что Grok 3 показывает превосходные результаты в тестах, в частности, опережая GPT-4o. В бенчмарке AIME, оценивающем математические способности, и GPQA, измеряющем уровень знаний в области физики, биологии и химии на уровне доктора наук, новинка демонстрирует выдающиеся показатели. Более того, ранняя версия Grok 3 заняла высокие позиции в Chatbot Arena (LMSYS) — платформе, где пользователи сравнивают ответы различных ИИ-моделей и голосуют за наиболее качественные.

 В рейтинге Chatbot Arena ранняя версия Grok 3 под кодовым названием «Chocolate» показала наивысший результат среди множества больших языковых ИИ-моделей

В рейтинге Chatbot Arena ранняя версия Grok 3 под кодовым названием Chocolate показала наивысший результат среди множества больших языковых ИИ-моделей

Одним из ключевых нововведений стало появление Grok-3 Reasoning и Grok-3 mini Reasoning — специализированных ИИ-моделей, способных глубоко анализировать проблемы, подобно «рассуждающим» моделям, таким как o3-mini компании OpenAI и R1 китайской компании DeepSeek. Эти нейросети не просто дают ответы, но и тщательно проверяют факты перед их формулировкой, что позволяет значительно снизить вероятность ошибок. По данным xAI, Grok-3 Reasoning превзошёл o3-mini-high в ряде популярных бенчмарков, включая AIME 2025 Performance.

 Производительность Grok 3 в тестах AIME 2025 показывает, что версия Grok-3 Reasoning Beta превосходит конкурентов, включая o3mini(high) и Deepseek-R1

Производительность Grok 3 в тестах AIME 2025 показывает, что версия Grok-3 Reasoning Beta превосходит конкурентов, включая o3-mini-high и Deepseek-R1

Пользователи могут работать с Grok 3 через приложение Grok, в котором доступны два режима работы: Think — для стандартных запросов, и Big Brain — для сложных вычислений и логических задач. Режим Big Brain использует расширенные вычислительные мощности, что позволяет добиться более высокой точности ответов. Он оптимален для научных исследований, математического моделирования и программирования. По словам Маска, в приложении Grok некоторые «мысли» ИИ скрываются в процессе рассуждения, чтобы предотвратить дистилляцию — метод, используемый разработчиками конкурирующих ИИ-моделей для извлечения знаний из других нейросетей.

 Grok 3 и его мини-версия превзошли конкурентов в тестах на математику, естественные науки и программирование, обогнав GPT-4o, Gemini-2 Pro и DeepSeek-V3

Grok 3 и его мини-версия превзошли конкурентов в тестах на математику, естественные науки и программирование, обогнав GPT-4o, Gemini-2 Pro и DeepSeek-V3

Ещё одной важной новацией стало появление DeepSearch — инструмента, построенного на базе «думающих» ИИ-моделей. Он выполняет интеллектуальный поиск по открытым источникам в интернете и данным социальной сети X, анализируя массивы информации и формируя сжатые аналитические сводки. Эта функциональность делает DeepSearch аналогом OpenAI Deep Research, но с более интегрированным подходом к обработке данных. На данный момент доступ к Grok 3 предоставляется подписчикам X Premium+, стоимость подписки составляет $22 в месяц. Дополнительно компания xAI запустила новый тариф SuperGrok, который стоит $30 в месяц или $300 в год. В него входят расширенные возможности reasoning-запросов, более глубокий анализ через DeepSearch и неограниченная генерация изображений.

 Работа DeepSearch в интерфейсе Grok 3, где система выполняет анализ и поиск актуальной информации о предстоящем запуске Starship от SpaceX

Работа DeepSearch в интерфейсе Grok 3, где система выполняет анализ и поиск актуальной информации о предстоящем запуске Starship от SpaceX

В течение ближайшей недели приложение Grok получит обновление, которое добавит голосовой режим, позволяющий Grok общаться с пользователями синтезированным голосом. В дальнейшем, через несколько недель, Grok 3 станет доступен через корпоративный API xAI, что позволит компаниям интегрировать DeepSearch в свои бизнес-процессы. По словам Маска, его компания планирует открыть исходный код Grok 2: «Наш подход заключается в том, что мы выкладываем последнюю версию [Grok] в открытый доступ, когда следующая версия полностью готова. Когда Grok 3 станет зрелой и стабильной, что, вероятно, произойдёт в течение нескольких месяцев, тогда мы откроем исходный код Grok 2». Это означает, что после окончательной стабилизации работы Grok 3 разработчики смогут изучать исходный код его предшественника.

Первоначально Grok позиционировался как передовой и альтернативный ИИ, способный свободно обсуждать темы, которых избегают другие нейросети. Проведённые исследования показали, что до выхода Grok 3 ИИ-модель демонстрировала политический уклон, особенно в вопросах разнообразия и неравенства. Маск объяснил это тем, что обучающие данные включали общедоступные веб-страницы, отражающие определённые идеологические позиции. Маск пообещал, что Grok 3 будет более политически нейтральным, однако пока неясно, удалось ли xAI достичь этой цели.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
iKS-Consulting: «Базис» — лидер российского рынка ПО управления динамической ИТ-инфраструктурой 24 мин.
iKS-Consulting: «Базис» — лидер российского рынка ПО управления динамической ИТ-инфраструктурой 25 мин.
ИИ-тренер Google по ЗОЖ поможет в занятиях фитнесом, улучшении сна и укреплении здоровья 40 мин.
Meta решила приостановить расширение штата на направлении ИИ 2 ч.
OpenAI готова зарабатывать на создании ЦОД для клиентов 3 ч.
Google отлучила «Ассистента» от умного дома — представлен продвинутый ИИ-помощник Gemini for Home 10 ч.
«Лучшее, что я видел за последние годы»: безумный платформер Denshattack! отправит игроков выполнять трюки на неподвластном гравитации поезде 10 ч.
Ярость войны, напалм и масштаб: анонсирован многопользовательский шутер Hell Let Loose: Vietnam 11 ч.
Сюжетная ролевая игра Rue Valley, вдохновлённая Disco Elysium и «Днём сурка», получила дату выхода и новый геймплейный трейлер 12 ч.
«Не терпится купить 12 DLC, чтобы получить полную игру»: Paradox раскрыла дату выхода Europa Universalis V, но фанаты делать предзаказ не спешат 13 ч.
В России дебютировал флагманский робот-пылесос 3i G10+ с прессом для мусора и мощным мотором 24 мин.
Masimo подала в суд на таможню США за снятие запрета на импорт Apple Watch с функцией пульсоксиметра 53 мин.
Intel готова продавать свои акции по дешёвке не только SoftBank 5 ч.
Новая статья: Curator — и пусть DDoS подождёт 10 ч.
Lenovo откроет в Саудовской Аравии штаб-квартиру и развернёт производство IT-оборудования 10 ч.
Qualcomm представила процессоры Snapdragon W5 Gen 2 и W5+ Gen 2 для смарт-часов со спутниковой связью 11 ч.
Google представила смарт-часы Pixel Watch 4 с поддержкой спутниковой связи 11 ч.
Google сделала свой MagSafe: магнитное крепление Pixelsnap для зарядки и не только 12 ч.
Портрет всего человечества с расстояния 290 млн км: межпланетная станция «Психея» запечатлела Землю и Луну 12 ч.
«Роскосмос» запустил на орбиту 75 мышей и 1500 мух на спутнике «Бион-М» — через месяц они вернутся в Россию 12 ч.