Сегодня 11 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
OpenAI обнаружила взлом стороннего компонента своих приложений — данные пользователей в безопасности 5 ч.
OpenAI обвинила Илона Маска в создании юридической «засады» по делу на $100 млрд 5 ч.
Anthropic ускорила рост в США и заметно сократила отставание от OpenAI на корпоративном рынке ИИ-сервисов 6 ч.
ИИ оказался никудышным в ставках на спорт — он проиграл всё на матчах английской Премьер-лиги 7 ч.
Anthropic временно заблокировала создателя OpenClaw в Claude, но быстро отыграла назад 7 ч.
ИИ-агенты оказались уязвимы перед атаками на маршрутизаторы 8 ч.
ФБР научилось читать удалённые сообщения в Signal 8 ч.
Meta не смогла отвертеться от очередного иска по поводу зависимости подростков от социальных сетей 14 ч.
Microsoft упростила структуру Windows Insider — меньше каналов и переключение между ними без необходимости чистой установки 15 ч.
Новая статья: NUTMEG! A Nostalgic Deckbuilding Football Manager — когда футбол был настоящим. Рецензия 20 ч.
Япония выделила Rapidus ещё $4 млрд для запуска 2-нм техпроцесса для ИИ-чипов 5 ч.
OpenAI лишилась трёх руководителей проекта Stargate — их переманила Meta в разгар гонки ИИ 5 ч.
Altera продлила жизненный цикл FPGA до 2045 года 6 ч.
Xiaomi повысила цены на смартфоны Redmi K90 Pro Max и Redmi Turbo 5 в Китае 7 ч.
I-O Data и Verbatim пообещали не бросать производство приводов и дисков Blu-ray 8 ч.
Лунная миссия Artemis II подошла к концу — корабль Orion с астронавтами вернулся на Землю 12 ч.
Tesla начала борьбу с «обманками», позволяющими активировать автопилот в странах, где он официально не предлагается 13 ч.
За первые пять лет ИИ-бума спрос на память вырастет в 625 раз, как считает глава Dell 13 ч.
В США арестован подозреваемый в попытке поджога дома главы OpenAI Сэма Альтмана 14 ч.
Учёные предложили неожиданный способ регистрации гравитационных волн — такой простой, что даже не верится 14 ч.