Сегодня 01 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила думающую языковую модель o1

Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделей, o1 способна имитировать человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя разные подходы и исправляя собственные ошибки.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников, сообщает OpenAI на своём сайте.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.

Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.

Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.

Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Падшие единороги»: более 220 стартапов с оценкой $1 млрд потеряли половину стоимости из-за ИИ 58 мин.
«Готовьтесь к следующей битве!»: режиссёр Tekken 7 и Tekken 8 покинул Bandai Namco после 20 лет работы 2 ч.
Процессоры RTX Spark будут нативно поддерживать античитерское и антипиратское ПО для игр 4 ч.
После 10 лет разработки следующее крупное обновление станет для Factorio последним 5 ч.
Слухи: Wizards of the Coast запустила в разработку ремейк легендарной Baldur's Gate 2 5 ч.
Mewgenics совсем скоро получит официальный перевод на русский язык — разработчики уже собрали «все возможные имена» для котиков 11 ч.
Самурайский экшен Onimusha: Way of the Sword выйдет до GTA VI — инсайдер раскрыл дату релиза первой за 20 лет новой игры серии 11 ч.
К взлёту готов: амбициозный авиасимулятор «Корея. Серия Ил-2» получил дату выхода в раннем доступе 12 ч.
«У людей должна быть свобода выбора»: GamesVoice не откажется от русской озвучки Cyberpunk 2077: Phantom Liberty, несмотря на претензии CD Projekt Red 13 ч.
Анонсирована «Смерш: Охотник на волков» — идейная наследница стелс-игр «Смерть шпионам» 24 ч.
Intel выпустит 192-ядерные процессоры Xeon Diamond Rapids на техпроцессе 18A-P в 2027 году 40 мин.
Microsoft представит улучшения Windows, суперприложение Copilot и новый рассуждающий ИИ на конференции Build 3 июня 43 мин.
256 Гбайт оперативки для ПК в двух модулях: Origin Code представила комплект 4R CUDIMM DDR5-8000 53 мин.
Российский рынок электронных компонентов просел на 18,3 % — китайская продукция вытесняет отечественную 4 ч.
MSI представила RTX 5090 Gaming Trio Next-Gen с улучшенным кулером и RTX 5090 Suprim Safeguard с защитой от оплавления 4 ч.
«Это победа всей экосистемы»: Qualcomm обрадовалась приходу Nvidia на рынок процессоров для ПК 4 ч.
Пожар на заводе памяти SK hynix привёл к утечке опасного газа и эвакуации 3600 человек — производство не пострадало 5 ч.
Huawei представила смартфоны Nova 16 Ultra и Nova 16 Pro — чип Kirin 9010S, камера на 200 Мп и батарея на 7000 мА·ч 5 ч.
HP представила «самые тонкие в мире» ноутбуки OmniBook Ultra 16 и X 14 на процессоре Nvidia RTX Spark 6 ч.
PNY выпустит видеокарту GeForce RTX 5090 с модульной СЖО Lynx+ 6 ч.