Сегодня 10 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Яндекс представил третье поколение нейросетей YandexGPT

Компания «Яндекс» представила семейство больших языковых моделей нового поколения YandexGPT 3; пользователи Yandex Cloud уже могут поработать с одной из них — YandexGPT 3 Pro. Она лучше подходит для бизнес-пользователей, поскольку эффективнее обрабатывает сложные запросы и может следовать заданному формату ответов на них. При необходимости можно дополнительно обучить YandexGPT 3 самостоятельно. В ближайшее время нейросети нового поколения появятся в сервисах «Яндекса» для широкого круга пользователей.

 Источник изображений: yandex.ru/company

Источник изображений: yandex.ru/company

YandexGPT 3 Pro демонстрирует особые успехи в сферах клиентской поддержки, онлайн-продаж, цифровых коммуникаций, рекламы и управления персоналом. Она может самостоятельно создавать договоры, счета, должностные инструкции, нормативную и прочую документацию. YandexGPT 3 Pro значительно продвинулась вперёд относительно YandexGPT 2: новая нейросеть корректно обрабатывает инструкции с несколькими условиями, её ответы стали точнее и полнее, работа с фактами — более тщательной, а процент стилистических ошибок снизился.

«Яндекс» использовал несколько тестов, чтобы оценить работу YandexGPT 3 Pro. Была разработана русскоязычная версия международного бенчмарка MMLU — ему дали название YaMMLU_ru. Чтобы оценить работу ИИ-модели в задачах по генерации идей, обобщению данных, классификации и генерации контента, использовалась методика тестирования Side by Side (SBS). YandexGPT 3 в 69 % случаев давала более качественные ответы на пользовательские запросы, чем YandexGPT 2; в бизнес-запросах она стала лучше в 60 % случаев.

Качество ответов в рамках заданного формата проверялось с помощью русскоязычного теста на основе бенчмарка IFEval: у YandexGPT 3 оно по сравнению с YandexGPT 2 выросло на 10 п.п., а консистентность удвоилась — это значит, что модель нового поколения стала лучше понимать, как отвечать на одинаковые по содержанию, но разные по форме запросы.

Наконец, число фактических ошибок YandexGPT 3 сократилось с 16,4 % до 13,5 %, а доля неподтверждённой информации упала с 6,4 % до 5 %. В 5 раз сократилось число отказов отвечать на запросы. Эти испытания разработчики провели на особо сложных запросах, которые могут возникнуть в реальных сценариях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Объявили дату выхода релизной версии Starship Troopers: Extermination — игра подорожает почти вдвое, зато получит сюжетный режим с актёром из «Звёздного десанта» 51 мин.
Релизный трейлер хоррора Still Wakes the Deep от авторов Amnesia: A Machine for Pigs обещает ужас выживания в море 2 ч.
Obsidian показала сюжетный трейлер Avowed без даты выхода, а потом случайно о ней проговорилась 4 ч.
Activision рассекретила дату выхода Call of Duty: Black Ops 6 — геймплейный трейлер, «умопомрачительный» сюжет и вечный онлайн для всех 4 ч.
Жизненный цикл CentOS 7 завершится 30 июня 5 ч.
Apple вот-вот вступит в гонку ИИ — сегодня начнётся конференция WWDC 6 ч.
Анонсирована Life is Strange: Double Exposure, в которой повзрослевшая Макс из первой части вновь берётся за старое 6 ч.
Konami не подтвердила, когда выйдет Metal Gear Solid Delta: Snake Eater, но показала первый полноценный трейлер 7 ч.
«Чернуха уровня Diablo II»: трейлер Diablo IV с датой выхода аддона Vessel of Hatred поразил игроков 8 ч.
Microsoft раскрыла дату выхода Age of Mythology: Retold — первый геймплейный трейлер 10 ч.
Представлен экологичный аккумулятор без лития и с анодом растительного происхождения 10 мин.
Asus представила 27-дюймовый смарт-монитор 4K ZenScreen Smart MS27UC с Google TV 28 мин.
Поделись теплом с ближними: Equinix активно ищет партнёров для подключения своих ЦОД к системам отопления 3 ч.
Основатель Sun и Arista оштрафован SEC почти на $1 млн за инсайдерскую торговлю 4 ч.
На Computex 2024 показали воздушные кулеры с цветными экранами 5 ч.
Репортаж со стенда Silicon Power на выставке Computex 2024: новинки под темой «Хранение данных без границ» 6 ч.
Thermalright показала на Computex 2024 множество новых кулеров и СЖО 6 ч.
Есть рынки и получше: Сингапур быстро потеряет статус лидера индустрии ЦОД в Юго-Восточной Азии, если не примет меры 6 ч.
Репортаж со стенда Chieftec на выставке Computex 2024: новые корпуса, СЖО и блоки питания 6 ч.
HPE по итогам квартала превысила прогнозы по прибыли и выручке, сделав ставку на ИИ 6 ч.