Сегодня 05 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Роботам нужно ваше тело»: сервис RentAHuman.ai позволит ИИ-агентам нанимать людей для работы в реальном мире 2 ч.
Олдскульный ролевой боевик Kromlech в духе «Готики» отправит игроков в мир на грани гибели — новый трейлер и дата выхода в раннем доступе Steam 3 ч.
Аудитория Google Gemini достигла 750 млн активных пользователей в месяц — до ChatGPT осталось совсем чуть-чуть 4 ч.
Создатель классической Prince of Persia расстроен «жестокой» отменой ремейка Prince of Persia: The Sands of Time, но надежды не теряет 4 ч.
Моддеры взялись воссоздавать отменённую Fallout 3 на движке Fallout: New Vegas — первый трейлер Fallout: The New West 4 ч.
Выручка YouTube достигла рекордных $60 млрд в 2025 году — больше, чем у Netflix 5 ч.
Годовая выручка Google впервые превысила $400 млрд — забрасывание ИИ деньгами усилится 5 ч.
Ставший вирусным ИИ-агент OpenClaw накрыло волной вредоносных дополнений 6 ч.
ICE — не айс: французская Capgemini продаст подразделение CGS, обслуживающее власти США 8 ч.
Никита Буянов опроверг связь загадочной Cor3 с Escape from Tarkov и Battlestate Games, ещё больше запутав фанатов 8 ч.
Флагманские Dimensity разогнали выручку MediaTek до $10 млрд — но 2026 год обещает быть сложным 5 мин.
Canon выпустила юбилейную «мыльницу» по цене «зеркалки» — PowerShot G7 X Mark III Anniversary Edition 19 мин.
Юпитер слегка «усох»: зонд «Юнона» уточнил реальные размеры самой большой планеты Солнечной системы 29 мин.
Supermicro удвоила квартальную выручку на фоне спроса на ИИ-оборудование, но прибыль выросла лишь на четверть 47 мин.
Alphacool представила жидкие термопрокладки Apex Thermal Putty X1 56 мин.
Sony научилась зарабатывать без роста продаж — рухнувшие на 16 % поставки PS5 компенсировали подписки 3 ч.
KKR и Singtel выкупили оператора ЦОД STT GDC за $5,1 млрд 3 ч.
«Яндекс» научил «Алису» понимать естественную речь для управления умным домом 3 ч.
Foxconn в очередной раз резко нарастила выручку — и снова благодаря Nvidia 3 ч.
В Москве не осталось электроэнергии для новых дата-центров — и быстро ситуацию не исправить 3 ч.