Сегодня 26 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nvidia помогла Apple повысить эффективность больших языковых моделей ИИ

Инженеры Apple рассказали о сотрудничестве с Nvidia, благодаря которому им удалось повысить производительность систем при генерации текста большими языковыми моделями искусственного интеллекта.

 Источник изображения: developer.nvidia.com

Источник изображения: developer.nvidia.com

В этом году Apple опубликовала исходный код своего решения Recurrent Drafter (ReDrafter) — это новый метод генерации текста с помощью больших языковых моделей. Он отличается высокой скоростью работы, объединяя две технологии: лучевой поиск и динамическое древо внимания. Исследовательский проект Apple показал убедительные результаты, но при развёртывании ReDrafter технология была интегрирована в систему Nvidia TensorRT-LLM — этот инструмент позволяет быстрее запускать большие языковые модели на ускорителях Nvidia.

Как показали замеры производительности, при запуске больших языковых моделей с десятками миллиардов параметров с использованием фреймворка Nvidia TensorRT-LLM и ReDrafter скорость генерации токенов увеличилась в 2,7 раза. Таким образом, технология позволяет сократить задержку между вводом запроса пользователем и получением ответа от модели — при этом используется меньшее число ускорителей и снижается потребление энергии, сделали вывод инженеры Apple.

«Большие языковые модели всё чаще используются в работе приложений, и повышение эффективности вывода может повлиять на вычислительные издержки и сократить задержку для пользователей. Благодаря новому подходу ReDrafter к интегрированному во фреймворк Nvidia TensorRT-LLM спекулятивному выполнению разработчики теперь могут быстрее генерировать токены на ускорителях Nvidia для своих приложений», — добавили в Apple.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Чертовски крутой» шутер новой студии ветерана Call of Duty не был игрой-сервисом, но от закрытия Dark Outlaw Games это не спасло 40 мин.
OpenAI передумала развращать ChatGPT — проект ИИ-бота для взрослых отправили «в долгий ящик» 2 ч.
Верховный суд США не дал Sony привлечь провайдера за пособничество пиратам 3 ч.
Yandex B2B Tech запустила Cloud Stackland — платформу контейнеризации с интегрированными PaaS‑сервисами Yandex Cloud 3 ч.
Google разрешила Apple дистиллировать ИИ-модели Gemini, чтобы запускать их прямо на iPhone или Mac 4 ч.
ИИ от Microsoft и NVIDIA ускорит создание новых атомных реакторов 4 ч.
Gartner: к 2030 году себестоимость инференса снизится на 90 %, но качественный ИИ дешевле не станет 4 ч.
Apple научила небольшие ИИ-модели описывать изображения лучше, чем аналоги крупных конкурентов 5 ч.
Мультиплеерный социальный детектив 4 Penny Coffins отправит игроков в викторианский Лондон искать Джека-потрошителя 6 ч.
ИИ поможет обнаруживать ошибки в коде проектов на GitHub 6 ч.
AMD представила процессор Ryzen 9 9950X3D2 Dual Edition с двойным 3D V-Cache — в продаже с 22 апреля 7 мин.
Глобальные поставки OLED-мониторов подскочили на 92 % в 2025 году — лидирует Asus 9 мин.
Акционеры подали на Supermicro в суд с требованием компенсировать потери из-за падения акций на фоне скандала с контрабандой в Китай 14 мин.
Caviar представила роскошные iPhone 17 в честь 50-летия Apple — есть даже с кусочком водолазки Стива Джобса 48 мин.
Пока без китайцев: Sony представила телевизоры Bravia 3 II и саундбары Bravia Theater Bar 50 мин.
Смартфон Tecno Camon 50 поступил в продажу в России по цене от 19 999 рублей 52 мин.
DJI подала в суд на Insta360 за кражу патентов 2 ч.
Intel официально подтвердила, что не выпустит обновлённый флагман Core Ultra 9 290K Plus 2 ч.
TeamGroup представила SSD T-Create Classic H514 PCIe 5.0 для локальных ИИ-нагрузок — до 4 Тбайт и до 14 200 Мбайт/с 2 ч.
Иллюзия автопилота: сервис Tesla — это не роботакси, считают власти Калифорнии 3 ч.