Сегодня 05 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Учёные нашли способ запускать большие ИИ-модели на системах мощностью 13 Вт, вместо 700 Вт

Исследователи из Калифорнийского университета в Санта-Круз разработали метод, позволяющий запускать большие языковые модели искусственного интеллекта (LLM) с миллиардами параметров при значительно меньшем потреблении энергии, чем у современных систем.

 Источник изображения: Stefan Steinbauer/Unsplash

Источник изображения: Stefan Steinbauer/Unsplash

Новый метод позволил запустить LLV с миллиардами параметров при энергопотреблении системы всего в 13 Вт, что эквивалентно потреблению бытовой светодиодной лампы. Это достижение особенно впечатляет на фоне текущих показателей энергопотребления ИИ-ускорителей. Современные графические процессоры для центров обработки данных, такие как Nvidia H100 и H200, потребляют около 700 Вт, а грядущий Blackwell B200 вообще может использовать до 1200 Вт на один GPU. Таким образом, новый метод оказывается в 50 раз эффективнее популярных сегодня решений, пишет Tom's Hardware.

Ключом к успеху стало устранение матричного умножения (MatMul) из процессов обучения. Исследователи применили два метода. Первый — это перевод системы счисления в троичную, использующую значения -1, 0 и 1, что позволило заменить умножение на простое суммирование чисел. Второй метод основан на внедрении временных вычислений, при котором сеть получила эффективную «память», позволившую работать быстрее, но с меньшим количеством выполняемых операций. Работа проводилась на специализированной системе с FPGA, но исследователи подчёркивают, что большинство их методов повышения эффективности можно применить с помощью открытого программного обеспечения и настройки уже существующих на сегодня систем.

Исследование было вдохновлено работой Microsoft по использованию троичных чисел в нейронных сетях, а в качестве эталонной большой модели учёные использовали LLaMa от Meta. Рюдзи Чжу (Rui-Jie Zhu), один из аспирантов, работавших над проектом, объяснил суть достижения в замене дорогостоящих операций на более дешёвые. Хотя пока неясно, можно ли применить этот подход ко всем системам в области ИИ и языковых моделей в качестве универсального, потенциально он может радикально изменить ландшафт ИИ.

Немаловажно, что учёные открыли исходный код своей разработки, что позволит крупным игрокам рынка ИИ, таким как Meta, OpenAI, Google, Nvidia и другим беспрепятственно воспользоваться новым достижением для обработки рабочих нагрузок и создания более быстрых и энергоэффективных систем искусственного интеллекта. В конечном итоге это приведёт к тому, что ИИ сможет полнофункционально работать на персональных компьютерах и мобильных устройствах, и приблизится к уровню функциональности человеческого мозга.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новый трейлер раскрыл дату выхода научно-фантастического приключения Planet of Lana 2: Children of the Leaf — демоверсия на подходе 8 мин.
Internet Archive взялся лечить интернет от «гниения ссылок» 45 мин.
«То есть Concord вас ничему не научила?»: Sony анонсировала кооперативный боевик Horizon Hunters Gathering, и фанаты в недоумении 2 ч.
Биткоин рухнул ниже $67 000 — инвесторы напуганы и устроили распродажу 3 ч.
The Elder Scrolls IV: Oblivion Remastered выйдет на Nintendo Switch 2, но фанаты радоваться не спешат 3 ч.
Дуров: Telegram ни разу не передал данные из переписок — и никогда этого не сделает 4 ч.
Bethesda подтвердила даты выхода Fallout 4: Anniversary Edition и Indiana Jones and the Great Circle на Nintendo Switch 2 4 ч.
Российский банк впервые начал выдавать кредиты под залог биткоинов 4 ч.
Осенью в Substack произошла утечка данных пользователей — обнаружили её только в феврале 4 ч.
Слухи: версия Starfield для PS5 не заставит себя долго ждать, а релиз на Switch 2 под угрозой 5 ч.
Топливо с «запахом жареной картошки»: в России успешно испытали авиационный SAF из отработанного растительного масла 10 мин.
ASRock начала проверки после новых поломок Ryzen 9000, но не объяснила, что делать пользователям 17 мин.
MSI усилила защиту RTX 5000 и RX 9000 от плавления разъёма — Afterburner получит функцию GPU Safeguard+ 28 мин.
Intel придумала интегрированные конденсаторы нового поколения — ключ к стабильному питанию ИИ-чипов будущего 2 ч.
Starlink стал золотой жилой SpaceX и скоро расширится — от спутниковых ИИ-гаджетов до контроля орбиты 3 ч.
Оперативная память и SSD подорожают почти вдвое в текущем квартале — как для ПК, так и для серверов 4 ч.
Из-за дефицита памяти у Raspberry Pi 4 появился версия со «сдвоенной» RAM, а 16-Гбайт версия Raspberry Pi 5 существенно подорожала 4 ч.
BMW признала подписку на обогрев сидений перегибом, но не откажется от разблокировки функций за доплату 4 ч.
SpaceX вопреки традициям намерена попасть в фондовые индексы сразу после IPO 5 ч.
Китайский рынок электромобилей забуксовал — продажи BYD в январе рухнули до минимума за два года 5 ч.