Сегодня 29 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

«Больше, чем у кого-либо»: Цукерберг похвастался системой с более чем 100 тыс. Nvidia H100 — на ней обучается Llama 4

Среди американских IT-гигантов зародилась новая забава — соревнование, у кого больше кластеры и твёрже уверенность в превосходстве своих мощностей для обучения больших языковых моделей ИИ. Лишь недавно глава компании Tesla Илон Маск (Elon Musk) хвастался завершением сборки суперкомпьютера xAI Colossus со 100 тыс. ускорителей Nvidia H100 для обучения ИИ, как об использовании более 100 тыс. таких же ИИ-ускорителей сообщил глава Meta Марк Цукерберг (Mark Zuckerberg).

 Источник изображения: CNET/YouTube

Источник изображения: CNET/YouTube

Глава Meta отметил, что упомянутая система используется для обучения большой языковой модели нового поколения Llama 4. Эта LLM обучается «на кластере, в котором используется больше 100 000 графических ИИ-процессоров H100, и это больше, чем что-либо, что я видел в отчётах о том, что делают другие», — заявил Цукерберг. Он не поделился деталями о том, что именно уже умеет делать Llama 4. Однако, как пишет издание Wired со ссылкой на заявление главы Meta, их ИИ-модель обрела «новые модальности», «стала сильнее в рассуждениях» и «значительно быстрее».

Этим комментарием Цукерберг явно хотел уколоть Маска, который ранее заявлял, что в составе его суперкластера xAI Colossus для обучения ИИ-модели Grok используются 100 тыс. ускорителей Nvidia H100. Позже Маск заявил, что количество ускорителей в xAI Colossus в перспективе будет увеличено втрое. Meta также ранее заявила, что планирует получить до конца текущего года ИИ-ускорители, эквивалентные более чем полумиллиону H100. Таким образом, у компании Цукерберга уже имеется значительное количество оборудования для обучения своих ИИ-моделей, и будет ещё больше.

Meta использует уникальный подход к распространению своих моделей Llama — она предоставляет их полностью бесплатно, позволяя другим исследователям, компаниям и организациям создавать на их базе новые продукты. Это отличает её от тех же GPT-4o от OpenAI и Gemini от Google, доступных только через API. Однако Meta всё же накладывает некоторые ограничения на лицензию Llama, например, на коммерческое использование. Кроме того, компания не сообщает, как именно обучаются её модели. В остальном модели Llama имеют природу «открытого исходного кода».

С учётом заявленного количества используемых ускорителей для обучения ИИ-моделей возникает вопрос — сколько электричества всё это требует? Один специализированный ускоритель может съедать до 3,7 МВт·ч энергии в год. Это означает, что 100 тыс. таких ускорителей будут потреблять как минимум 370 ГВт·ч электроэнергии — как отмечается, достаточно для того, чтобы обеспечить энергией свыше 34 млн среднестатистических американских домохозяйств. Каким образом компании добывают всю эту энергию? По признанию самого Цукерберга, со временем сфера ИИ столкнётся с ограничением доступных энергетических мощностей.

Компания Илона Маска, например, использует несколько огромных мобильных генераторов для питания суперкластера из 100 тыс. ускорителей, расположенных в здании площадью более 7000 м2 в Мемфисе, штат Теннесси. Та же Google может не достичь своих целевых показателей по выбросам углерода, поскольку с 2019 года увеличила выбросы парниковых газов своими дата-центрами на 48 %. На этом фоне бывший генеральный директор Google даже предложил США отказаться от поставленных климатических целей, позволив компаниям, занимающимся ИИ, работать на полную мощность, а затем использовать разработанные технологии ИИ для решения климатического кризиса.

Meta увильнула от ответа на вопрос о том, как компании удалось запитать такой гигантский вычислительный кластер. Необходимость в обеспечении растущего объёма используемой энергии для ИИ вынудила те же технологические гиганты Amazon, Oracle, Microsoft и Google обратиться к атомной энергетике. Одни инвестируют в разработку малых ядерных реакторов, другие подписали контракты на перезапуск старых атомных электростанций для обеспечения растущих энергетических потребностей.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ветераны разработки Diablo анонсировали Darkhaven — мрачную экшен-RPG с динамичным миром и полной свободой передвижения 28 мин.
Исследователи предупредили об опасности ИИ-моделей с открытым исходным кодом 35 мин.
Microsoft превысила прогнозы Уолл-стрит, но её акции упали из-за замедления роста облачных сервисов 2 ч.
На пути к суперинтеллекту: Цукерберг анонсировал ИИ-шопинг, новые модели и другие функции 2 ч.
МТС Exolve представил новое поколение голосовых ИИ-роботов для бизнеса 3 ч.
Олдскульный боевик Scott Pilgrim EX от создателей Teenage Mutant Ninja Turtles: Shredder’s Revenge не заставит долго ждать — дата выхода и новый трейлер 5 ч.
Закрыть ворота, открыть ворота: бесплатный шутер Highguard от бывших разработчиков Titanfall 2 стал недоступен в российском Steam, но ненадолго 5 ч.
Meta стала больше зарабатывать на рекламе и нарастила аудиторию — акции подскочили на 10 % 6 ч.
Сюжетные дополнения к Vampire: The Masquerade — Bloodlines 2 могут выйти раньше обещанного — Paradox представила план развития игры на 2026 год 7 ч.
Spotify выплатила музыкантам $11 млрд в 2025 года — это новый рекорд 8 ч.
ИИ и облака вместо телефонов: Telefónica превратит десятки «медных» АТС в периферийные ЦОД 5 мин.
AMD запустила продажи Ryzen 7 9850X3D по цене $499 — Ryzen 7 7800X3D и 9800X3D подешевели 18 мин.
Астрономы разгадали тайну светящихся «маленьких красных точек» на заре Вселенной 25 мин.
Xiaomi представила смартфон Redmi Turbo 5 Max с батареей на 9000 мА·ч и чипом Dimensity 9500s 29 мин.
Samsung представила PM9E1 — самый компактный 4-Тбайт SSD с PCIe 5.0 39 мин.
Флагман Nothing Phone (4) в этом году не выйдет — Карл Пей объяснил причины и рассказал, что будет вместо него 47 мин.
DJI представила лёгкий стабилизатор RS 5 для камер весом до трёх килограмм 54 мин.
Китайский конкурент NVIDIA H20 — Alibaba представила ИИ-ускоритель Zhenwu 810E с 96 Гбайт HBM2e 2 ч.
Представлен Anbernic RG G01 — геймпад со встроенным датчиком пульса и дисплеем 3 ч.
Беспилотное такси Waymo сбило ребёнка возле школы, несмотря на экстренное торможение 3 ч.