Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модели семейства Llama 4 и встроила их в WhatsApp и Instagram✴

Компания Meta Platforms объявила о запуске семейства открытых моделей искусственного интеллекта Llama 4. В него вошли Llama 4 Scout, Maverick и Behemoth, которые обеспечивают возможность мультимодального взаимодействия, т.е. способны отвечать не только на текстовые запросы, но и обрабатывать изображения, видео и др. Они обучались на «большом количестве немаркированных текстовых, графических и видеоданных» для обеспечения «широкого визуального понимания».

 Искусственный интеллект: Steve Johnson / Unsplash

Искусственный интеллект: Steve Johnson / Unsplash

Успех ИИ-моделей китайской компании DeepSeek, которые работают наравне или превосходят флагманские алгоритмы Llama предыдущих поколений, подтолкнул Meta к ускорению процесса разработки в этом направлении. По данным источника, сотрудники компании прикладывают массу усилий, чтобы понять, как DeepSeek удалось снизить стоимость разработки и запуска ИИ-моделей, таких как R1 и V3.

 Источник изображения: ***

Источник изображения: Meta

Алгоритм Llama 4 Scout имеет 17 млрд активных параметров, 16 «экспертов» и 109 млрд параметров в целом. По данным Meta, ИИ-модель превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработке разных типов задач. Одна из основных особенностей модели заключается в поддержке контекстного окна в 10 млн токенов.

Llama 4 Maverick имеет 17 млрд активных параметров и 128 «экспертов» (всего 400 млрд параметров). По данным разработчиков, модель превосходит GPT-4o и Gemini 2.0 Flash при тестировании в разных бенчмарках, а также показывает сравнимые с DeepSeek V3 результаты при ведении рассуждений и в процессе написания программного кода. Scout может работать на одном графическом ускорителе Nvidia H100, тогда как для Maverick требуется система Nvidia H100 DGX или эквивалентная ей.

Модель Llama 4 Behemoth имеет 288 млрд активных параметров и 16 «экспертов» (всего около 2 трлн параметров) и превосходит алгоритм GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro по результатам тестирования в разных бенчмарках. Модель Llama 4 Behemoth продолжает обучаться, поэтому она ещё недоступна публично. В это же время модели Scout и Maverick доступны на сайте Llama.com и на Hugging Face. В дополнение к этому фирменный ИИ-помощник Meta AI, доступный в приложениях компании, таких как WhatsApp, Messenger и Instagram, переведён на работу с Llama 4 в 40 странах мира. Возможность обработки мультимодальных запросов пока ограничена английским языком и доступна только в США.

 Источник изображения: ***

Источник изображения: Meta

«Модели Llama 4 знаменуют собой начало новой эры экосистемы Llama. Это только начало для семейства Llama 4», — говорится в сообщении в блоге Meta. Компания утверждает, что Llama 4 является первой группой ИИ-моделей, использующих архитектуру «смесь экспертов» (MoE), которая более эффективна при обучении и инференсе. Архитектура MoE позволяет алгоритму разбивать задачи на подзадачи, а затем делегировать их обработку более мелким и специализированным «экспертным» моделям.

Следует отметить, что ни одна из моделей Llama 4 не является правильной «рассуждающей» моделью, как, например, GPT-o1 или GPT-o3-mini от OpenAI. Рассуждающие модели проверяют свои ответы на достоверность и, как правило, их ответы более надёжны, но для их получения требуется больше времени, чем при взаимодействии с традиционными «не рассуждающими» моделями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Darkest Dungeon про альпинистов: анонсирована безжалостная пошаговая тактика Ascenders: Beyond the Peak 22 мин.
Власти обязали крупнейшие российские интернет-платформы закрыть доступ пользователям с VPN к 15 апреля 30 мин.
Rowhammer адаптировали для взлома компьютеров через видеокарты — разработаны эксплойты GDDRHammer и GeForge  33 мин.
Google обновила видеоредактор Vids новейшими ИИ-моделями Veo и Lyria, а также добавила управляемые ИИ-аватары 35 мин.
«Словно снова впервые играю в Mass Effect»: новый геймплейный тизер ролевого боевика Exodus от ветеранов BioWare заворожил фанатов 2 ч.
В Apple нашли способ быстро и эффективно строить 3D-сцены с помощью ИИ 3 ч.
Nvidia показала работу RTX Mega Geometry в The Witcher 4 — на RTX 5090 технодемо выдавало 80 кадров/с в 4K с DLSS 3 ч.
Subnautica стала временно бесплатной в Steam и Epic Games Store перед запуском Subnautica 2 5 ч.
Google выпустила семейство открытых моделей Gemma 4 с поддержкой 140 языков и лицензией Apache 2.0 9 ч.
IBM «подружит» мейнфреймы с Arm, но пока, похоже, сама не до конца понимает, зачем 13 ч.
МТС запустила полноценную сеть 5G, но не в России 25 мин.
Tesla впервые с конца 2024 года обошла BYD по объёму поставок электромобилей 28 мин.
Японские производители стекла разглядели возможность заработать на буме ИИ 2 ч.
Китайский производитель роботов UBTech готов платить ИИ-специалистам до $18 млн в год 3 ч.
Анонсирован защищённый смартфон Realme 16 5G с чипом Dimensity 6400 Turbo и батареей на 7000 мА·ч 3 ч.
Внутри американских человекоподобных роботов, включая Tesla Optimus, нашлось множество китайских компонентов 3 ч.
d-Matrix приобрела разработки GigaIO в области дата-центров, включая НРС-платформу SuperNODE 4 ч.
OpenAI внезапно решила потратить более сотни миллионов долларов на покупку популярного ток-шоу 6 ч.
Подготовка к 5G: Yadro инвестирует 135 млрд рублей в производство телеком-оборудования 9 ч.
Новая статья: Восьмеричный путь к AGI: от ложной нирваны к истинной 14 ч.