Сегодня 10 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google привязала reCAPTCHA к Play Services и отрезала от верификации пользователей Android без сервисов Google 2 ч.
Новая статья: Heroes of Might and Magic: Olden Era — время расцвета. Предварительный обзор 14 ч.
Anthropic отучила свой ИИ шантажировать пользователей при угрозе отключения 20 ч.
Microsoft улучшила работу Windows 11 с тачпадом и сенсорной клавиатурой, а также повысила стабильность «Проводника» 21 ч.
Пользователей Instagram лишили сквозного шифрования в личных сообщениях 22 ч.
ИИ всё чаще пишет научные статьи — отличить от человеческих становится невозможно, и это пугает 24 ч.
ИИ-модель OpenAI GPT-5.5 оказалась в 1,5–2 раза дороже предшественницы 24 ч.
В ЕС назвали VPN лазейкой для обмана систем проверки возраста — и её хотят закрыть 09-05 11:57
Департамент DOGE Илона Маска использовал ChatGPT глупым и незаконным способом 09-05 11:53
С опозданием на месяц OpenAI ответила на Claude Mythos — вышла модель GPT-5.5-Cyber, которая не боится обсуждать кибератаки и эксплойты 09-05 10:14
Samsung расширила группу по созданию человекоподобных роботов и ускорила ИИ-трансформацию 4 ч.
Nvidia в этом году потратила на покупку активов других компаний более $40 млрд 6 ч.
Запрещённые к ввозу в США дроны и маршрутизаторы смогут получать обновления безопасности до января 2029 года 13 ч.
Под руководством Лип-Бу Тана компания Intel так и не избавилась от основных проблем 13 ч.
Война на Ближнем Востоке усугубила дефицит строительных материалов и компонентов для ЦОД 15 ч.
Учёные предложили квантовый процессор с подвижными кубитами — он прост в производстве и гибок в работе 16 ч.
В США расследуют аварии с участием роботакси Avride, ранее входившей в «Яндекс» 22 ч.
Жители США бунтуют против дата-центров — запреты множатся по всей стране 22 ч.
Sony призналась, что ещё не решила, когда и по какой цене выпустит PlayStation 6 24 ч.
Lian Li выпустила СЖО с 6,67-дюймовым изогнутым дисплеем — HydroShift II OLED Curved 360 AIO 24 ч.