Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

ИИ-модель DeepSeek R1 заработала на суверенных китайских ускорителях Sophgo

Высокий спрос на ускорители вычислений Nvidia и других популярных марок сам по себе ограничивает их доступность, а в случае с китайскими разработчиками систем ИИ всё усугубляется американскими санкциями. Нет ничего удивительного, что в сложившихся условиях они предпочли опираться на ускорители местного происхождения, для DeepSeek в этом смысле подошли ускорители Sophgo.

 Источник изображения: DeepSeek

Источник изображения: DeepSeek

По крайней мере, об их успешном применении докладывает South China Morning Post со ссылкой на заявления Sophgo. Ускорители SC11 FP300 этой компании, по данным китайской лаборатории CTTL, продемонстрировали высокое быстродействие и стабильную работу в задачах, связанных с формированием логических выводов (инференсе) при использовании большой языковой модели DeepSeek R1. Подобные задачи требуют меньших вычислительных ресурсов по сравнению с этапом обучения больших языковых моделей.

Ускоритель FP300 был выпущен Sophgo в прошлом году, он оснащается 256 Гбайт высокоскоростной памяти, обеспечивающей пропускную способность до 1,1 Тбайт/с, технически он пригоден и для обучения больших языковых моделей. В то же время, данное аппаратное решение всё же в большей мере заточено под работу с рассуждающими моделями.

Как отмечалось ранее, китайской компании DeepSeek уже пришлось задержать выпуск своей модели R2, который был намечен на май, из-за проблем с доступом к вычислительным ресурсам, необходимым для её обучения. Китайская компания iFlyTek, между тем, уже сообщила о полном переходе на ускорители вычислений Huawei. Китайские решения серии Ascend 910B позволяют добиться эффективности вычислений на уровне 73 % против 25 %, которые были доступны при использовании Nvidia A800 в конце прошлого года. Правда, миграция на китайские ускорители всё же вызвала задержку в выпуске новых языковых моделей на три месяца. Компании iFlyTek и Sophgo находятся под различными санкциями США, поэтому им невольно приходится сближаться для достижения поставленных целей в условиях внешних ограничений.

Источник:


window-new
Soft
Hard
Тренды 🔥
Darkest Dungeon про альпинистов: анонсирована безжалостная пошаговая тактика Ascenders: Beyond the Peak 10 мин.
Власти обязали крупнейшие российские интернет-платформы закрыть доступ пользователям с VPN к 15 апреля 18 мин.
Rowhammer адаптировали для взлома компьютеров через видеокарты — разработаны эксплойты GDDRHammer и GeForge  21 мин.
Google обновила видеоредактор Vids новейшими ИИ-моделями Veo и Lyria, а также добавила управляемые ИИ-аватары 23 мин.
«Словно снова впервые играю в Mass Effect»: новый геймплейный тизер ролевого боевика Exodus от ветеранов BioWare заворожил фанатов 2 ч.
В Apple нашли способ быстро и эффективно строить 3D-сцены с помощью ИИ 3 ч.
Nvidia показала работу RTX Mega Geometry в The Witcher 4 — на RTX 5090 технодемо выдавало 80 кадров/с в 4K с DLSS 3 ч.
Subnautica стала временно бесплатной в Steam и Epic Games Store перед запуском Subnautica 2 4 ч.
Google выпустила семейство открытых моделей Gemma 4 с поддержкой 140 языков и лицензией Apache 2.0 9 ч.
IBM «подружит» мейнфреймы с Arm, но пока, похоже, сама не до конца понимает, зачем 13 ч.
МТС запустила полноценную сеть 5G, но не в России 13 мин.
Tesla впервые с конца 2024 года обошла BYD по объёму поставок электромобилей 16 мин.
Японские производители стекла разглядели возможность заработать на буме ИИ 2 ч.
Китайский производитель роботов UBTech готов платить ИИ-специалистам до $18 млн в год 3 ч.
Анонсирован защищённый смартфон Realme 16 5G с чипом Dimensity 6400 Turbo и батареей на 7000 мА·ч 3 ч.
Внутри американских человекоподобных роботов, включая Tesla Optimus, нашлось множество китайских компонентов 3 ч.
d-Matrix приобрела разработки GigaIO в области дата-центров, включая НРС-платформу SuperNODE 4 ч.
OpenAI внезапно решила потратить более сотни миллионов долларов на покупку популярного ток-шоу 6 ч.
Подготовка к 5G: Yadro инвестирует 135 млрд рублей в производство телеком-оборудования 9 ч.
Новая статья: Восьмеричный путь к AGI: от ложной нирваны к истинной 13 ч.