Сегодня 25 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Китайская Moore Threads представила ИИ-ускоритель MTT S4000 — он до 15 раз медленнее NVIDIA H100

Китайская компания Moore Threads представила специализированный ускоритель вычислений MTT S4000 на фирменном GPU, который обеспечивает производительность на уровне 200 TOPS (триллионов операций в секунду) в операциях, связанных с искусственным интеллектом и большими языковыми моделями.

 Источник изображений: Moore Threads

Источник изображений: Moore Threads

В основе MTT S4000 используется графический процессор на основе архитектуры MUSA третьего поколения. Подробностей о самом GPU компания не сообщила. Ускоритель выполнен в формате карты расширения PCIe и оснащён 48 Гбайт памяти GDDR6 со скоростью 16 Гбит/с на контакт и общей пропускной способностью на уровне 768 Гбайт/с. Для MTT S4000 заявляется поддержка интерфейса MTLink 1.0, позволяющего объединять несколько подобных ускорителей в одной системе. Новинка обладает интерфейсом PCIe 5.0. Moore Threads — единственная компания на рынке, оснащающая свои видеокарты интерфейсом PCIe 5.0.

Компания заявляет, что MTT S4000 обеспечивает производительность 25 Тфлопс в операциях FP32, 50 Тфлопс в операциях TF32, 100 Тфлопс в операциях FP16/BF16 и 200 TOPS в операциях INT8. Это в пять раз больше, чем обеспечивают новейшие процессоры AMD Ryzen 8040 и Intel Core Ultra, оснащённые специализированными нейродвижками (NPU), предназначенными для различных ИИ-задач. Однако до флагманских ИИ-ускорителей NVIDIA и AMD ему далеко. PCIe-версия NVIDIA H100 обеспечивает до 51 Тфлопс в операциях FP32, до 756 Тфлопс в вычислениях TF32, 1513 Тфлопс при работе с FP16/BF16 и до 3026 TOPS в INT8.

Примечательной особенностью специализированного ИИ-ускорителя MTT S4000 является его оснащение четырьмя внешними видеоразъёмами. Обычно решения такого уровня подобных интерфейсов не имеют. К MTT S4000 можно подключать дисплеи с поддержкой разрешения до 8K. Ускоритель поддерживает до 96 видеопотоков в разрешении 1080p, а также работает с новейшими инструментами разработки USIFY, которые могут в полной мере использовать программное обеспечение NVIDIA на базе CUDA.

Moore Threads на презентации отметила, что MTT S4000 будут предлагаться в том числе в составе серверных вычислительных систем KUAE, аналогичных DGX-системам NVIDIA. В составе одного сервера KUAE MCCX D800 содержится восемь ускорителей MTT S4000. Платформа предлагает дальнейшую масштабируемость, позволяя объединять несколько таких серверов в единые кластеры. Ускорители Moore Threads MTT S4000 и системы KUAE на их основе поддерживают все современные большие языковые модели (LLM), включая Llama, GLM, Aquila, Baichuan, GPT, Bloom, Yuyan, и способны справляться с LLM, имеющими до 130 млрд различных параметров.

О стоимости MTT S4000 производитель ничего не сообщил. Известно, что первая партия из тысячи таких ускорителей будет использоваться для создания первого в Китае крупномасштабного вычислительного кластера для задач, связанных с ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Найден способ навсегда избавить поисковую выдачу Google от советов ИИ 48 мин.
«Лаборатория Касперского» обнаружила вирус-вымогатель ShrinkLocker — он использует BitLocker 50 мин.
Суд обязал Google посчитать, сколько будет стоить реформа «Play Маркет», которую требует Epic Games 2 ч.
Google пытается вручную удалять вредные и странные ответы своего ИИ-поисковика 3 ч.
После волны увольнений Tesla открыла вакансии в сфере ИИ с зарплатой до $360 000 в год 9 ч.
Новая статья: Crow Country — для тех, кто помнит. Рецензия 11 ч.
Скорый анонс новой Doom подтвердил надёжный источник — первые подробности Doom: The Dark Ages 16 ч.
«Лучший экшен 2024 года», кроссплей и никаких микротранзакций: новые подробности Warhammer 40,000: Space Marine 2 16 ч.
Исследование: основной целью хакеров при атаках на промышленность является шпионаж 16 ч.
Обойдёмся без Oracle: «Ростелеком» создаст собственную биллинговую систему с СУБД от «СберТеха» 17 ч.
Boeing нашла новую проблему у космического корабля Starliner, но это не повод переносить первый пилотируемый полёт 2 ч.
Для Raspberry Pi 5 выпустили башенный корпус с RGB и NVMe 3 ч.
Так вот как это было! «Джеймс Уэбб» засёк начало рождения галактик в ранней Вселенной 6 ч.
К следующему году Китай станет основным поставщиком электромобилей с поддержкой сверхбыстрой зарядки 6 ч.
Американские регуляторы решили углубиться в расследование новых инцидентов с прототипами беспилотных такси Waymo 8 ч.
Gunnir выпустила уникальные видеокарты Photon Arc A750 и Arc A770 в стиле Elden Ring: Shadow of the Erdtree 17 ч.
Продажи смартфонов в Европе закончили трёхлетнее падение, но до полного восстановления рынка ещё далеко 17 ч.
SpaceX Starship в следующий раз полетит в космос 5 июня, но это не точно 19 ч.
Банк России зафиксировал всплеск активности россиян на криптовалютном рынке 20 ч.
Китайские батареи для электромобилей будут вдвое дешевле американских, даже с новыми пошлинами США 20 ч.