Сегодня 18 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → суперкомпьютер
Быстрый переход

Новые санкции могут обеспечить «отрицательный рост» серверному рынку Китая, но есть надежда, что всё обойдётся

США усилили санкции против технологического сектора Китая, и в первую очередь ограничения коснутся поставок серверов, CPU и GPU, а также может сильно пострадать рынок памяти DRAM и NAND, сообщают аналитики TrendForce. Ограничения коснутся не только компаний в материковом Китае, но и находящихся в США поставщиков, из которых сильнее всех могут пострадать бизнесы, связанные с производством серверов.

 Источник изображения: Florian Krumm/unsplash.com

Источник изображения: Florian Krumm/unsplash.com

Пока неизвестно, как скажутся ограничения на поставках серверных систем облачным провайдерам в Китае, поскольку непонятно, приравняют ли в США сервисы Baidu, ByteDance, Alibaba и Tencent к используемым для военных целей. Так или иначе, в краткосрочной перспективе провайдерам хватит запасов комплектующих, а в долгосрочной многое будет зависеть от готовности подписать обязательства не использовать купленное оборудование в военных целях и эволюции правил Министерства торговли США.

В TrendForce не исключают, что многие OEM-производители вроде Inspur, H3C и Lenovo попадут под более жёсткий контроль и, если напряжённость между США и Китаем вырастет, цепочка поставок в материковом Китае может серьёзно пострадать. Хотя о прямом запрете на поставки коммерческих серверов речь пока не идёт, не получившие одобрения со стороны США компании со временем могут попасть в чёрный список. В худшем случае ожидается «отрицательный рост» на китайском рынке серверов.

Поскольку новые санкции в основном связаны с рынком высокопроизводительных вычислений и искусственным интеллектом, а соответственно и со связанными с ними компаниями вроде Sugon, в перспективе по мере ужесточения санкций суперкомпьютерным технологиям Китая может быть нанесён серьёзный ущерб.

Санкции ударят по поставкам высокопроизводительных GPU, которые применяются в основном в HPC-вычислениях. Несмотря на ограничения, большие запасы китайских компаний позволяют ожидать, что негативного эффекта на китайскую индустрию можно не ожидать до 1 половины 2023 года, но в долгосрочной перспективе соответствующий рынок могут ожидать серьёзные проблемы и спад в десятки процентов. При этом под ограничения ещё раньше попали высокопроизводительные ускорители вроде NVIDIA A100 и AMD MI250.

Впрочем, производительность многих серверных CPU в целом ниже предела, установленного американским Министерством торговли, поэтому под санкции попадают только решения местной китайской разработки вроде Tianjin Haiguang, которые теперь нельзя будет производить на предприятиях в Тайване или Корее. Intel и AMD будет достаточно подписать меморандумы о взаимопонимании с клиентами, в соответствии с которыми те не будут использовать процессоры в военных целях или в суперкомпьютерах.

 Источник изображения: Paul Hanaoka/unsplash.com

Источник изображения: Paul Hanaoka/unsplash.com

На рынке памяти Samsung и SK hynix уже приостановили поставки оперативной памяти китайской компании Sugon и, если последняя пообещает не использовать их в суперкомпьютерах и подобных системах, можно будет вернуться к сотрудничеству. То же касается и других китайских бизнесов, потенциально связанных с высокопроизводительными вычислениями, а наличие запасов позволяет не заботиться о снабжении в краткосрочной перспективе.

Что касается SSD, необходимых для систем ИИ и глубокого обучения, ограничения в данной сфере могут крайне негативно сказаться на китайских системах соответствующего назначения в случае ограничения поставок в Китай SSD корпоративного уровня.

Наконец, в секторе сетевого оборудования ожидаются малозначимые изменения, поскольку поставщиков подобного железа немало и в Китае, спрос на ключевые компоненты относительно невелик и в целом техпроцессы для производства подобного оборудования достаточно зрелые и освоены в самой стране. Кроме того, довольно трудно отследить, используется ли подобное оборудование в военных целях. В долгосрочной перспективе высока вероятность, что китайские производители серверов могут переключиться на продукцию местных поставщиков.

Новые технические экспортные ограничения были введены США в отношении Китая совсем недавно и пока неизвестно, как они скажутся на китайском бизнесе в реальности, особенно — связанном с высокопроизводительными вычислениями. Известно, что ещё не попавшие в чёрный список компании могут подавать заявки на поставки необходимых им компонентов при готовности к проверкам со стороны зарубежных контролирующих инстанций.

Суперкомпьютер Frontier столкнулся с проблемами по вине чипов AMD — специалисты обещают всё исправить

Самый мощный в мире суперкомпьютер Frontier, запуск которого состоялся в этом году, хоть и приступил к работе, но пока функционирует не на должном уровне, сообщил в интервью InsideHPC Джастин Уитт (Justin Whitt), директор программы Oak Ridge Leadership Computing Facility (OLCF).

 Источник изображения: AMD

Источник изображения: AMD

Frontier основан на 64-ядерных процессорах AMD EPYC Milan (2 ГГц) с ускорителями AMD Instinct MI250X и с использованием фирменного интерконнекта Slingshot 11-го поколения. По словам Уитта, именно с ускорителями AMD Instinct MI250X и интерконнектом Slingshot связаны проблемы оборудования Frontier.

«В основном это проблемы масштабирования в сочетании с разнообразием приложений, поэтому проблемы, с которыми мы сталкиваемся, в основном связаны с выполнением очень, очень больших заданий с использованием всей системы… и обеспечением согласованной работы всего оборудования», — утверждает Уитт. Он добавил, что проблема заключается не только в работе ускорителей, так как есть вопросы и к работе других компонентов.

Джастин Уитт считает, что подобные проблемы являются обычным делом при запуске столь сложной суперкомпьютерной системы, так что особой вины продуктов AMD в данных сбоях он не видит. По его словам, аналогичные проблемы наблюдались и при запуске других вычислительных систем.

Для работы многих приложений на оборудовании таких размеров требуется уникальная настройка. Из-за аппаратных проблем, которые возникли, в том числе, и по вине чипов AMD, сейчас наблюдается задержка с установкой операционной системы. Но специалисты Национальной лаборатории Ок-Ридж уверены, что все работы по отладке системы пройдут в намеченные сроки.

Tesla представила суперкомпьютер Dojo — он настолько мощный, что обрушил энергосистему в Пало-Альто

Tesla представила последнюю версию суперкомпьютера под названием Dojo, который является собственной разработкой компании и оптимизирован под алгоритмы искусственного интеллекта, в частности для машинного обучения с использованием видеоданных, поступающих от электромобилей автопроизводителя. Сообщается, что система настолько мощная, что даже отключила энергосистему в Пало-Альто во время презентации.

 Источник изображения: Tesla

Источник изображений: Tesla

В арсенале Tesla уже имеется большой суперкомпьютер на основе графических процессоров NVIDIA, входящий в число самых мощных в мире. Однако Dojo изготовлен по индивидуальному заказу автопроизводителя, в нём используются чипы, разработанные силами самой Tesla и заточенные под её задачи.

Ожидается, что новый суперкомпьютер расширит возможности в плане обучения нейронных сетей с помощью видеоданных, что имеет решающее значение для технологии компьютерного зрения, которая является основой системы автономного вождения Tesla.

Для построения Tesla Dojo использовались «системы-на-пластине» (System-On-Wafer), т.е. чип представляет собой целую кремниевую пластину (Training Tile в терминологии Tesla). На каждой такой пластине размещено 25 ускорителей D1 и 40 модулей ввода-вывода. В дополнение к этому имеются подсистемы питания и охлаждения. По данным Tesla, одна пластина Dojo может заменить шесть блоков графических процессоров, причём производство одной пластины дешевле в сравнении с блоком графических процессоров.

В одном системном лотке размещается шесть кремниевых пластин. По данным Tesla, один лоток эквивалентен «3-4 полностью загруженным стойкам суперкомпьютера». В настоящее время компания продолжает тестирование инфраструктуры, необходимой для объединения нескольких шкафов и создания Dojo ExaPOD мощностью 1,1 Эфлопс с 1,3 Тбайт SRAM и 13 Тбайт DRAM с высокой пропускной способностью. Tesla планирует построить семь Dojo ExaPOD в Пало-Альто.

Tesla раскрыла подробности о платформе для ИИ-суперкомпьютеров Dojo

Tesla рассказала о разработанной собственными силами суперкомпьютерной архитектуре Dojo — она предназначена для построения систем, оптимизированных под алгоритмы искусственного интеллекта (ИИ), которые в качестве исходных данных получают потоки видео. Для автопроизводителя, погрузившегося в задачу беспилотного вождения, данный вопрос крайне актуален.

 Источник изображений: servethehome.com

Источник изображений: servethehome.com

Платформа Tesla Dojo опирается на «системы-на-пластине» (System-On-Wafer) — то есть чип представляет собой целую кремниевую пластину или Training Tile в терминологии Tesla. На одной такой пластине размещаются 25 ускорителей D1 и 40 компактных модулей ввода-вывода. Пластину также дополняют подсистемы питания и охлаждения, а потребляет она немалые 15 кВт. Производительность каждой Training Tile в задачах тренировки ИИ составляет 9 Пфлопс (BF16/CFP8) — пластины соединяются между собой шиной с шириной канала 9 Тбайт/с.

Также частью Dojo является V1 Dojo Interface Processor — карта PCIe, которая отвечает слаженную работу связок из Training Tile. Они могут объединяться в системы из пяти единиц и обеспечивать пропускную способность для каждой Training Tile на уровне до 4,5 Тбайт/с. В компании разработали свой интерфейс Tesla Transport Protocol (TTP), объединяющий элементы Training Tile между собой — он может работать через Ethernet (TTPoE) с единым адресным пространством, причём для работы подойдёт стандартный Ethernet-коммутатор. Интерфейс TTPoE поддерживает удалённый прямой доступ к памяти (RDMA).

Tesla также продемонстрировала модель V1 Dojo Training Matrix, объединяющую до 3000 ускорителей для построения систем экзафлопсного класса.

Таким образом, Tesla пошла по пути Apple, Google и Amazon, решив самостоятельно разрабатывать аппаратные платформы для своих нужд. И не похоже, что автопроизводитель намеревается наладить продажи Dojo для сторонних компаний.

Китайцы создали на экзафлопсном суперкомпьютере искусственный интеллект масштаба человеческого мозга

Китайские учёные сообщили о создании искусственного интеллекта на базе суперкомпьютера производительностью свыше одного экзафлопса. Система Sunway OceanLight может оперировать 174 трлн параметров (весовыми значениями), что приближает её к масштабу человеческого мозга.

 Источник изображения: Top500.org/News.cn

Источник изображения: Top500.org / News.cn

В мозге человека и животных за весовые значения отвечают синапсы — места передачи сигналов (контакты) от одного нейрона другому. Передача происходит с помощью химико-биологических процессов, и компьютерный термин «весовые значения» вполне соответствует духу процесса. Заявленная учёными способность OceanLight оперировать 174 трлн параметров условно конкурирует лишь с корой больших полушарий мозга человека, в которых содержится порядка 125 трлн синапсов, но это очень и очень неплохо для изучения ИИ масштаба мозга человека.

Сообщается, что для оптимизации модели ИИ к запуску на экзафлопсном суперкомпьютере потребовалось внести аппаратные изменения в архитектуру системы — провести «аппаратную внутриузловую оптимизацию», как и реализовать «гибридные параллельные стратегии» в беспрецедентных масштабах. А с учётом того, что система OceanLight имеет в основе 42 млн вычислительных ядер, объём проделанной работы просто поражает.

Суперкомпьютер OceanLight стал первым в мире решением с производительностью свыше одного экзафлопса. К сожалению, китайские учёные перестали передавать данные в комитет TOP500 для отслеживания самых производительных в мире систем. Но шила в мешке не утаишь. Данные, так или иначе, просачиваются в прессу и заставляют ожидать удивительных решений.

Китай перестал раскрывать данные о новейших суперкомпьютерах — это снижает ценность мировых рейтингов

Согласно обновлённому рейтингу TOP500 самых мощных компьютеров мира, экзафлопсный барьер был преодолён официально. Но не ищите среди рекордсменов китайские системы. В списке рейтинга их нет, хотя на самом деле они есть и, судя по обрывочным данным, легко опережают «публичных» рекордсменов. Для июньского TOP500 Китай в очередной раз не предоставил данные по самым мощным компьютерам, и это проблема для всех.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

«Отсутствующие китайские машины влияют на список TOP500 и изменяют историческую информацию, которую передает список», — сказал Джек Донгарра (Jack Dongarra), заслуженный профессор информатики в Университете Теннесси в США.

Начиная с 1993 года, рейтинговая информация о самых мощных суперкомпьютерах мира публиковалась два раза в год. С самого начала Китай активно участвовал в рейтинге. Ситуация стала меняться в последние годы, когда начались торговые трения между США и Поднебесной. Судя по всему, официального запрета «сверху» о предоставлении подобной информации на Запад нет, поскольку ряд китайских организаций продолжает передавать данные для составления рейтинга TOP500.

Также специалисты примерно представляют с какими современными системами работают в Китае. Для спецслужб и людей в теме в этом особых секретов нет. «Мы знаем, что они [новейшие суперкомпьютеры] существуют, и об использовании этих систем были написаны исследовательские работы. Мы понимаем их компетентную производительность, но ничего не было представлено официально», — подтверждает Донгарра.

Согласно свежему рейтингу TOP500, о чём мы на днях рассказывали, официально и публично отметку в 1 Эфлопс в бенчмарке HPL на FP64-вычислениях первым преодолел суперкомпьютер Frontier с устоявшейся производительностью 1,102 Эфлопс при теоретическом пике в 1,686 Эфлопс. Если бы китайцы не секретничали, на первом месте вполне могла оказаться машина Tianhe-3 из Поднебесной с устоявшейся производительностью более 1,3 Эфлопс и пиковой свыше 1,7 Эфлопс. Но у Китая есть и другие машины аналогичного класса.

Более того, ожидается, что уже через три года у КНР будет сразу 10 систем экзафлопсного класса, так что разрыв с США (не в пользу последних) резко увеличится. Для мирового рейтинга суперкомпьютеров отсутствие информации о новейших китайских системах — это серьёзная брешь и снижение конкурентного давления на рынке, считают профильные специалисты. Китай публично не желает открывать карты и при этом владеет полной информацией.

При этом нельзя забывать, что участие в TOP500 сугубо добровольное. Полноценный прогон Linpack на крупных машинах — затея дорогая во всех смыслах. И если для академических структур запуск бенчмарка позволяет в какой-то степени отчитаться о потраченных средствах, то для коммерческих компаний (например, из нефтегазового сектора) это может быть сомнительным удовольствием. Вместе с тем ценность Linpack как единого мерила производительности в последние годы значительно снижается.

Суперкомпьютер Frontier первым в мире показал производительность выше 1 экзафлопса — он построен на AMD EPYC и Instinct

Успехи компании AMD в серверном сегменте рынка была призвана проиллюстрировать новая редакция списка 500 самых производительных суперкомпьютеров в мире. Этот перечень возглавила новая система Frontier, сочетающая 9408 процессоров AMD EPYC и 37 632 ускорителя AMD Instinct MI250x. В совокупности они обеспечивают уровень быстродействия свыше одного экзафлопса, позволяя впервые в истории суперкомпьютеров преодолеть этот символический барьер.

 Источник изображения: AMD

Источник изображения: AMD

По словам представителей эксплуатирующей систему Национальной лаборатории Ок-Ридж, на постоянной основе она способна выдавать до 1,1 экзафлопса, а пиковая производительность достигает 1,686 экзафлопса. Быстродействие Frontier более чем в два раза превышает показатели второго суперкомпьютера в этом списке, а также превосходит суммарную производительность семи последующих систем в новой редакции списка Top500.

 Источник изображения: AMD

Источник изображения: AMD

Удалось Frontier попасть и на вторую позицию списка Green500, который содержит упоминания о самых энергоэффективных суперкомпьютерах. Возглавляет его родственная система Frontier TDS. Высокого соотношения производительности и энергоэффективности удаётся добиться за счёт активного использования графических процессоров в составе ускорителей Instinct MI250x, коих в составе Frontier приходится по четыре штуки на каждый центральный процессор AMD EPYC поколения Milan с 64 ядрами и базовой тактовой частотой 2 ГГц. Компания AMD особенно гордится тем, что её компоненты используются в восьми из десяти самых энергоэффективных суперкомпьютерах мира, а в пределах первой двадцатки она присутствует в семнадцати системах.

 Источник изображения: AMD

Источник изображения: AMD

Frontier использует платформу HPE Cray EX235a и занимает 74 стойки, соединяемые 144 км сетевых кабелей. Применяется жидкостное охлаждение компонентов, что тоже соответствует передовым решениям, используемым в данном сегменте. В минуту через систему прокачиваются более 22 тысяч литров воды, используются четыре насоса мощностью по 350 л.с. каждый и рассчитана на отвод до 40 МВт тепловой энергии. По словам AMD, производительности насосов хватило бы, чтобы наполнить бассейн олимпийского стандарта (50 м) всего за тридцать минут. Каждая стойка весит более 3600 кг, энергопотребление всей системы достигает 21,1 МВт, а объём хранилища измеряется 700 петабайтами. Фактически, Frontier способен за одну секунду выполнять более 1 (1018) квинтиллиона операций с плавающей запятой.

До конца года к вычислительным мощностям Frontier получат доступ первые специалисты, а полномасштабная эксплуатация стартует уже в начале следующего года. В июньскую редакцию списка Top500 вошли 94 системы на основе компонентов AMD, что на 95 % превышает показатели прошлого года. Дебютировавшим недавно ускорителям AMD Instinct MI200 удалось прописаться в семи суперкомпьютерах данного списка.

Поставлена первая коммерческая система на «кремниевом мозге» IBM

Компания IBM официальным пресс-релизом сообщила, что Ливерморская национальная лаборатория им. Лоуренса стала первым покупателем единственного в мире компьютера, имитирующего работу головного мозга. Уникальная система базируется на разработке IBM по созданию нейросинаптического процессора. Проект стартовал в 2008 году по заказу агентства DARPA. Ожидалось, что IBM создаст процессор, способный на оперативный анализ данных на поле боя. Процессор должен был работать по алгоритмам, имитирующим работу головного мозга. Соответственно, в основе разработки лежит архитектура, отличная от классической неймановской логики.

 Структура кристалла процессора IBM TrueNorth (IBM)

Структура кристалла процессора IBM TrueNorth (IBM)

После серии изысканий в 2011 году компания IBM представила процессор TrueNorth. Решение выпускалось с использованием 45-нм техпроцесса SOI-CMOS и содержало 256 аналогов нейронов. Кроме этого одно ядро содержало 262 тысяч программируемых аналогов синапсов, а в другом находились 65 тысяч обучаемых синапсов. Естественно, все эти «нейроны и синапсы» представляли собой электронные цепи из обычных кремниевых транзисторов, но связанных между собой специальной логикой по типу ячеистых сетей.

 Процессор IBM TrueNorth второго поколения (IBM)

Процессор IBM TrueNorth второго поколения (IBM)

Второе поколение процессоров TrueNorth вышло в 2014 году. Производством процессора с использованием 28-нм техпроцесса занималась компания Samsung. Новый процессор включал уже один миллион цифровых нейронов и 256 млн программируемых синапсов. При всём этом процессор TrueNorth — это чип с 5,4 млрд транзисторов. Что поразительно, довольно большое число транзисторов не сказалось на потреблении процессора. В ходе вычислений с производительностью 46 млрд синаптических операций в секунду процессор потребляет всего 70 милливатт (0,8 вольт). Ливерморской лаборатории передан компьютер на базе 16 таких процессоров и его потребление составляет всего 2,5 Вт — как у планшета.

 16-ядерная система на «когнитивных» процессорах IBM TrueNorth, проданная Ливермольской лаборатории

16-ядерная система на «когнитивных» процессорах IBM TrueNorth, проданная Ливерморской лаборатории

Кроме компьютера компания IBM включила в поставку набор необходимого программного обеспечения как для работы системы, так и для разработки программ. Ожидается, что имитирующий работу мозга компьютер поможет решить ряд сложных для традиционной логики задач. В лаборатории не скрывают, что основным направлением деятельности с использованием «познающей» системы станет изучение проблем по заказам Национальной администрации по ядерной безопасности (National Nuclear Security Administration), которая занимается широким спектром вопросов контроля над распространением ядерного вооружения. Также в лаборатории будут прорабатывать варианты создания суперкомпьютеров будущего с 50-кратно увеличенной производительностью по отношению к современным системам.

 Ведущий разработчик «когнитивного» процессора IBM, Дхармендра Модха (Dharmendra S. Modha)

Ведущий разработчик «когнитивного» процессора IBM, Дхармендра Модха (Dharmendra S. Modha)

Кстати, по неофициальным данным, которые приводит сайт The Wall Street Journal, система IBM обошлась лаборатории всего в один млн долларов США. В принципе, неплохо для IBM за систему с 16-ядерным процессором. Компаниям Intel и AMD такое даже не снилось.


window-new
Soft
Hard
Тренды 🔥
Twitter официально переехал на домен X.com 54 мин.
Команда специалистов OpenAI по защите человечества от угроз, связанных с ИИ, просуществовала менее года 2 ч.
Google выпустил вторую бету Android 15 с «Личным пространством», предиктивным «Назад» и множеством других нововведений 9 ч.
Новая статья: Animal Well — колодец, из которого не хочется вылезать. Рецензия 9 ч.
В России готовы взяться за борьбу с серым импортом видеоигр 10 ч.
Microsoft начала веерные остановки подписок на свои облачные продукты для российских корпоративных клиентов 10 ч.
Лучше поздно, чем никогда: Arkane Austin всё-таки выпустит финальное обновление Redfall 11 ч.
МТС открыла магистратуру по искусственному интеллекту в Высшей школе экономики 13 ч.
Sony пригрозила 700 компаниям судом за несанкционированное использование музыки для обучения ИИ 13 ч.
Ubisoft отреагировала на слухи о требованиях Assassin's Creed Shadows к постоянному онлайн-подключению 14 ч.
Летающими электромобилями XPeng можно будет управлять без особых разрешений, но только за пределами городов 3 ч.
Слухи: Apple готовит сверхтонкий iPhone 17 — он выйдет в 2025 году и будет дороже iPhone 17 Pro Max 7 ч.
Крупнейший в России оператор ЦОД и облачных услуг «РТК-ЦОД» готовится к IPO 11 ч.
Palit представит на Computex видеокарту с водоблоком и воздушной системой охлаждения 13 ч.
Роборуки от MIT помогут астронавтам NASA встать после падения на Луне 13 ч.
Xiaomi представила смартфон среднего уровня Redmi Note 13R — он почти идентичен Redmi Note 12R 13 ч.
AT&T и AST SpaceMobile обеспечат спутниковой связью обычные смартфоны сначала в США, а после — по всей Земле 13 ч.
TSMC будет выпускать основания для стеков HBM4 по 12- и 5-нм техпроцессам 15 ч.
LG свернула производство рулонных телевизоров Signature OLED R 15 ч.
Производитель микроэлектроники «Элемент» выйдет на биржу до конца мая — это позволит привлечь до 15 млрд рублей на развитие 16 ч.