Сегодня 20 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

Микроархитектура AMD Bulldozer и новое поколение процессоров AMD Opteron

Начало лета выдалось для компании AMD чрезвычайно жарким. Прошла буквально пара недель с официального анонса мобильной платформы Sabine, в основе которой лежат процессоры Llano — долгожданный Fusion! — и компания анонсировала платформу для настольных компьютеров, основанную на тех же процессорах. А чтобы журналистам было совсем уж нескучно, в AMD решили одновременно с официальным выпуском настольной платформы поделиться информацией о новой микроархитектуре Bulldozer. А заодно — продемонстрировать новые серверные процессоры Opteron, которые основаны на этой микроархитектуре.

В качестве места для презентации был выбран Дрезден — город, в котором расположена самая крупная фабрика GlobalFoundries, компании, в которую вошли все производственные активы, ранее принадлежавшие AMD. Собственно, мероприятие было проведено на самой фабрике — ранее носившей название AMD Fab 36, а ныне переименованной в GlobalFoundries Fab 1.

Несмотря на то, что в программе мероприятия значилась экскурсия по фабрике, на само производство, в чистую комнату, как водится, не пустили. И не потому, что боятся, что журналисты натопчут в стерильном помещении. И даже не потому, что кто-то может высмотреть какие-то технологические тайны собственно GlobalFoundries. Все проще: на фабрике производятся чипы множества fabless-разработчиков, и некоторым из них крайне не хочется, чтобы их изделия попадали на глаза журналистам.

Даже те не слишком многочисленные части производства, которые удалось увидеть, не удалось снять: собственные фотоаппараты взять на экскурсию было нельзя, а «фирменного» фотографа к делегации журналистов не прикомандировали. Поэтому сколько-нибудь подробный рассказ о GlobalFoundries Fab 1, к сожалению, придется отложить до лучших времен.

А поговорим мы о более насущном, о «бульдозерах». Bulldozer — это совершенно новая архитектура процессорных ядер AMD. Причем устроена она весьма необычно по сравнению с предыдущими поколениями микропроцессорных архитектур AMD — K10, K8 и так далее. И вообще достаточно необычно для x86-архитектур, которые славятся своим консерватизмом.

Начать стоит с того, что новая микроархитектура AMD создана с чистого листа. Собственно, именно поэтому она и не называется K11, как того можно было ожидать, — отказ от наименований с буквой «K» призван подчеркнуть существенное отличие новой архитектуры от предыдущих поколений. Надо полагать, и само по себе слово «бульдозер» намекает на то же самое. Весь мир насилья мы разрушим — и построим все заново.

На начальной стадии проектирования архитектура Bulldozer задумывалась как традиционная CMP (Chip-level MultiProcessing), выполненная по схеме «одно физическое ядро — один поток». Собственно, такой подход и практиковали в AMD при разработке предыдущих микроархитектур.

В отличие от разработчиков AMD, их коллеги из Intel уже достаточно давно, хотя и с перерывами, применяют схему SMT (Simultaneous MultiThreading), которую в общих чертах можно охарактеризовать как «одно физическое ядро — два виртуальных ядра — два потока». То есть Hyper-threading Technology, если пользоваться собственным наименованием Intel.

Оба эти подхода имеют свои недостатки, поэтому в AMD приняли решение избрать третий, довольно своеобразный путь. Так концепт Bulldozer из обычного «одноядерного субпроцессора» превратился в двухъядерный модуль, в котором значительная часть аппаратных ресурсов используется ядрами совместно.

Выделенными ядрами в новой компоновке AMD оказываются классические x86-процессоры, работающие с целочисленными вычислениями. Каждый из них обладает собственным планировщиком и личной кеш-памятью первого уровня для хранения данных (16 Кбайт). Собственно, на этом выделенные блоки «бульдозера» заканчиваются и начинаются разделяемые.

Во-первых, в совместном использовании потоков оказывается та часть процессора, которая осуществляет предварительную обработку данных. Предсказатель ветвления, x86-декодеры, и так далее, включая 64-килобайтный кеш инструкций, — все это содержится в единственном разделяемом блоке двухъядерного модуля Bulldozer.

Во-вторых, разделяемым сделан блок, осуществляющий вычисления с плавающей запятой. Если говорить максимально упрощенно, это можно примерно представить как систему с двумя процессорами x86 и только одним сопроцессором x87.

Кроме того, блок вычислений с плавающей запятой содержит внутри себя дополнительное разделение ресурсов: при работе с набором инструкций AVX (Advanced Vector eXtensions) два 128-битных FPP могут быть объединены в один 256-битный FPP.

Наконец, третий разделяемый блок — общий кеш второго уровня объемом 2 Мбайт, совместно используемый обоими ядрами модуля Bulldozer.

В AMD утверждают, что потери производительности за счет использования такой замысловатой схемы не слишком велики: порядка 80% от того, что можно было бы получить, если бы Bulldozer был выполнен по классической схеме CMP с полностью обособленными и индивидуально оснащенными ядрами. В AMD специально подчеркивают: не 80% от производительности предыдущего поколения процессоров, а 80% от того, на что был бы способен полноценный двухъядерный Bulldozer, если бы он был воплощен в железе.

На иллюстрации 8-ядерный чип, собранный из 4 модулей Bulldozer

В то же время такая компоновка позволяет достигнуть «существенной экономии» (к сожалению, конкретные цифры представители компании категорически отказываются приводить) количества транзисторов. И, следовательно, уменьшить площадь, занимаемую вычислительными ядрами, понизить энергопотребление процессора и его стоимость.

В модуль Bulldozer заложен хороший потенциал и по части энергосбережения. В частности, есть поддержка power gating — почти полного отключения процессорных ядер в случае, если они не используются. Правда, тут модульная структура может стать скорее минусом: отключаются все же не отдельные ядра, а модули. И для этого они должны оба быть готовы перейти в соответствующее состояние.

Разумеется, есть и обратная функция — динамический разгон части или всех процессорных ядер в том случае, если текущее тепловыделение позволяет повысить частоту без опасности перегрева процессора. Эта функция, впервые появившаяся у AMD в шестиядерных процессорах Thuban, носит название TurboCore.

Модуль Bulldozer поддерживает все актуальные для x86-процессоров наборы инструкций: SSE 4.1, SSE 4.2, AES NI и вышеупомянутый AVX. Дополнительно поддерживается несколько наборов инструкций, призванных обеспечить ту же функциональность, что и грядущий SSE5: XOP и FMA4 (4-операндная версия Fused Multiply-Add).

Правда, относительно набора инструкций FMA уже известно, что в AMD поторопились. Компания Intel в своих будущих процессорах будет использовать FMA3, трехоперандную версию этого набора инструкций (A=A+B*C вместо A=B+C*D). Несмотря на близкую функциональность, эти версии несовместимы, так что в следующих версиях архитектуры в AMD постараются избежать конфронтации и также используют FMA3.

В качестве первого применения модулей Bulldozer в AMD избрали рынок серверов и суперкомпьютеров, на котором компания чувствует себя очень даже неплохо. Модули Bulldozer в серверных Opteron объединяются в блоки по четыре и комплектуются общим кешем L3 объемом 8 Мбайт на процессор, двухканальным контроллером памяти с поддержкой DDR3-1600 и тремя соединениями HyperTransport x16. Так устроены процессоры Opteron серии 4000 (Valencia) — с 6 или 8 ядрами.

Более производительные Opteron серии 6000 (Interlagos) представляют собой сборку из двух четырехмодульных блоков Opteron 4000. Контроллер памяти в этом случае уже четырехканальный, количество соединений HyperTransport x16 увеличено до четырех, а объем кеш-памяти L3 составляет 16 Мбайт на процессор. В этих процессорах могут быть задействованы 8, 12 или 16 вычислительных ядер. При этом следует иметь в виду, что 8-ядерный Opteron 6000 выгодно отличается от 8-ядерного Opteron 4000 гораздо большим объемом кеша L3 и более широкой пропускной способностью памяти в пересчете на одно ядро.

Оба варианта новых процессоров Opteron будут производиться по технологическому процессу 32 нм SOI High-K Metal Gate. Разумеется, производиться они будут компанией GlobalFoundries.

Хорошая новость для владельцев серверов и суперкомпьютеров, основанных на предыдущем поколении процессоров Opteron, состоит в том, что они смогут модернизировать свои системы без замены материнских плат. Новые Opteron используют те же самые Socket C32 (Opteron 4000) и Socket G34 (Opteron 6000). Все, что потребуется для замены процессоров, — это обновление BIOS.

В будущем архитектура Bulldozer должна распространиться и на другие рынки: сперва она придет в настольные компьютеры для энтузиастов, а после этого — в более прозаические десктопы и ноутбуки.

Такое продвижение сверху вниз внушает определенный оптимизм. В конце концов, владельцы серверов и суперкомпьютеров — люди в разы более придирчивые и экономные, чем пользователи персоналок. И если компания не боится представить новую архитектуру в первую очередь для них — значит в AMD в ней действительно уверены.

 
 
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Schneider Electric ведёт переговоры о покупке Bentley Systems 4 ч.
Новая статья: Atom Bomb Baby: рассказываем, почему Fallout — идеальная экранизация видеоигрового материала, и почему этот сериал не стоит пропускать 5 ч.
Bethesda готовит «несколько очень хороших обновлений» для Starfield, а Fallout 5 не в приоритете 6 ч.
Apple откроет сторонним приложениям доступ к NFC 6 ч.
В Dota 2 стартовало сюжетное событие «Павшая корона» с уникальными наградами, новыми «арканами» и комиксом 6 ч.
Связанные одной шиной: «Лаб СП» и «Фактор-ТС» представили отечественную интеграционную платформу Integration Gears 7 ч.
Paradox отказала Prison Architect 2 в досрочном освобождении — релиз отложили ещё на четыре месяца 8 ч.
Спустя 17 лет после релиза Team Fortress 2 получила поддержку 64 бит — выросла производительность и даже боты пропали 9 ч.
Netflix резко нарастила аудиторию и прибыль, запретив совместное использование аккаунтов 10 ч.
Российские студенты победили в чемпионате мира по программированию ICPC 11 ч.
Гиперщит с ИИ: Cisco представила систему безопасности Hypershield 6 ч.
Highpoint представила карту расширения на восемь SSD: до 64 Тбайт со скоростью до 56 Гбайт/с 6 ч.
Китайские экспериментальные лунные навигационные спутники прислали фотографии обратной стороны Луны 6 ч.
Налоговая служба Швеции закрыла 18 дата-центров за незаконный майнинг криптовалют 7 ч.
LG выпустила флагманский саундбар S95TR за $1500 с поддержкой Dolby Atmos и настройкой с помощью ИИ 9 ч.
Seagate заявила, что жёсткие диски с HAMR уже не уступают по надёжности традиционным HDD 10 ч.
Corsair представила обновлённые доступные проводные гарнитуры HS35 v2 для геймеров 10 ч.
Tesla отзовёт все проданные электромобили Cybertruck для замены залипающей педали газа 12 ч.
Galax выпустила полностью белую низкопрофильную GeForce RTX 4060 с крошечным заводским разгоном 13 ч.
Razer представила игровые контроллеры Kishi Ultra и Kishi V2 для смартфонов, планшетов и ПК 13 ч.