Сегодня 19 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

Процессор Intel QX9650 семейства Penryn

⇣ Содержание

В уходящем 2007 году, компания Intel подготовила пользователям довольно приятный сюрприз: запустила в производство новую серию процессоров выпущенных по 45 нм техпроцессу. Любая смена техпроцесса является очень удачным моментом для обновления структуры процессорного ядра. Дело в том, что любое ядро (не важно какое - это может быть видео, процессор, чипсет, звуковой процессор и пр.) не является совершенным, в нем есть ошибки, недоработки, а также нереализованные (по многочисленным соображениям) возможности. Ошибки (за исключением очень серьезных, которых уже не было года три-четыре) пользователь не видит: они обходятся на уровня чипсета и BIOS материнской платы. И как только стало известно о переходе Intel на 45нм техпроцесс, все стали ожидать обновление ядра Conroe. И Intel оправдала ожидания - представила новое семейство процессоров под названием Penryn, которое включает 4-ядерное ядро Yorkfield и 2-ядерное Wolfdale.

Ядро Conroe является на сегодняшний момент наиболее совершенным и "продвинутым", и процессоры на нем легко обходят единственных конкурентов из AMD. Поэтому вполне понятна позиция Intel, которая не стала изменять принципиальную архитектуру Core, а ограничилась только модификацией. Итак, что же изменили и добавили инженеры Intel. Во-первых серьезно ускорено выполнение операций деления (как целых, так и вещественных чисел). Модифицированный блок деления получил название Fast Radix-16 (у семейства Core аналогичный блок назывался Radix-4). Результат - за один проход новый блок обрабатывает 4 бита вместо двух. Вообще-то, программисты по традиции продолжают избегать операций деления, как относительно медленных, заменяя их умножением. То же самое делают и различные компиляторы. Но в любом случае, любое ускорение операций деления пойдет на пользу общей производительности процессора. К тому же, операции извлечения квадратного корня не так-то просто обойти, а именно тут Penryn работает гораздо быстрее Conroe.

Еще у Penryn серьезно модифицирован блок отвечающий за исполнение потоковых команд. На этот шаг инженеры Intel пошли, поскольку в новых процессорах реализован дополнительные набор инструкций SSE4.1. Наибольшие изменения коснулись блока перестановок, который осуществляет битовые перестановки в 128-битных регистрах. Теперь такие операции как упаковка, распаковка, сдвиг упакованных значений, вставка выполняются в соответствующем регистре всего за один такт. В результате блок перестановок получил название Super Shuffle Engine, а его использование дает практически двукратный рост производительности при выполнении потоковых инструкций. Сам набор потоковых команд SSE4.1 включает 47 новых инструкций, которые значительно облегчают жизнь программистам при разработке программного обеспечения связанного с обработкой потоковой информации. Это могут быть задачи видео и аудио кодирования, научные задачи и трехмерная графика.

А сейчас попытаемся разобраться, что все это дает простому пользователю. Итак, обычный домашний пользователь никакой разницы в скорости между процессорами Core и Penryn не заметит. Да, Penryn работает чуть быстрее за счет более "зрелой" архитектуры, но в обычном, неоптимизированном программном обеспечении эта разница будет составлять несколько процентов. Другое дело - оптимизированное ПО. Для начала оптимизация под многоядерность. Если она есть, то прирост производительности 4-ядерного процессора по сравнению с условным одноядерным (работающем на такой же частоте, и имеющий ту же архитектуру) может колебаться от 200% до 400%! А оптимизация под использование инструкций SSE4.1 обеспечивает преимущество Penryn над Core до 30% при одной и той же частоте.

Единственный вопрос - где все это оптимизированное ПО? Среднестатистический пользователь с таким, к сожалению, не сталкивается. Да и сами программисты не горят желанием тратить ресурсы на решение подобных задач.

Однако, на компьютере не только играют - на нем еще иногда и работают. Здесь ситуация с оптимизацией получше. Соответствующие дополнения есть в разнообразных графических редакторах (различные 3DMax, POV-ray и Photoshop CS), в программах обработки видео (DivX, Microsoft Media Encoder). Например DivX 6.7 уже сейчас поддерживает SSE4.1. Это значит, что перекодируя утром фильм для последующего просмотра его на мобильном устройстве, обычный студент сэкономит время, и таки успеет на первую пару. Еще значительный выигрыш будет заметен в программах архивирования (например WinRAR). Но кроме таких программ, большая часть другого ПО использует сжатие данных - например все последние игры на движках ID Software хранят массу файлов в виде сжатых файлов-контейнеров. Иными словами - загрузка определенных игр и переход между уровнями будет происходить заметно быстрее.

Стоит подчеркнуть еще один момент. Новые процессоры Penryn лучше всех своих предшественников не только за счет усовершенствований, но и за счет собственно 45 нм техпроцесса. Напряжение ядра стало меньше, тепловыделение меньше, а потенциал тактовой частоты - выше. Однако, Intel не спешит наращивать частоты: известно только о запланированном достижении частот 3,0 - 3,33 ГГц. А возможно при переходе на 400МГц шину, мы увидим процессор с частотой 3,6 ГГц. Но это будет к концу 2008 года. Именно до этого срока запланировано время жизни семейства Penryn, после которого на сцене появится совершенно новая архитектура Nehalem со встроенным контроллером памяти (топовые процессоры будут иметь 8 ядер и одновременно исполнять 16 потоков!). Тогда же Intel точно перейдет на 32 нм техпроцесс, а AMD, может быть, порадует сообщением о успешном освоении 65 нм техпроцесса.

Конечно же 45 нм техпроцесс порадует оверклокеров, как только они получат в руки первые такие процессоры. Потенциал ядра выше - значит можно разгонять сильнее; тепловыделение процессоров меньше - значит можно подать более высокое напряжение (на том же самом кулере), и опять же разогнать еще сильнее. Осмелюсь даже предположить, что тактовая частота = 4 ГГц уже не будет считаться "достижением", как происходит сейчас с 65 нм процессорами Core.

Однако, преимущества 45 нм техпроцесса не ограничиваются радостью оверклокеров. Он позволяет инженерам Intel уменьшить физические размеры ядра, что означает снижение его себестоимости (т.е. на одной пластине можно "вырастить" большее количество ядер). Снижение себестоимости никак не касается пользователей - они получают процессоры по стандартным, фиксированным ценам. Но! Покупая процессор семейства Penryn (Yorkfield или Wolfdale) пользователь получает не 4 мегабайта кеш-памяти второго уровня (как у Conroe), а 6 мегабайт на каждом из чипов. Т.е. у тестового процессора QX9650, который включает два Wolfdale общий объем кеша L2 = 12 Мб, и именно это значение будет указано во всех спецификациях и прайс-листах. Кстати, о цене - QX9650 будет продаваться по цене в 1000$.

И что самое интересное, даже с большим объемом кеша, физические размеры Wolfdale заметно меньше чем у Conroe: 107 кв. мм. против 143 кв. мм! Причем у Wolfdale на этой площади расположено 410 миллионов транзисторов, а у Conroe - "только" 291 миллионов.

ядро Wolfdale

Получается, что Yorkfield содержит почти миллиард транзисторов (820 или 2 х 410), или примерно миллион транзисторов на $1 (для QX9650)! Более терпеливые приобретут транзисторы дешевле: в через 6-8 недель выйдет процессор Q9450 (Yorkfield) с тактовой частотой 2,66 ГГц по цене ~$316.

Больший объем кеша L2 положительно повлияет на скорость работы ПО, производительность которого зависит от этого фактора. Однако кеш L2 у Penryn стал несколько медленнее, чем у Conroe. Впрочем, инженеры Intel отчасти компенсировали этот недостаток функцией Split Load Cache Enhancement.

Что касается типичного тепловыделения, то для тестового процессора QX9650 оно равно 130 Вт. Больше будет выделять только QX9770, у которого TDP будет равно 136 Вт, что вполне приемлемо для частоты 3,2 ГГц. Эта модель появится в первом квартале 2008 года по цене ~$1400.

Впрочем, до 2008 года еще полтора месяца, а сейчас первым и пока единственным представителем нового семейства Penryn является процессор Core 2 Extreme QX9650 с тактовой частотой 3 ГГц, который содержит четыре ядра и работает на частоте FSB = 333 МГц (1333 QPB).

Внешне новинка совершенно обыденная, просто еще один LGA775-процессор. Причем даже из маркировки нет возможности определить начинку под теплораспределителем (собственно как и у всех других инженерных семплов Intel):

Если крышку снять, то мы обнаружим два двухъядерных чипа Wolfdale, на каждом из которых установлено по 6 Мб кеш-памяти второго уровня (общий объем кеша L2 = 12 Мб).

На обратной стороне процессора мы можем обнаружить несколько отличную конфигурация конденсаторов.

Слева - Conroe, справа - Yorkfield

Утилита CPU-Z предоставляет следующую информацию:

Теперь, на основании предварительной информации, составим таблицу с характеристиками процессоров семейства Penryn.

Наименование Ядро Количество ядер Частота FSB Множитель Кеш L2
Core 2 Extreme QX9770 Yorkfield 4 3,2 ГГц 400 МГц 8 12 Мб
Core 2 Extreme QX9650 Yorkfield 4 3,0 ГГц 333 МГц 9 12 Мб
Core 2 Quad Q9550 Yorkfield 4 2,83 ГГц 333 МГц 8,5 12 Мб
Core 2 Quad Q9450 Yorkfield 4 2,66 ГГц 333 МГц 8 12 Мб
Core 2 Quad Q9300 Yorkfield 4 2,5 ГГц 333 МГц 7,5 6 Мб
Core 2 Duo E8500 Wolfdale 2 3,16 ГГц 333 МГц 9,5 6 Мб
Core 2 Duo E8400 Wolfdale 2 3,0 ГГц 333 МГц 9 6 Мб
Core 2 Duo E8300 Wolfdale 2 2,83 ГГц 333 МГц 8,5 6 Мб
Core 2 Duo E8200 Wolfdale 2 2,66 ГГц 333 МГц 8 6 Мб
Core 2 Duo E8190 Wolfdale 2 2,66 ГГц 333 МГц 8 6 Мб

Исходя из таблицы, мы можем сделать несколько умозаключений. Во-первых, Intel оставила в наименовании процессоров раскрученную марку Core 2 (Duo/Quad/Extreme), что, в принципе правильно, поскольку семейство Penryn является производным от семейства Core. Во-вторых, Intel значительно сократила шаг частоты между различными моделями, с помощью дробных множителей. Трудно припомнить, когда последний раз Intel использовала такие множители. В третьих, почти все процессоры семейства Penryn имеют частоту FSB = 333 МГц (т.е. 1333 QPB), и соответственно потребуют современную материнскую плату. И только модель Core 2 Extreme QX9770 будет работать на FSB = 400 МГц (1600 QPB), что потребует материнскую плату на X38 или очень качественную плату на P35 (хотя Intel будет утверждать, что единственным возможным вариантом является плата на X48, который выйдет одновременно с QX9770).

Отдельно отметим модель E8190, которая по всем характеристикам соответствует E8200, но не поддерживает технологии виртуализации. Впрочем, пользователю сэкономить не удастся: рекомендованные цены для E8190 и E8200 одинаковы, и равны ~$163. Кстати, похожая ситуация наблюдается и с процессором E6540, который соответствует E6550, но не поддерживает технологию Intel TXT (Intel Trusted Execution Technology).

Разгон

Несколько слов о разгоне. Прежде всего нужно отметить, что мы тестируем экстремальную версию процессора (т.е. Extreme Edition), у которой множитель разблокирован. Это дает нам возможность подойти к предельной частоте конкретного экземпляра с помощью обычного увеличения множителя. Так мы и поступили, и достигли частоты 4 ГГц.

Правда, для стабильной работы на такой частоте, напряжение питания пришлось увеличить до 1,45 В. Первоначально данная частота нас несколько разочаровала - честно говоря, мы ожидали большего от 45 нм техпроцесса. Но с другой стороны - перед нами 4-ядерный процессор, а значит его потенциал разгона будет меньше, чем у 2-ядерного (это хорошо видно на примере Kentsfield). Следовательно, серийные 2-ядерные процессоры Wolfdale должны легко брать частоту 4 ГГц. А если учесть то, что Intel наверняка один-два раза обновит степпинг, то можно ожидать и более высоких частот.

Что касается тепловыделения, то благодаря более "тонкому" техпроцессу, компании Intel удалось снизить реальное тепловыделение на четверть под нагрузкой, и почти на половину в состоянии покоя. Причем отметим, что в состоянии покоя работают все, уже известные технологии энергосбережения, такие как Enhanced Halt State (C1E) и Enhanced Intel SpeedStep, и никаких новинок в этой области Intel не представила. Они собственно и не нужны, поскольку Intel не изменила требования к системе охлаждения, которая должна справляться с типичным уровнем тепловыделения процессора (TDP) = 130-136 Вт. Иными словами, Intel создает себе изрядный запас в плане тепловыделения процессоров, и при необходимости может выпустить модели с большими частотами (например 3,33 ГГц и 3,6 ГГц).

Производительность

В тестовой системе было использовано следующее оборудование:


Тестовое оборудование
Материнская плата ASUS P5W64-WS Pro на Intel 975X
ASUS M2N32-WS Pro на NVIDIA nForce 590 SLI
ASUS P5K3 Premium на Intel P35
Кулер Gigabyte G-Power
Видеокарта MSI NX7900 GT (GeForce 7900GT; PCI Express x16)
Версия драйвера: 93.71 WHQL
Звуковая карта -
HDD Samsung HD160JJ
Память 2x512 Мбайт Corsair DDR2 TWIN2X1024-8000UL1
Корпус Inwin506 с блоком питания PowerMan 300W
OS Windows XP SP1

Первоначально мы сравним производительность процессора Core 2 Extreme QX9650 на ядре Yorkfield с процессором Core 2 Extreme QX6700 на ядре Kentsfield. Но к сожалению, процессор QX6700 сейчас трудится на видео-стенде, и поэтому мы решили использовать разные платформы. Если QX6700 тестировался с памятью DDR2, то QX9650 мы уже протестируем с памятью DDR3, и тем самым увидим, какую пользу принесет этот вид памяти, с учетом того, что частота FSB повысилась с 266 МГц (Kentsfield) до 333 МГц (Yorkfield). Понятно, что данное сравнение будет оценочное и покажет общий рост производительности high-end системы за год. К тому же, мы можем спрогнозировать, что наибольший прирост мы получим в таких приложениях как WinRAR и Quake4 (т.е. того ПО, скорость которого зависит от пропускной способности памяти).

Только посмотрите на рост производительности в Quake4: одно ядро из четырех у процессора Yorkfield на частоте 3,0 ГГц обеспечивает такую же скорость, как все четыре ядра процессора Kentsfield разогнанного до 3,45 ГГц. Невероятно? Вовсе нет: просто Kentsfield упирается малую пропускную способность DDR2, а если этот же Kentsfield поставить на плату с DDR3, да еще и увеличить FSB до 333 МГц, то мы получим практически такую же производительность как и Yorkfield.

Однако количество программных приложений с такой явной зависимостью от ПСП крайне мало. С другой стороны, если пользователь нашел где-то $1000 на процессор, то он с легкостью может найти там же и $500 за комплект памяти DDR3. Что касается 2-ядерных процессоров, то это уже другая ценовая категория, и мы не советуем приобретать DDR3 для систем с такими процессорами.

Теперь переходим к стандартному набору тестов, на единой платформе.

Перед нами исключительно синтетические приложения, которые демонстрируют теоретическую производительность.

Теперь тесты игровых приложений.

.
 aquam
кбс. больше - лучше

Выводы

Самое главное: семейство процессоров Penryn является эволюционным развитием семейства Core, причем благодаря 45 нм техпроцессу практически все характеристики улучшены (кроме скорости доступа к кешу L2). Иными словами, процессоры Yorkfield и Wolfdale лучше своих предшественников (Kentsfield и Conroe соответственно), и естественно будут пользоваться успехом. Слагаемые успеха просты: модифицированное ядро Conroe + поддержка инструкций SSE4.1, более "тонкий" 45 нм техпроцесс (лучше разгон, меньше тепловыделение) и увеличенный объем кеш памяти второго уровня (до 6/12 Мб).

И главный вопрос - когда эти процессоры можно будет купить? Если не брать в расчет версию Extreme Edition, то купить двух и четырехъядерные процессоры семейства Penryn, предположительно, можно будет в начале 2008 года.

- Обсудить материал в конференции
 
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Meta бросила вызов ChatGPT — все сервисы компании получили «самого умного» ИИ-помощника 2 ч.
Meta добавила ИИ-генерацию изображений в реальном времени в WhatsApp — пока в тестовом режиме 3 ч.
Поисковик Brave научился отвечать на вопросы с помощью ИИ 3 ч.
Не по средствам: большинство госкомпаний не имеет планов и возможностей перейти на отечественное ПО 4 ч.
Netflix продлила сериал «Ведьмак» на пятый сезон, но есть нюанс — он будет последним 5 ч.
Fallout 4 стала самой успешной игрой в Европе на прошлой неделе — продажи подскочили на 7500 % 6 ч.
Microsoft тестирует на iOS и Windows 11 функцию Circle to Copilot — аналог Circle to Search от Google 7 ч.
«Будет нашей лучшей работой»: Larian раскрыла детали следующего крупного патча Baldur’s Gate 3 и заинтриговала тизером новой игры 7 ч.
Microsoft запретит настраивать Edge на неактивированных Windows 11 7 ч.
Еврокомиссия дала TikTok сутки на пояснение рисков нового приложения TikTok Lite 8 ч.