Оригинал материала: https://3dnews.ru/908446

Обзор NVIDIA GeForce GTX 960 (на примере MSI GeForce GTX 960 GAMING 2G): то же самое меньшими силами

Характеристики. Комплектация. Внешний вид

Модели GeForce 900 занимают верхушку линейки потребительских видеокарт NVIDIA, в то время как основную массу составляют их 700-е собратья. Добавляя новые позиции в 900-м семействе, NVIDIA одну за другой меняет позиции с GPU микроархитектуры Kepler на прогрессивный Maxwell. Основной смысл существования Maxwell — поддержать прогресс производительности в затянувшуюся эпоху техпроцесса 28 нм, пока производитель готовится перейти на норму 20 или 16 нм. Соответственно, все оптимизации, которые отличают Maxwell от Kepler, направлены на повышение энергетической эффективности.

В общих чертах архитектура Maxwell следует принципам, заложенным в Kepler, но разработчики нашли возможность изрядно упростить устройство структурных блоков GPU, сократив транзисторный бюджет, но удержав позиции в быстродействии. Состав потокового мультипроцессора (SMX/SMM) — универсального строительного блока GPU в последних итерациях архитектуры NVIDIA — сократили с 192 до 128 ядер CUDA (шейдерных ALU) и с 16 до 8 текстурных блоков, а также ввели более жесткие правила для работы планировщиков нагрузки. В результате ресурсы исполнительной части SMM задействуются более эффективно, а управляющая логика уменьшилась в размере. И несмотря на такой секвестр, SMM в Maxwell сохранил 90% производительности от SMX в Kepler. Быстродействие на единицу мощности у адаптеров Maxwell подчас в два раза выше по сравнению с Kepler в самых что ни на есть практических тестах.

Блок-схема NVIDIA GM206

Новоприбывшая модель GeForce GTX 960 базируется на чипе третьего эшелона в семействе Maxwell — GM206. Чип второго эшелона (GM204) устанавливают в GeForce GTX 970 и GTX 980, а старший GPU, по всей вероятности, готовится к выходу в этом году в составе нового флагмана видеоадаптеров NVIDIA. Цифра 2 в названии чипа также указывает на вторую версию архитектуры Maxwell. От единственного представителя первой версии — чипа GM107 (GeForce GTX 750/750 Ti и ряд ноутбучных адаптеров) — GM204 и GM206 отличаются геометрическим движком PolyMorph Engine версии 3.0 и поддержкой в железе некоторых вычислительных функций, которые войдут в новый feature level Direct3D 12.

Тонкости архитектуры Maxwell уже раскрыты в обзорах GeForce GTX 750 Ti и GeForce GTX 980, так что здесь мы не будем заострять на них внимание, а вместо этого внимательно изучим новинку. Собственно ядро графического процессора в GM206 не имеет качественных отличий от GM204. NVIDIA лишь сократила количество функциональных блоков соответственно более низкой ценовой категории. Единственное дополнение — обновленный кодек NVENC, в котором полностью реализовано декодирование формата H.265 (HEVC). В более ранних чипах Maxwell для этой цели частично используется логика, предназначенная для H.264, а остальная часть процесса ложится на CPU.

GeForce GTX 960 стал топовым устройством на базе GM206 — он относится к категории геймерских адаптеров среднего уровня. GTX 960 наследует позицию GeForce GTX 660 и GTX 760. Последние два теперь официально сняты с производства, и между GTX 960 и GTX 750 Ti образовался большой зазор по производительности, но его NVIDIA может прикрыть отбраковкой кристаллов GM206 c частично заблокированными вычислительными блоками, какое бы название ни получил такой продукт.

Модель Графический процессор Видеопамять Шина ввода/
вывода
TDP, Вт

Кодовое название

Число транзис-торов, млн

Техп-роцесс, нм

Тактовая частота, МГц: Base Clock / Boost Clock

Число ядер CUDA

Число текстурных блоков

Число ROP

Разряд-ность шины, бит

Тип микросхем

Тактовая частота: реальная (эффек-тивная), МГц

Объем, Мбайт

GeForce GT 610

GF119

292

40

810/-

48

8

4

64

GDDR3 SDRAM

900 (1800)

1024

PCI Express 2.0 x16

29

GeForce GT 730 (128-bit)

GF108

585

40

700/-

96

16

4

128

GDDR3 SDRAM

900 (1800)

1024

PCI-Express 2.0 x16

49

GeForce GT 720

GK208

1300

28

797/-

192

16

8

64

GDDR3/GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 2.0 x16

19

GeForce GT 730 (64-bit)

GK208

1300

28

902/-

384

16

8

64

GDDR3/GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 2.0 x16

23/25

GeForce GT 740

GK107

1300

28

902/-

384

32

16

128

GDDR3/GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 3.0 x16

65

GeForce GTX 750

GM107

1870

28

1020/1085

512

32

16

128

GDDR5 SDRAM

1250 (5000)

1024

PCI-Express 3.0 x16

55

GeForce GTX 750 Ti

GM107

1870

28

1020/1085

640

40

16

128

GDDR5 SDRAM

1350 (5000)

2048

PCI-Express 3.0 x16

60

GeForce GTX 660

GK106

2 540

28

980/1033

960

80

24

192

GDDR5 SDRAM

1502 (6008)

2048

PCI-Express 3.0 x16

140

GeForce GTX 760

GK104

3 540

28

980/1033

1152

96

32

256

GDDR5 SDRAM

1502 (6008)

2048

PCI-Express 3.0 x16

170

GeForce GTX 960

GM206

2 940

28

1126/1178

1024

64

32

128

GDDR5 SDRAM

1753 (7010)

2048

PCI-Express 3.0 x16

120

GeForce GTX 970

GM204

5 200

28

1050/1178

1664

104

64

256

GDDR5 SDRAM

1750 (7000)

4096

PCI-Express 3.0 x16

145

GeForce GTX 980

GM204

5 200

28

1126/1216

2048

128

64

256

GDDR5 SDRAM

1750 (7000)

4096

PCI-Express 3.0 x16

165

Итак, чем GeForce GTX 960 может похвастаться перед своими предшественниками? По сравнению с GTX 660, который основан на чипе GK106, GTX 960 прибавил в числе ядер CUDA, ROP и тактовых частотах. Если сравнить с GTX 760 (то есть с порезанным GK104), то GTX 960 не отступил только в числе ROP и тактовых частотах, а в остальном — шаг назад. Бросается в глаза 128-битная шина памяти, которой, казалось бы, уже давно пользуются видеоадаптеры классом ниже. По заверению разработчика, недостаток пропускной способности полностью компенсирует более крупный кеш L2 и усовершенствованный алгоритм компрессии цвета, который достигает коэффициента сжатия 8:1 без потери информации. Да и частота памяти увеличена до 7 ГГц. Но так ли эффективны эти меры, нам еще предстоит увидеть в тестах.

Несомненно одно: GM206 — куда более компактный чип (2 940 млн транзисторов) по сравнению с GK104 (3 540 млн), что вкупе с оптимизациями архитектуры дает сниженный TDP (со 170 до 120 Вт) и экономию стоимости производства. Рекомендованная розничная цена GTX 960 составляет $199 (США, без налогов). Цена для России установлена на уровне 13 990 руб.

NVIDIA GK104

NVIDIA GM206

GTX 960 предстоит конкурировать в первую очередь с Radeon R9 285. Кроме того, из продажи еще долго не исчезнет Radeon R9 280, да и GeForce GTX 760 теперь получит скидку после формальной отставки. Обе видеокарты обладают более широкой шиной памяти, а R9 280 — еще и увеличенным до 3 Гбайт объемом RAM. Интересно будет столкнуть новичка с этими старожилами.

#MSI GeForce GTX 960 GAMING 2G

GeForce GTX 960 в этом обзоре представляет компания MSI. Карта GTX 960 GAMING 2G разогнана по частоте GPU на 90 МГц относительно референсных спецификаций (прим.: тестирование производительности проводилось на референсных частотах). Частота видеопамяти стандартная. В комплект поставки устройства входит переходник с двух шестиконтактных на один восьмиконтактный разъем дополнительного питания, адаптер DVI-VGA, компакт-диск с ПО и бумажная документация. К ограниченной партии MSI GTX 960 GAMING 2G прилагается купон с кодами на призы в онлайн-шутере Warface: уникальную внешность и несколько образцов оружия.

Сама видеокарта довольно крупная для столь нетребовательного GPU.

Система охлаждения открытой конструкции включает радиатор с тремя тепловыми трубками и два вентилятора диаметром 95 мм. Отдельный небольшой радиатор установлен на транзисторы системы питания.

Микросхемы памяти Samsung предназначены для работы на эффективной частоте 7 ГГц. Система питания включает четыре фазы для GPU и одну — для оперативной памяти.

Тестирование. Выводы

#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-3960X @ 4,6 ГГц (100 × 46)
Материнская плата ASUS P9X79 Pro
Оперативная память DDR3 Kingston HyperX 4 × 2 Гбайт, 1600 МГц, CL9
ПЗУ Intel SSD 520 240 Гбайт
Блок питания Corsair AX1200i, 1200 Вт Seasonic Platinum-1000, 1000 Вт
Охлаждение CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Операционная система Windows 8.1 Pro X64
ПО для GPU AMD AMD Catalyst Omega 14.12
ПО для GPU NVIDIA 347.25

Для измерения мощности системы используется стенд с блоком питания Corsair AX1200i. Энергосберегающие технологии CPU во всех тестах отключены. Шина PCI-Express работает в режиме 3.0. Для активации PCI-E 3.0 на видеокартах серий GeForce 600 и 700 в системе на чипсете X79 применяется патч от NVIDIA.

В настройках драйвера NVIDIA всегда в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD всегда настройка Tesselation переводится из состояния AMD Optimized в Use application settings. В CrossFire-конфигурациях остается включенной опция Frame Pacing.

Бенчмарки: синтетические
Программа API Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
3DMark 2011 DirectX 11 Тест Extreme
3DMark DirectX 11 Тест Fire Strike (не Extreme)
TessMark DirectX 11 Set 4 (2048x2048), tesselation X8/x16/x32/x64 AA Off 1920 × 1080
Unigine Heaven 4 DirectX 11 DirectX 11, макс. качество, тесселяция в режиме Extreme AF 16x, MSAA 4x 2560 × 1440 / 3840x2160
Бенчмарки: игры
Программа API Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
Far Cry 3 + FRAPS DirectX 11 DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost AF, MSAA 4x 1920 × 1080 / 2560 × 1440
Tomb Raider. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920 × 1080 / 2560 × 1440
Bioshock Infinite. Встроенный бенчмарк DirectX 11 Макс. качество. Postprocessing: Normal AF 16x, FXAA 1920 × 1080 / 2560 × 1440
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Post Human AF 16x, MSAA 4x 1920 × 1080 / 2560 × 1440
Metro: Last Light. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920 × 1080 / 2560 × 1440
Company of Heroes 2. Встроенный бенчмарк DirectX 11 Макс. качество AF, SSAA 4x 1920 × 1080 / 2560 × 1440
Batman: Arkham Origins. Встроенный бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920 × 1080 / 2560 × 1440
Battlefield 4 + FRAPS DirectX 11 Макс. качество. Начало миссии Tashgar AF 16x, MSAA 4x + FXAA 1920 × 1080 / 2560 × 1440
Thief. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x + FXAA 1920 × 1080 / 2560 × 1440
Alien: Isolation DirectX 11 Макс. качество AF 16x, SMAA T2X 1920 × 1080 / 2560 × 1440
Бенчмарки: вычисления
Программа Настройки
DXVA Checker Decode benchmark. H.264, H.265. Файлы 1920 × 1080p (битрейт видео ~3000 Кбит/с), 3840x2160p (битрейт видео ~7500 Кбит/с). Microsoft H264 Video Decoder (H.264), LAV Video Decoder (H.265), ускорение на аппаратном кодеке GPU (DXVA2)
LuxMark 2.0 X64 Сцена Room (Complex Benchmark)
Sony Vegas Pro 13 Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080@24i
CompuBench CL Desktop Edition X64, Ocean Surface Simulation
CompuBench CL Desktop Edition X64, Particle Simulation — 64K
SiSoftware Sandra 2015, Scientific Analysis Open CL, FP32/FP64

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • AMD Radeon R9 280 (933/5500 МГц, 3 Гбайт);
  • AMD Radeon R9 285 (918/5500 МГц, 2 Гбайт);
  • AMD Radeon R9 280X (1000/6000 МГц, 3 Гбайт);
  • NVIDIA GeForce GTX 760 (980/6008 МГц, 2 Гбайт);
  • MSI GeForce GTX 960 GAMING 2G (1126/7010 МГц, 2 Гбайт).

Тактовые частоты, энергопотребление, температура, разгон

Для GeForce GTX 960 установлено весьма агрессивное управление тактовой частотой. В динамике частота поднимается максимум на 163 МГц сверх базового значения — до 1289 МГц при напряжении питания GPU 1,212 В. Разгон имеющегося у нас экземпляра позволил достигнуть 1346 МГц базовой частоты, верхнее значение напряжения на GPU можно повысить до 1,256 мВ.

Base Clock, МГц Макс. Boost Clock, МГц Base Clock, МГц (разгон) Макс. зарегистрированная Boost Clock, МГц (разгон)
GeForce GTX 980 1127 1253 (+126) 1387 1526 (+139)
GeForce GTX 970 1050 1213 (+163) 1278 1467 (+189)
GeForce GTX 960 1126 1289 (+163) 1346 1535 (+189)
GeForce GTX 760 980 1110 (+130) 1092 1241(+149)

Попутно поднимается и частотный потолок, так что максимальная зарегистрированная в тестах частота после разгона составила 1535 МГц (на 189 МГц выше базовой). В большинстве тестов частота GPU колебалась в пределах 1511-1523 МГц.

GeForce GTX 960 и вправду получился более экономичной видеокартой по сравнению с GTX 760, хотя разница в мощности не поражает воображения. А вот близкие по быстродействию видеоадаптеры AMD потребляют уже намного больше. Кстати, разгон GTX 960 получился весьма внушительным, а энергопотребление выросло не так уж и сильно.

Поскольку сравниваемые видеокарты имеют ограничение по допустимой температуре GPU, на которое ориентируется электроника, управляющая кулером, сравнивать их по эффективности теплоотвода при штатных настройках – довольно-таки бессмысленное занятие. В этом плане графическая карта MSI справилась с задачей не хуже прочих.

#Производительность: синтетические тесты

3DMark 2011

  • GeForce GTX 960 не только превзошел по очкам GTX 760 и Radeon R9 285, но и практически не уступает номинально более мощному Radeon R9 280X.

3DMark

  • В более новой версии теста сохраняется преимущество GTX 960 перед GTX 760.
  • Вот только команда AMD в полном составе опередила новинку.

TessMark

  • Новый геометрический движок заметно отличает GeForce GTX 960 от GTX 760.
  • GTX 960 также безоговорочно превосходит в расчетах геометрии видеоадаптеры AMD на чипе Tahiti — R9 280 и R9 280X.
  • Однако лидером в этой категории является Radeon R9 285.

Unigine Heaven 4

  • В разрешении Full HD новинка мало отличается от GTX 760 и Radeon R9 280. Более мощные адаптеры AMD чуть быстрее.
  • В режиме 2560 × 1440 дает о себе знать узкая шина памяти GM206, которая оставила GTX 960 в аутсайдерах.

Производительность: игры

Tomb Raider

  • В режиме Full HD GTX 960 держится на равных с Radeon R9 280 и превосходит R9 285.
  • При разрешении 2560 × 1440 просадка частоты смены кадров на GTX 960 не так велика, как можно было бы ожидать. По крайней мере значимой разницы между GTX 960, R9 285 и R9 280 не выявилось.

Bioshock Infinite

  • GeForce GTX 960 потерпел поражение от представителей команды AMD в обоих разрешениях. Единственный позитивный результат: карта немного быстрее, чем GTX 760.

Crysis 3

  • Первая золотая медаль на счету GTX 960. В разрешении Full HD видеокарта работает даже немного быстрее, чем Radeon R9 280X.
  • В режиме 2560 × 1440 участники различаются не столь сильно, но на первый взгляд можно говорить о паритете между GTX 960, с одной стороны, и R9 280X, а также R9 285, с другой.

Metro: Last Light

  • GeForce GTX 960 столь же хорош, как Radeon R9 285 и R9 280.
  • В 2560 × 1440 наблюдается ожидаемая, но не критичная просадка быстродействия по сравнению с показателями конкурентов.

Company of Heroes 2

  • GTX 960 соперничает с Radeon R9 285 и R9 280. Но если в режиме Full HD борьба идет на равных, то в 2560 × 1440 новинка сдает позиции.

Batman: Arkham Origins

  • Единственный тест, в котором GTX 960 отработал медленнее, чем GTX 760, и остался в хвосте при обоих разрешениях. Видать, подкачала 128-битная шина памяти.
  • Впрочем, Radeon R9 285 здесь ушел недалеко вперед, в особенности при разрешении 1920 × 1080.

Battlefield 4

  • GeForce GTX 960 показал хороший результат в режиме Full HD, где занял промежуточную позицию между Radeon R9 280 и R9 280X.
  • Все не так гладко в 2560 × 1440. GTX 960 в числе отстающих вместе с GTX 760 и R9 285.

Thief

  • GTX 960 немного быстрее, чем R9 285, при разрешении Full HD и мало отличается в режиме 2560 × 1440.
  • Первые места в обоих режимах удерживают Radeon R9 280 и R9 280X.

Alien: Isolation

  • Radeon R9 285 попал в плачевное положение, сохраняя конкурентоспособность только при разрешении 2560 × 1440. В Full HD GeForce GTX 960 нанес ему сокрушительное поражение.
  • Два других игрока команды AMD удерживают лидирующие позиции.

Far Cry 4

  • GeForce GTX 960 принадлежит первый результат при разрешении 1920 × 1080 (даже Radeon R9 280X с небольшим отрывом остался позади) и последний — при 2560 × 1440 (здесь новинка ничем не отличается от GeForce GTX 760).

#Производительность: вычисления

Декодирование видео

  • Аппаратный декодер NVENC в GM206 по скорости обработки кода H.264 явно избыточен даже для того, чтобы воспроизводить видео с разрешением 4К с частотой кадров 60 Гц. К примеру, кодека в Radeon R9 285 для этой цели хватает впритык, а кодек H.264 в более ранних GPU AMD не поддерживает столь высокое разрешение. С другой стороны, дополнительная мощь может найти применение в задаче перекодирования видеофайлов.
  • Дополнительная логика аппаратного декодера H.265 (HEVC) также имеет большой запас производительности. В этой роли GM206 выступает не так уж плохо даже по сравнению с мощным 6-ядерным CPU.
  • По крайней мере, полностью аппаратное декодирование H.265 на GM206 происходит явно более эффективно, чем на GM204, где часть операций выполняет CPU.

Luxmark: Room (Complex Benchmark)

  • В задаче трассировки лучей архитектура Maxwell совершила рывок. Мы это видели еще на примере GeForce GTX 980. Вот и сейчас GeForce GTX 960 почти вдвое превосходит GTX 760, оставил позади Radeon R9 285 и наступает на пятки R9 280.

Sony Vegas Pro 13

  • Видеокарты NVIDIA не в лучшей форме для этого теста. Как и его предшественник, GeForce GTX 960 не идет ни в какое сравнение с конкурирующими продуктами AMD.

CompuBench CL: Ocean Surface Simulation

  • А вот в этом тесте GeForce GTX 960 отстал даже от своего предшественника, не говоря уже о видеоадаптерах AMD.

CompuBench CL: Particle Simulation

  • Еще один пример успешной оптимизации архитектуры Maxwell для расчетных задач. GeForce GTX 960 оставил далеко позади всех соперников, не исключая Radeon R9 280X.

SiSoftware Sandra 2015: Scientific Analysis

  • Maxwell плохо подходит для подобных задач даже при вычислениях с одинарной точностью (FP32). Кроме того, скорость FP64 снизилась даже по сравнению с чипами Kepler — вплоть до 1/32 от FP32, что отразилось и в результатах Sandra.

#Производительность: разгон

Дополнительные мегагерцы, которые принес разгон, оказались с привкусом кукурузы (как уже не раз бывало с видеокартами, управляемыми технологией GPU Boost). Впрочем, в тех играх, где частота смены кадров граничит с критическим уровнем, все еще есть смысл создать дополнительный запас прочности за счет оверклокинга.

3DMark 2011

3DMark

Игровые тесты + Unigine Heaven 4

#Выводы

На этот раз не было запланировано никаких революций — просто плановая замена заслуженного процессора GK104 более компактным и энергоэффективным чипом GM206. Для видеокарты среднего геймерского уровня GM206 подходит куда как лучше, чем частично заблокированная версия GM104, которой комплектовался GeForce GTX 760. Архитектура Maxwell в очередной раз показала впечатляющий уровень производительности на единицу мощности: GTX 960 обладает TDP на 50 Вт меньше, чем у GTX 760, по большей части не уступая в производительности. Как оказалось, с 128-битной шиной памяти вполне можно прожить и в этом сегменте. Отметим и разгонный потенциал GeForce GTX 960, который, впрочем, не так явно конвертируется в прирост быстродействия, как того хотелось бы.

Валютная цена на GTX 960 снижена на $50 по сравнению с GTX 760, хотя россиян это мало касается. Самые дешевые варианты GTX 760 здесь имеют такую же цену, какая рекомендована для GTX 960. Кроме того, в связи с концом жизни последнего можно рассчитывать на скидку. В этом плане выход GTX 960 сыграет на руку тем, кому безразлично энергопотребление видеокарты, ведь производительность у этих моделей различается незначительно. Как ни крути, обеспечить снижение цены и мощности одновременно с повышением быстродействия без смены технологической нормы не может даже Maxwell.

Основной конкурент новинки, Radeon R9 285, строго говоря, не может на равных противостоять GTX 960: большинство тестов были на стороне продукта NVIDIA, да и цена R9 285 ($249) выше, чем у соперника, не говоря о совсем другом уровне энергопотребления. Выгоднее для AMD противопоставить GeForce GTX 960 другую видеокарту — Radeon R9 280. Между этими ускорителями в тестах установился паритет при разрешении 1920 × 1080, а для режима 2560 × 1440 продукт AMD лучше приспособлен за счет 384-битной шины памяти и объема RAM в 3 Гбайт.

Напоследок пара слов об адаптере MSI GTX 960 GAMING 2G. На примере именно на этой модели мы оценили оверклокерские возможности GeForce GTX 960, так что проблем с разгоном у потенциальных владельцев возникнуть не должно. Система питания и охлаждения достаточно хороши. Лишь бы кристалл GPU не подкачал, но повышенные относительно референсных значений частоты уже кое-что гарантируют.



Оригинал материала: https://3dnews.ru/908446