Сегодня 08 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Видеокарты

Обзор видеокарты NVIDIA GeForce GTX 750 Ti: первый GPU на архитектуре Maxwell

⇣ Содержание

GeForce GTX 750 Ti, как следует из названия, — это видеоадаптер начального уровня. Одновременно NVIDIA запускает GeForce GTX 750, а название GTX 740 остается зарезервированным для наиболее дешевой и слабой модели. И все же GTX 750 Ti — бюджетный вариант и как таковой не вызвал бы большого интереса, если бы в то же время не являлся первой моделью на базе архитектуры Maxwell. Соответственно, на примере GTX 750 Ti у нас есть возможность изучить Maxwell как в теории, так и на практике, не дожидаясь выхода флагманского GPU.

В основе GTX 750 Ti лежит графический процессор GM107. В существующей номенклатуре NVIDIA позицию 107 занимает наиболее компактное ядро. Соответственно, в будущем следует ожидать появления GM104 и GM110 (или GM101). Однако транзисторный бюджет GM107 не так уж мал для его класса — 1,87 млрд. Для сравнения: GK107 состоит из 1,3 млрд транзисторов.

Количество вычислительных блоков GM107 ощутимо больше, чем у GK107: 640 ядер CUDA и 40 текстурных блоков вместо 384 и 32 соответственно. Однако GM107 по-прежнему обладает 16 блоками ROP и 128-битной шиной памяти. Сами по себе эти числа не удивляют, если бы не тот факт, что GM107 остался в тех же рамках энергопотребления, что и GK107 (заявленный TDP даже немного меньше — 60 против 64 Вт). По сути, это и есть предназначение архитектуры Maxwell — увеличить производительность на ватт.

#Архитектура Maxwell

Если судить по представленным диаграммам, основное новшество Maxwell заключается в незначительной на вид, но потенциально весьма эффективной реорганизации блоков GPU. На глобальном уровне GM107 следует принципам, заложенным еще в Kepler (подробнее о них можно прочитать в обзоре GeForce GTX 680). Вся вычислительная логика сосредоточена в структуре под названием Graphics Processing Cluster (GPC), которая в GM107 всего одна, хотя в более крупных чипах их будет больше. Вне GPC расположен весь back-end процессора в виде блоков ROP и двух 64-битных контроллеров памяти, а также Giga Thread Engine, выполняющий функции смены контекста, одновременного исполнения kernel’ов и распределения потоков нагрузки между GPC (последнее пока — не наш случай). Количественное отличие от Kepler здесь состоит в кеше L2, увеличенном с 256 до 2048 Кбайт, что должно компенсировать узкую, 128-битную шину, а также сократить расход энергии на транзакции с весьма прожорливой памятью, каковой является GDDR5 SDRAM.

На уровне GPC значимых нововведений по сравнению с Kepler не заметно. Есть несколько Stream Multiprocessors, и есть единственный Raster Engine, выполняющий первоначальные стадии рендеринга: определение граней полигонов, проекцию и отсечение невидимых пикселов.

Главные изменения произошли внутри потоковых мультипроцессоров. Идея состоит в том, чтобы сместить соотношение управляющей и вычислительной логики в пользу первого компонента. Как и в Kepler, потоковый мультипроцессор (SMM в терминологии Maxwell) содержит четыре планировщика, но число ядер CUDA уменьшилось с 192 до 128, а текстурных блоков — с 16 до 8. Каждый планировщик привязан к шейдерному блоку, в который, помимо 32 ядер CUDA, входят 8 блоков Load/Store и SFU (Special Function Units, выполняющие, к примеру, тригонометрические операции). Каждая пара таких единиц в пределах SMM имеет общую секцию кеша L1, совмещенного с текстурным кешем, и связана с четырьмя текстурными блоками.

Известно, что отдельно взятый планировщик за такт может обратиться к одному (а при наличии параллелизма в потоке — сразу к двум) из следующих массивов вычислительных блоков:

  1. 32 ядра CUDA.
  2. 8 блоков Load/Store.
  3. 8 SFU.
  4. 4 текстурных блока.

В составе шейдерного мультипроцессора Kepler есть ядра CUDA, специализированные для вычислений FP64, но пока неизвестно, есть ли они и в SMM Maxwell. Итак, какие преимущества по сравнению с Kepler дает такая организация? Очевидно, что потоковый мультипроцессор Maxwell, избавившись от 64 ядер CUDA, меньше полагается на параллелизм инструкций: четыре планировщика даже в пессимистичном сценарии способны обслужить 128 ядер CUDA. Эта логика согласуется с тем, что Maxwell унаследовал от Kepler статические планировщики. Вся работа по планированию внеочередного исполнения инструкций выполняется на уровне компилятора. Такой подход позволил существенно сократить энергопотребление GPU и не оказывает большого негативного влияния на собственно шейдерные вычисления. В то же время расчеты, не связанные с графикой, не всегда предсказуемы для компилятора, поэтому чипам Maxwell явно не помешает дополнительный шаг от параллелизма на уровне инструкций к параллелизму на уровне потоков.

Попутно упрощается логика планировщиков, что в конечном счете позволяет сохранить 90% производительности отдельного потокового мультипроцессора при существенно меньшей площади SMM — по сравнению с оной у Kepler — и достигнуть столь впечатляющей энергоэффективности. Планировщики также оптимизированы с целью уменьшения латентности исполнения инструкций.

Финальный штрих к архитектуре Maxwell — усовершенствованный аппаратный кодек H.264 NVENC. Теперь GPU способен кодировать видео на скорости в 6-8 раз быстрее реального времени (4х для Kepler) и декодировать в 8-10 раз быстрее. Кроме того, в Maxwell предусмотрен новый режим энергопотребления GC5, предназначенный для снижения мощности при легкой нагрузке — такой как декодирование видео силами NVENC. Жаль только, что NVIDIA еще не внедрила поддержку стандарта H.265 для проигрывания 4К-видеозаписей.

Обновленный блок NVENC для кодирования видео пригодится прежде всего не в профессиональных приложениях, а в казуальных задачах: таких, например, как запись игрового процесса с помощью NVIDIA ShadowPlay или GameStream — трансляция видеопотока на консоль NVIDIA SHIELD.

#GeForce GTX 750 Ti: технические характеристики

Тактовые частоты GeForce GTX 750 Ti довольно высоки. Базовая частота составляет 1020 МГц. Поскольку здесь используется технология GPU Boost 2.0, то есть и Boost Clock, равная 1085 МГц. Видеопамять работает на эффективной частоте 5400 МГц. Таким образом, по совокупным характеристикам GTX 750 Ti близок к GTX 650 Ti на чипе GK106, даже без учета более эффективной архитектуры Maxwell. Сам 650 Ti, кстати, будет снят с производства, уступив место GTX 750 и 750 Ti.

Известны рекомендованные розничные цены новинок. GeForce GTX 750: в США — от $119 (без налогов), в России — от 4 490 руб. GTX 750 Ti: в США — от $149 (без налогов), в России — от 5 490 руб.

Для проверки GeForce GTX 750 Ti в деле у нас есть на руках две платы — референсный образец NVIDIA и ASUS GeForce GTX 750 Ti OC Edition.

#NVIDIA GeForce GTX 750 Ti

Референсный образец — минималистичная однослотовая плата, которая, благодаря низкому энергопотреблению чипа, обходится без дополнительного питания.

GPU охлаждается простым алюминиевым кулером-таблеткой.

Память набрана чипами SK hynix H5GC4H24MFR-T2C со штатной эффективной частотой 5 ГГц. Система питания максимально примитивная — две фазы для GPU и фаза для микросхем памяти.

#ASUS GeForce GTX 750 Ti OC Edition

Карточка ASUS построена на печатной плате собственного дизайна и оснащена более внушительной системой охлаждения, а также разъемом дополнительного питания. Частоты ядра повышены до 1072/1150 МГц (Base/Boost Clock соответственно). Видеопамять работает на референсной частоте — 5400 МГц.

Кулер с двумя вентиляторами по внешнему виду напоминает модели DirectCU того же производителя, только здесь нет ни тепловых трубок, ни медного основания.

Вы не поверите, но здесь есть отдельный видеовыход VGA.

Чипы памяти Samsung K4G41325FC-HC03 обладают штатной эффективной тактовой частотой 6 ГГц. Формула системы питания: две фазы для GPU, фаза для чипов памяти, фаза PLL.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Еженедельный чарт Steam: Gray Zone Warfare обошла Counter-Strike 2, а Total War: Warhammer III заняла четыре строчки в топ-10 5 ч.
Owlcat раскрыла, когда выйдет «Танец Масок» — последнее дополнение к Pathfinder: Wrath of the Righteous 7 ч.
Симулятор космической больницы Galacticare отправит спасать галактику по одному пациенту за приём — новый трейлер и дата выхода 9 ч.
TikTok подал в суд на правительство США в попытке отменить закон о запрете приложения 9 ч.
Режиссёр Deathloop и Marvel’s Blade жёстко раскритиковал руководство Microsoft за закрытие Arkane Austin 10 ч.
API Google Fit будет закрыт в 2025 году — многие носимые устройства перестанут полноценно работать 10 ч.
Apple вновь отклонила игру для Vision Pro с реалистичным изображением оружия, но потом передумала 12 ч.
Microsoft закроет три студии Bethesda, включая разработчиков Hi-Fi Rush и Redfall 12 ч.
Прибыль Disney выросла на 12 %, несмотря на провал по подписчикам Disney+ 13 ч.
CD Projekt Red раскрыла дату выхода мощного редактора модов REDkit для The Witcher 3: Wild Hunt 14 ч.
Представлен первый ноутбук ThinkPad P1 с расширяемой модульной памятью LPCAMM2 34 мин.
Google будет продавать планшет Pixel Tablet на $100 дешевле, но без комплектной док-станции 38 мин.
Tecno выпустила в России смартфоны Pova 6 и Pova 6 Neo с большими батареями, техно-дизайном и MediaTek G99 Ultimate 4 ч.
AWS вложит $9 млрд в расширение облачной инфраструктуры в Сингапуре 7 ч.
Huawei выпустила на глобальный рынок лёгкий ноутбук MateBook X Pro и планшет MatePad 11,5"S с художественным уклоном 8 ч.
Apple работает над собственными серверными ИИ-ускорителями 8 ч.
Google представила Pixel 8a — смартфон за $499 с флагманским чипом и 120-Гц экраном 9 ч.
Электромобили Tesla с включённым автопилотом продолжили попадать в ДТП даже после обновления ПО 9 ч.
Apple снизила цену на iPad 10 и прекратила выпуск iPad 9 — последнего планшета с кнопкой «Домой» 9 ч.
Мировые поставки материалов для выпуска чипов упали на 8,2 % — только Китай показал рост 10 ч.