Сегодня 02 июля 2016
18+
3DNewsПроцессоры и памятьПроцессоры AMDОбзор процессора AMD A10-7850K (Kaveri):...
Процессоры и память

Обзор процессора AMD A10-7850K (Kaveri): самый быстрый из APU

#Описание тестовых систем

Производительность нового гибридного процессора A10-7850K сравнивалась со скоростью работы его прямого конкурента — Core i5-4440, интеловского предложения аналогичной стоимости, построенного на базе новейшего дизайна Haswell. Попутно по скорости работы флагманской модели Kaveri мы сравнивали и со старшей модификацией Richland, A10-6800K. Также в число результатов тестов добавлены показатели производительности рассмотренного нами ранее A8-7600: этот процессор по сравнению с A10-7850K имеет более низкую тактовую частоту и снабжён урезанным графическим ядром, построенным на базе 384 шейдерных процессоров.

В результате набор тестового оборудования приобрёл следующий вид:

  • Процессоры:
    • AMD A10-7850K (Kaveri, 4 ядра, 3,7-4,0 ГГц, 2x2 Мбайт L2, Radeon R7 Series);
    • AMD A10-6800K (Richland, 4 ядра, 4,1-4,4 ГГц, 2x2 Мбайт L2, Radeon HD 8670D);
    • AMD A8-7600 (Kaveri, 4 ядра, 3,3-3,8 ГГц, 2x2 Мбайт L2, Radeon R7 Series);
    • Intel Core i5-4440 (Haswell, 4 ядра, 3,1-3,3 ГГц, 4x256 Кбайт L2, 6 Мбайт L3, HD Graphics 4600).
    • Процессорный кулер: Noctua NH-U14S.
  • Материнские платы:
    • ASRock FM2A88X Extreme6+ (Socket FM2+, AMD A88X);
    • Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
  • Память: 2x8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill [TridentX] F3-2133C9D-16GTX).
  • Графические карты:
    • AMD Radeon HD 7750 (2 Гбайт/128-бит GDDR5, 900/4500 МГц);
    • AMD Radeon R7 250 (2 Гбайт/128-бит GDDR5, 1000/4600 МГц);
    • NVIDIA GeForce GTX 780 Ti (3 Гбайт/384-бит GDDR5, 876-928/7000 МГц).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX760i (80 Plus Platinum, 760 Вт).

Тестирование выполнялось в операционной системе Microsoft Windows 8.1 Enterprise x64 с использованием следующего комплекта драйверов:

  • AMD Chipset Drivers 13.12;
  • AMD Catalyst Graphics Driver 14.1 beta 1.6;
  • Intel Chipset Driver 9.4.0.1027;
  • Intel® Iris and HD Graphics Driver 15.33.8.64.3345;
  • Intel Management Engine Driver 9.5.0.1345;
  • Intel Rapid Storage Technology 12.9.0.1001;
  • NVIDIA GeForce 332.21 Driver.

#Производительность с дискретной графикой

В первую очередь мы тестируем процессоры в платформах с установленной производительной дискретной видеокартой. Такая конфигурация позволяет сравнивать x86-производительность различных архитектур и даёт информацию о том, насколько те или иные CPU подходят для работы в составе производительных систем, где внешние видеокарты верхнего ценового диапазона устанавливаются в обязательном порядке. В этом случае графическое ядро процессоров задействовать невозможно, и оно деактивируется.

Следует подчеркнуть, что в контексте изучения A10-7850K такое тестирование имеет прямой практический смысл. AMD отказалась от дальнейшего развития своих процессоров серии FX, поэтому роль CPU для систем с дискретной графикой постепенно перейдёт к Kaveri или к их последователям.

Futuremark PCMark 8 2.0

По традиции в первую очередь для измерения производительности мы пользуемся интегральным тестом PCMark 8 2.0, который моделирует различные варианты типовой нагрузки на систему. Рассматриваются три сценария: Home — обычное домашнее использование ПК, Creative — использование ПК для развлечений и для работы с мультимедийным контентом и Work — использование ПК для типичной офисной работы.

Если вы читали наш предыдущий материал о процессорах Kaveri, то приведённые результаты не станут для вас неожиданностью. Да, вычислительная производительность ядер Steamroller невысока, поэтому четырёхъядерный Kaveri сильно отстаёт от младшего четырёхъядерного Haswell. Это было вполне ожидаемо, поэтому гораздо более сильное удивление способен вызвать тот факт, что A10-7850K отстаёт не только от Haswell, но и от A10-6800K поколения Richland. Очевидно, микроархитектурных улучшений Steamroller категорически не хватает для того, чтобы скомпенсировать понизившуюся тактовую частоту этого процессора. В результате старая модель APU оказывается быстрее новой на 3-4 процента.

Забавно, что, оправдывая достаточно большую установленную на A10-7850K цену, сама AMD ссылается на высокие показатели этого процессора именно в PCMark 8. Дело в том, что AMD имеет в виду результаты со включённым OpenCL-ускорением, но в случае использования дискретной видеокарты им воспользоваться невозможно, что и приводит к той печальной картине, которая отображена на приведённых диаграммах.

Производительность в приложениях

В Adobe Photoshop CC проводится тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений с цифровой камеры.

В Autodesk 3ds max 2014 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920x1080 с применением рендерера mental ray одного кадра стандартной сцены Space_Flyby из тестового пакета SPEC.

В Мaxon Cinebench R15 проводится измерение быстродействия фотореалистичного трёхмерного рендеринга в анимационном пакете CINEMA 4D. Применяемая в бенчмарке сцена содержит порядка 2 тысяч объектов и состоит из 300 тысяч полигонов.

Тестирование скорости архивации измеряется в WinRAR 5.0. Здесь тестируется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. При этом используется максимальная степень компрессии.

Для тестирования скорости транскодирования видео в формат H.264/AVC мы пользуемся широко распространённым кодеком x264 версии r2358. Для оценки производительности используется исходный 1080p@50fps AVC-видеофайл из бенчмарка x246 FHD Benchmark 1.0.1, имеющий битрейт около 30 Мбит/с.

Отставание A10-7850K от похожего по стоимости Core i5-4440 составляет от 30 до 70 процентов. Иными словами, выбор процессоров семейства Kaveri для использования в составе систем с дискретной видеокартой смысла не имеет вообще. Даже более дешёвый A10-6800K, относящийся к прошлому поколению APU, зачастую способен предложить более высокую скалярную вычислительную производительность.

Производительность в играх

Тестирование в играх мы провели с использованием Full HD-разрешения и высоких настроек качества. Наша высокопроизводительная дискретная видеокарта GeForce GTX 780 Ti позволяет увидеть существенные различия в процессорной скорости даже в этом случае. Используемые настройки:

  • Batman — Arkham Origins: разрешение 1920x1080, Anti-Aliasing = MSAA 4x, Geometry Details = DX11 Enhanced, Dynamic Shadows = DX11 Enhanced, Motion Blur = On, Depth of Field = DX11 Enhanced, Distortion = On, Lens Flares = On, Light Shafts = On, Reflections = On, Ambient Occlusion = DX11 Enhanced, Hardware Accelerated Physx = High.
  • Civilization V: Brave New World: разрешение 1920х1080, Antialiasing = 4xMSAA, High-Detail Strategic Vie = On, GPU Texture Decode = On, Overlay Detail = High, Shadow Quality = High, Fog of War Quality = High, Terrain Detail Level = High, Terrain Tesselation Level = High, Terrain Shadow Quality = High, Water Quality = High, Texture Quality = High. Используется DirectX 11-версия игры.
  • F1 2013: разрешение 1920x1080, Ultra Quality, 4xAA, DirectX11. Используется трасса Texas и версия игры с поддержкой AVX-инструкций.
  • Metro: Last Light: разрешение 1920x1080: DirectX 11, High Quality, Texture Filtering = AF 16X, Motion Blur = Normal, SSAA = On, Tesselation = On, Advanced PhysX = On. При тестировании используется сцена D6.

Полученные в игровых тестах результаты ещё раз подтверждают всё сказанное выше. Вычислительная производительность A10-7850K не лучше, чем у A10-6800K. Процессор поколения Richland, хоть и основывается на микроархитектуре Piledriver, а не Steamroller, имеет на 10 процентов более высокую тактовую частоту и более агрессивную технологию турбо. Этого вполне хватает, чтобы обеспечить большее количество кадров в секунду в играх при использовании дискретной видеокарты.

Поэтому нет ничего удивительного и в том, что A10-7850K не сравним по игровому быстродействию с Core i5-4440. Интеловский четырёхъядерник выдаёт куда более высокие показатели производительности в играх, так что для производительных геймерских систем платформа Socket FM2+ совершенно не подходит. Впрочем, это вряд ли стало для кого-то неожиданностью: с невысокой игровой производительностью процессоров AMD мы сталкиваемся каждый раз, когда речь заходит о носителях микроархитектуры Bulldozer или её последователей.

Steamroller против Piledriver

Полученные в вычислительных тестах результаты заставляют задаться вопросом, насколько же в действительности микроархитектура Steamroller прогрессивнее своей предшественницы. AMD утверждала, что рост производительности при постоянной тактовой частоте составит 15-20 процентов. Но практические результаты явно говорят о том, что внедрённые усовершенствования зачастую не компенсируют 10-процентное снижение тактовой частоты. Поэтому мы решили посмотреть, насколько Kaveri будет быстрее Richland, при условии их тактования на одинаковой частоте.

В следующей таблице приводятся результаты тестов, проведённых с процессорами A10-7850K и A10-6800K, частота которых была принудительно установлена на отметке 4,0 ГГц.

Kaveri 4,0 ГГцRichland 4,0 ГГцПреимущество Steamroller
PCMark 8 2.0, Home 2937 2873 +2,2 %
PCMark 8 2.0, Work 2825 2796 +1,0 %
PCMark 8 2.0, Creative 2990 2894 +3,3 %
WinRAR 5.0, секунды 204,8 197,3 -3,7 %
Photoshop CC, секунды 150,3 157,5 +4,8 %
3ds max 2014, секунды 248 339 +36,7 %
x264 (r2358), fps 15,1 12,92 +16,9 %
Cinebench R15 336,8 310,8 +8,4 %
Metro: Last Light, 1920x1080 SSAA HQ 45,8 43,1 +6,3 %
Civilization V, 1920x1080 4xAA HQ 56,3 53,7 +4,8 %
F1 2013, 1920x1080 4xAA UHQ 72,5 75,8 -4,4 %
Batman: Arkham Origins, 1920x1080 4xAA UHQ 75 71,1 +5,5 %

Соотношение между производительностью Steamroller и Piledriver оказывается очень неоднородным. В лучшем случае преимущество новой микроархитектуры превышает 35 процентов, а в худшем — она проигрывает до 4 процентов. Среднее же значение превосходства Kaveri над Richland в производительности на одинаковой тактовой частоте составляет около 7 процентов.

Характер полученных результатов позволяет сделать однозначный вывод, что в первую очередь превосходство Steamroller над Piledriver выявляется на многопоточных алгоритмах, задействующих целочисленные инструкции. Иными словами, выполненное в Steamroller разделение общего на двухъядерный модуль декодера инструкций вместе с другими оптимизациями позволило поднять эффективность работы целочисленных исполнительных устройств. Поэтому задачи вроде трёхмерного рендеринга или перекодирования видео получили очень заметный прирост в скорости выполнения. В том же случае, когда приложения активно используют всё ещё разделяемый блок операций с вещественными числами или SIMD-инструкции, прирост производительности оказывается заметно меньше.

Наблюдающееся же в отдельных случаях падение производительности, похоже, связано с ухудшением скоростных характеристик контроллера памяти, который у Kaveri создаёт большую латентность при обращениях, чем у Richland.

 

Kaveri 4,0 ГГц

 

Richland 4,0 ГГц

Причины этого эффекта, вероятно, состоят в том, что контроллер памяти Kaveri на уровне архитектуры спроектирован универсальным и, помимо двух DDR3-каналов, имеет два дополнительных канала с поддержкой GDDR5-памяти. У имеющихся на данный момент моделей процессоров эта функциональность заблокирована, но её потенциальное наличие, как показывают тесты, несколько тормозит работу всей подсистемы памяти.

#Производительность интегрированного графического ядра

Игровая производительность

То, что традиционная вычислительная производительность A10-7850K не столь высока, как того хотелось бы, ещё ничего не значит. Просто не надо рассматривать этот процессор в качестве возможной основы системы, оснащённой дискретной видеокартой, — он для этого совершенно не годится. Его сильная сторона в другом: Kaveri может позволить обойтись вообще без какой-либо видеокарты. Встроенное в него графическое ядро семейства Radeon R7 нацеливается на то, чтобы предложить достойную для игровых систем производительность.

Говоря о возможностях встроенной в A10-7850K графики, AMD подчёркивает, что она быстрее, чем графические карты, установленные в 35 процентов игровых компьютеров (по данным Steam).

Благодаря этому данный гибридный процессор может обеспечить достаточно высокий уровень графической производительности (больше 30 кадров в секунду в Full HD-разрешении) не только в большинстве сетевых игр, но и в популярных однопользовательских играх.

Однако начать тестирование графической производительности видеоядра процессора A10-7850K мы решили с традиционного бенчмарка 3DMark Professional Edition 1.2. Результаты этого гибридного процессора сопоставлялись с показателями не только интегрированной графики A10-6800K, A8-7600 и Core i5-4440, но и дискретных видеоускорителей Radeon HD 7750 и Radeon R7 250.

Превосходство графического ядра A10-7850K над всеми остальными вариантами интегрированной графики очевидно. Благодаря новой архитектуре GCN 1.1 и увеличенному до 512 числу шейдерных процессоров рассматриваемый APU заметно превосходит по скорости как старший Richland, так и Haswell. Фактически A10-7850K на данный момент действительно предлагает самую производительную интегрированную графику для настольных компьютеров.

Однако, несмотря на это, A10-7850K всё-таки не дотягивает по своему результату до показателей графических карт Radeon HD 7750 и Radeon R7 250. Проблема встроенной в APU графики известна давно: недостаточно высокая пропускная способность подсистемы памяти ограничивает её производительность. Поэтому A10-7850K не только заметно отстаёт от Radeon HD 7750 с 512 шейдерными процессорами, но и проигрывает даже Radeon R7 250, у которого число шейдерных процессоров ограничено 384. Дискретные видеокарты оснащаются GDDR5 с пропускной способностью свыше 70 Гбайт/с, используемая же в платформе Socket FM2+ двухканальная память DDR3-2133 может предложить полосу пропускания лишь на уровне 34 Гбайт/с.

Впрочем, давайте посмотрим, что происходит в реальных играх.

В многопользовательском шутере Battlefield 4 интегрированная графика процессора A10-7850K, как и обещала AMD, оказывается способной обеспечить в Full HD-разрешении комфортное количество кадров в секунду даже при средних настройках качества. Превосходство над старшим Richland составляет 16-18 процентов, а над Haswell — достигает 70 процентов. Однако любителям поиграть при высоком качестве изображения всё-таки придётся снизить разрешение где-то до уровня 720p. К сожалению, графика A10-7850K не может предложить сравнимый с показателями Radeon HD 7750 и Radeon R7 250 уровень быстродействия: эти видеокарты быстрее на 35-40 процентов.

Популярный шутер Crysis 3 отличается высокими требованиями к производительности графического ускорителя, и здесь мы сталкиваемся с тем, что A10-7850K не может выдать приемлемую производительность в Full HD даже при минимальном качестве изображения. Очевидно, обладателям игровых систем на базе A10-7850K придётся в некоторых случаях разрешение снижать. Например, в том же Crysis 3 30 кадров в секунду при среднем качестве изображения можно получить лишь в разрешении 720p. Надо заметить, что видеокарты Radeon HD 7750 и Radeon R7 250 от такой проблемы избавлены.

Гоночный симулятор F1 2013 не отличается высокими требованиями к производительности графической подсистемы, поэтому, имея платформу на базе A10-7850K, в Full HD в него можно играть даже с высоким качеством изображения. Преимущество старшего Kaveri перед Richland здесь составляет 25-30 процентов.

Ещё одна требовательная к мощности графики игра, помимо Crysis 3, — это шутер Metro: Last Light. Обладая конфигурацией на базе A10-7850K без дискретного видеоускорителя, комфортно поиграть в него в Full HD-разрешении не удастся даже при минимальных настройках, а при среднем качестве разрешение придётся понижать до 720p. Стодолларовые дискретные видеокарты Radeon HD 7750 и Radeon R7 250 предлагают на 30-40 процентов более высокую производительность и неплохо справляются с отображением Metro: Last Light в недоступном для A10-7850K разрешении 1920x1080. Иными словами, говорить о Kaveri как о процессоре, встроенный графический движок которого способен обеспечить возможность установки Full HD-разрешения в любых играх, совершенно неправомерно.

В приключенческом боевике от третьего лица Tomb Raider производительность графической составляющей A10-7850K находится на неплохом уровне. В разрешении 1920x1080 возможна установка среднего качества изображения, при этом превосходство над Richland составляет 7-15 процентов. Графическое ядро GT2 процессора Haswell отстаёт от графики A10-7850K на внушительные 50-75 процентов, делая любые десктопные интеловские предложения плохим вариантом для использования в игровых системах, опирающихся на встроенные в CPU графические ядра.

Кстати, хочется обратить внимание на один любопытный момент: A10-7850K демонстрирует лишь слегка более высокое быстродействие, чем A8-7600, несмотря на то, что количество шейдерных процессоров в старшем APU на треть больше. Это — ещё одна иллюстрация к тому, что производительность интегрированных ядер AMD упёрлась совсем не в их графические ресурсы, а в пропускную способность памяти. Поэтому то, что Radeon HD 7750 и Radeon R7 250, оснащённые 128-битной GDDR5-памятью, выдают на 35-40 процентов более высокий FPS, удивлять не должно.

AMD отдельно напирает на то, что интегрированные системы, построенные на её процессорах, могут стать хорошим выбором для поклонников сетевых Free-to-play-игр. Наши тесты в многопользовательском боевом авиационном аркадном симуляторе War Thunder это всецело подтверждают. Обладатели конфигураций с процессором A10-7850K смогут комфортно играть в эту игру в Full HD-разрешении при выборе высокого качества изображения. Выгодно смотрятся тут и другие процессоры AMD. Интеловский же Haswell с графическим ядром GT2 подобный уровень производительности обеспечить не в состоянии.

В то же время самая популярная многопользовательская игра World of Tanks предъявляет к производительности графической подсистемы более высокие требования. Для получения комфортной частоты кадров в разрешении 1920x1080 обладателям A10-7850K в ней придётся снизить качество до среднего. И кстати, старший Kaveri тут не обеспечивает заметных преимуществ по сравнению с Richland — вероятно, причина кроется в высокой процессорозависимости данной игры. Впрочем, как бы то ни было, гибридный процессор A10-7850K — вполне достойный выбор для системы преданного поклонника танков. Однако дискретные графические карты с ценой порядка 100 долларов и здесь, как и в других случаях, позволяют получить на 30-35 процентов более высокую производительность.

#Влияние частоты памяти

То, что внешние видеокарты с аналогичной A10-7850K конфигурацией графического ядра обладают заметно более высоким быстродействием, а также то, что разница в практической скорости графики у A10-7850K и A8-7600 достигает лишь 5-10 процентов, явно указывает на главное узкое место в графической производительности — скорость подсистемы памяти. Совершенно очевидно, что для повышения производительности работы встроенной в Kaveri графики нужна более быстрая память. AMD планировала наделить Kaveri поддержкой более скоростных, чем DDR3, типов SDRAM, но что-то пошло не так, и финальные версии десктопных процессоров, хотя и перешли на новую платформу Socket FM2+, оказались совместимы лишь с традиционной DDR3 SDRAM.

Это значит, что нарастить скорость подсистемы памяти в Kaveri можно лишь использованием более скоростных модулей DDR3. Формально эти процессоры поддерживают модули с частотой до DDR3-2133, и именно с такой памятью мы и проводили тесты. Однако, как показала практика, в системы с A10-7850K можно устанавливать и DDR3-2400. О том, какой прирост производительности можно получить в этом случае, мы и поговорим ниже. А заодно посмотрим, насколько потеряет в своей скорости A10-7850K, если систему с ним комплектовать не DDR3-2133, а более медленными модулями.

Приведённые диаграммы вряд ли нуждаются в подробных комментариях. Они очень наглядно указывают на то, насколько важна для Kaveri быстрая память. Переход с DDR3-2133 на DDR3-2400 позволяет получить заметный прирост быстродействия — порядка 5 процентов. Если же в системе с A10-7850K использовать не DDR3-2133, а, например, ширпотребную DDR3-1600, то потери в игровом быстродействии будут доходить до 20 процентов. Иными словами, собирая недорогую геймерскую систему с A10-7850K, экономить на памяти явно не следует.

#Программный интерфейс Mantle

Как и графические карты поколения Volcanic Islands, процессоры Kaveri, основанные на той же архитектуре GCN, обладают поддержкой нового графического программного интерфейса Mantle. Это название давно будоражит умы обладателей новых видеокарт AMD, так как внедрение данного интерфейса обещает достаточно серьёзное увеличение производительности в играх. Аналогично дело обстоит и с Kaveri: внедрение Mantle может стать ещё одним способом более полного раскрытия потенциала встроенного графического ядра. Будучи хорошо осведомлённым об аппаратных тонкостях APU, Mantle предлагает специально оптимизированную прослойку между игровым движком и аппаратными ресурсами вычислительных и графических ядер. Подобный низкоуровневый программный интерфейс давно используется в игровых консолях, и там он показывает очень хорошие результаты. Поэтому широкое внедрение Mantle в современных играх способно поднять привлекательность Kaveri для экономных геймеров.

Для систем, построенных на базе процессоров Kaveri, Mantle не только реализует разнообразные низкоуровневые оптимизации, но и осуществляет более равномерное распределение нагрузки, создаваемой графическим драйвером, по x86-ядрам процессора. Однако следует иметь в виду, что в наибольшей степени Mantle эффективен тогда, когда игровая производительность упирается в скорость вычислительных ресурсов процессора, а в конфигурациях, использующих интегрированные видеоядра, ситуация обычно обратна: узким местом выступают мощности GPU и пропускная способность шины памяти. Тем не менее в момент представления Kaveri AMD говорила о возможном росте производительности, который можно получить за счёт фирменного API, — этот рост в реальных играх якобы достигает 45-процентной величины.

На данный момент у AMD уже готов бета-драйвер версии 14.1, поддерживающий Mantle, и существует игра — Battlefield 4, способная использовать этот программный интерфейс. Естественно, мы протестировали, как включение Mantle сказывается на частоте кадров в том случае, когда для запуска Battlefield 4 используется геймерская система с интегрированной графикой, построенная на базе процессора A10-7850K.

Никакими 45 процентами прироста тут и не пахнет. Увеличение количества кадров в секунду в Battlefield 4 в системе, основанной на A10-7850K, не превышает единиц процентов. Как известно, максимальный прирост активация Mantle даёт в системах со слабым процессором и мощной графической картой, а в случае с A10-7850K соотношение производительности вычислительных ядер и GPU — обратное.

В то же время от включения Mantle в системе на базе A10-7850K есть и заметный негативный эффект. Просто смотреть надо не на средний, а на минимальный FPS.

Минимальный FPS при задействовании Mantle по сравнению с DirectX заметно падает, то есть фирменный программный интерфейс AMD ухудшает плавность игры без каких-либо к тому предпосылок. Возможно, проблема кроется в том, что на данный момент драйвер Mantle находится в бета-стадии. Хочется верить, что AMD ещё внесёт в него какие-то изменения, которые смогут исправить низкий минимальный FPS и дополнительно поднимут скорость работы Battlefiled 4 через Mantle в системах, построенных на APU компании.

#Технология Dual Graphics

Каждый раз, когда дело касается тестирования встроенной процессорной графики, компания AMD предъявляет свой уникальный козырь — технологию Dual Graphics. Эта продвигаемая со времён Llano технология позволяет формировать ассиметричные CrossFire-конфигурации с участием встроенного в процессор графического ядра. Не обошла она стороной и Kaveri. Интегрированное видеоядро процессора A10-7850K, относящееся к серии Radeon R7, может быть «спарено» с любой дискретной видеокартой того же семейства Radeon R7, установленной в слот PCI Express. Ранее считалось, что на архитектуру таких видеокарт накладываются определённые ограничения, но на самом деле никаких рамок нет: вместе с A10-7850K в режиме Dual Graphics может работать любая графическая карта Radeon R7 с архитектурой GCN.

Причём с выпуском Kaveri и выходом драйвера Catalyst 14-й версии AMD наконец-то удалось решить давнюю проблему с тиарингом (разрывами кадров) выводимого изображения, которая напрямую затрагивала Dual Graphics-конфигурации. Теперь технология Dual Graphics работает значительно лучше и не вызывает никаких неприятных артефактов, поэтому её вполне можно рассматривать в качестве одного из путей увеличения графической производительности.

Для ознакомления с работой Dual Graphics в системе на базе Kaveri мы протестировали производительность комбинации A10-7850K и графической карты Radeon R7 250 с GDDR5-памятью.

Максимальный прирост быстродействия технология Dual Graphics обещает в том случае, если производительность процессорной графики и дискретной видеокарты примерно одинакова. Поэтому самой выгодной парой для A10-7850K AMD называет Radeon R7 240. Radeon R7 250 же дороже и быстрее, поэтому встроенная в процессор графика помогает ему не слишком сильно: увеличение производительности по сравнению с одиночной видеокартой составляет от 35 до 45 процентов.

При этом технология Dual Graphics так и не лишилась своих ограничений, которые во многих случаях ставят её полезность под вопрос. Как можно видеть по результатам, положительный эффект она даёт далеко не всегда. Существует огромное число игр, которые не только не получают прирост от Dual Graphics, но и, напротив, начинают выдавать меньшую частоту кадров. Связано это как с отсутствием необходимых оптимизаций драйвера, так и с тем, что в ряде случаев Dual Graphics вообще не включается на программном уровне. Например, эта технология может ускорять исключительно игры, работающие через DirectX 10/11, но не DirectX 9. Иными словами, масштабируемость, которую может предложить Dual Graphics, совершенно не впечатляет.

#Гетерогенная производительность

Наряду с игровыми приложениями графическое ядро процессоров Kaveri могут использовать для ускорения вычислений и обычные приложения общего назначения. Как уже говорилось, с выходом Kaveri компания AMD внедряет архитектуру HSA, делающую шейдерные кластеры графического ядра самостоятельными структурными единицами и упрощающую тем самым программирование и использование для вычислений параллельных шейдерных процессоров. Однако внедрение HSA и заточенного под эту архитектуру фреймворка OpenCL 2.0 — дело отдалённого будущего, пока же AMD даже не может предложить необходимого для включения данной технологии драйвера. Зато поддержка OpenCL 1.1 в Kaveri, как и в других разновидностях современных процессоров с интегрированной графикой, превосходно работает, и поддерживающие OpenCL приложения могут переносить часть своей вычислительной работы на шейдерные конвейеры через этот программный интерфейс.

База программных продуктов, способных задействовать гетерогенные возможности гибридных процессоров, неуклонно растёт и сегодня включает внушительное число популярных программ.

Предстоящее внедрение HSA должно расширить этот список, тем не менее стоит заметить, что ускорить за счёт использования параллельных процессоров графического ядра можно всё-таки не любые алгоритмы. В качестве применений, где использование гибридных возможностей APU может иметь практический смысл, AMD называет задачи распознавания образов, анализ биометрических параметров, системы дополненной реальности, задачи кодирования, редактирования и перекодирования аудио и видео, а также поиск и индексирование мультимедийных данных.

В идеале, мы бы не хотели прибегать к отдельным тестам производительности в задачах, использующих OpenCL. Было бы гораздо лучше, если бы поддержка гетерогенных процессоров появилась в общеупотребительных приложениях, в том числе и тех, которые мы используем для обычного тестирования. Однако такого пока нет: гибридные вычисления внедрены далеко не везде, причём в подавляющем числе случаев OpenCL-ускорение применяется лишь для реализации каких-то конкретных функций, и, чтобы его увидеть, необходимо придумывать специальные тесты. Поэтому исследование гетерогенной производительности и стало отдельной и независимой частью нашего материала.

Первым и наиболее известным тестом OpenCL-производительности выступает бенчмарк Luxmark 2.0, который построен на базе рендера LuxRender, использующего физическую модель распространения света. Для оценки гетерогенной производительности процессоров мы используем сцену средней сложности Sala, а её рендеринг выполняем с задействованием как графических, так и x86-ядер.

Как нетрудно заметить, подключение к работе вычислительных ресурсов графических ядер приводит к серьёзному увеличению производительности, но качественно меняет не слишком многое. Процессоры Intel, как и APU компании AMD, вполне способны предложить похожую функциональность: их современные модификации поддерживают OpenCL 1.1 полноценно и без каких-либо ограничений. Поэтому при использовании мощности графического ядра старший Kaveri сохраняет своё отставание от четырёхъядерного Haswell. Оно здесь не столь катастрофично, как в задачах, опирающихся лишь на x86-ядра, но тем не менее A10-7850K полноценным конкурентом для Core i5-4440 не выглядит.

Ещё один тест, активно задействующий ресурсы графических ядер, это SVPMark 3. Он измеряет производительность системы при работе с пакетом SmoothVideo Project, направленным на повышение плавности воспроизведения видео путём добавления в видеоряд новых кадров, которые содержат промежуточные положения объектов.

На диаграмме можно увидеть производительность процессоров как без задействования ресурсов их графических ядер, так и после включения GPU-ускорения. Достаточно любопытно, что заметное ускорение при этом получает не только Kaveri, но и Haswell. Так, задействование OpenCL поднимает производительность A10-7850K на 48 процентов, а Core i5-4440 ускоряется на 33 процента. Если же учесть, что Core i5 может предложить четыре x86-ядра с более высокой удельной производительностью, в конечном итоге гетерогенное быстродействие A10-7850K и Core i5-4440 устанавливается примерно на одинаковом уровне.

Одним из самых значительных достижений концепции APU, свидетельствующих о её принятии рынком программного обеспечения, стало появление поддержки OpenCL в популярном архиваторе WinZIP. Поэтому измерение скорости архивации в WinZIP 18 мы обойти стороной не могли. В целях тестирования сжатию подвергалась папка с распакованным дистрибутивом Adobe Photoshop CC.

WinZIP хорошо иллюстрирует тезис о том, что ускорению за счёт переноса нагрузки на графические ядра можно подвергнуть далеко не все алгоритмы. Хотя формально WinZIP имеет поддержку OpenCL, в реальности параллельные графические ядра подключаются к работе лишь при сжатии файлов объёмом более 8 Мбайт. Более того, особого выигрыша в скорости от этого нет, поэтому разница в производительности гибридных процессоров со включённым и отключённым OpenCL минимальна. Соответственно, более высокое быстродействие здесь во всех случаях показывает интеловский четырёхъядерный Haswell.

Формальная поддержка OpenCL появилась и в популярном графическом редакторе Adobe Photoshop CC. Правда, на самом деле гетерогенные возможности APU используются лишь в работе нескольких фильтров. В частности, AMD рекомендует измерять производительность при выполнении операции Smart Sharpen, что мы и проделали с 24-мегапиксельным изображением.

Прирост скорости работы фильтра Smart Sharpen, который можно получить при вовлечении в работу графической части современных процессоров, впечатляет. Данная операция начинает выполняться в системе с A10-7850K на 90 процентов быстрее, а в системе с Core i5-4440 — быстрее на 45 процентов. Иными словами, на примере фильтра Smart Sharpen мы можем увидеть хорошую вычислительную производительность графического ядра Kaveri, но она всё равно не позволяет A10-7850K опередить похожий по стоимости четырёхъядерный Haswell. И кстати, даже со включённым OpenCL-ускорением старший Richland превосходит A10-7850K за счёт более высокой тактовой частоты своих вычислительных и графических ядер.

Может быть перенесена на GPU и часть операций по транскодированию видео высокого разрешения. Для проверки того, какой прирост в скорости можно получить в этом случае, мы воспользовались поддерживающей OpenCL утилитой MediaCoder 0.8.28. Оценка производительности проводится с использованием исходного 1080p@50fps файла в AVC-формате из бенчмарка x246 FHD Benchmark 1.0.1, имеющего битрейт около 30 Мбит/с.

Здесь производительность Kaveri за счёт задействования для вычислений графического ядра удаётся увеличить совсем незначительно. Зато интеловский Core i5-4440, обладающий поддержкой специальной технологии для перекодирования видео Quick Sync, при включении вычислительных ресурсов графического ядра наращивает свою скорость в разы. На самом деле и в процессорах AMD есть похожая технология для аппаратного кодирования видеоконтента — VCE. Однако по какой-то причине ни одна из распространённых утилит для перекодирования видео этот движок не поддерживает. Будем надеяться, что с внедрением в Kaveri новой и более гибкой версии этого движка VCE 2 ситуация наконец сможет поменяться.

Ещё один пример популярного приложения, поддерживающего OpenCL, — это профессиональная программа для редактирования и монтажа видео Sony Vegas Pro 12. При выполнении в ней рендеринга видео нагрузка может распределяться по разнородным ресурсам гибридных процессоров.

Вовлечение в вычислительную работу графического ядра процессоров Kaveri позволяет получить очень весомый прирост в скорости рендеринга видео. Однако это всё равно не позволяет старшему APU компании AMD догнать конкурирующий Core i5-4440. Современные интеловские процессоры располагают гораздо более производительными x86-ядрами, поэтому даже при активации OpenCL A10-7850K серьёзно не дотягивает до скорости Haswell. Кроме того, интеловские процессоры тоже поддерживают OpenCL и ускоряются при подключении к вычислительной работе ресурсов графического ядра. Прирост скорости при этом не такой впечатляющий, как у APU компании AMD, тем не менее списывать его со счетов явно не стоит.

По просьбе AMD мы включили в эту часть тестирования и Futuremark PCMark 8 2.0. Данный бенчмарк при моделировании обычной пользовательской активности в общеупотребительных задачах может задействовать OpenCL-ускорение. И тогда мы можем получить представление о той производительности, которую будут показывать гибридные процессоры в идеальном случае, когда эффективную поддержку гетерогенных вычислений получат все распространённые приложения.

Понятно, почему AMD использует результаты PCMark 8 2.0 во всех своих маркетинговых материалах. Благодаря своему сильному графическому ядру A10-7850K побеждает во всех трёх сценариях: Home, Creative и Work. Это явно указывает на то, что при условии грамотной гетерогенной оптимизации приложений процессоры Kaveri могут оказаться гораздо лучше интеловских CPU. Иными словами, развиваемая AMD концепция APU действительно имеет большой потенциал, полноценно раскрыть который и должно помочь внедрение технологии HSA.

#Энергопотребление

Энергопотребление — это ещё один традиционно больной вопрос для процессоров AMD. По крайней мере для их производительных модификаций, которые не имеют искусственно заниженных частот для удовлетворения требованиям экономичных тепловых пакетов. С выпуском процессоров Kaveri AMD рассчитывала немного поправить сложившуюся ситуацию и даже немного уменьшила расчётные показатели тепловыделения для старших моделей линейки A10. Помочь улучшению энергетических характеристик должен был не только новый 28-нм техпроцесс, но и снизившиеся тактовые частоты. Иными словами, удельная производительность в пересчёте на каждый затраченный ватт должна была возрасти.

Как же обстоит дело на практике? На следующих ниже диаграммах приводится полное потребление систем (без монитора), использующих встроенную процессорную графику, измеренное на выходе из розетки, в которую подключен блок питания тестовой платформы. Все имеющиеся в процессорах энергосберегающие технологии активированы. Нагрузка на процессорные ядра создаётся 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX, а графические ядра нагружаются утилитой Furmark 1.12.

Потребление современных процессоров в состоянии простоя близко к нулю, так что показатели, приведённые на графике выше, касаются скорее платформ в целом, нежели исследуемых APU. Поэтому не удивительно, что, вне зависимости от того, какой процессор установлен в платформе Socket FM2+, потребление получается примерно одинаковым. Система же на базе Haswell потребляет меньше — сказываются энергосберегающие технологии, которыми располагают современные наборы логики Intel.

При полной нагрузке на x86-ядра неожиданно выясняется, что A10-7850K стал даже более прожорливым, чем предыдущий флагман поколения Richland, A10-6800K. Потребление нового процессора выше на 9 Вт — даже несмотря на то, что его рабочие частоты заметно меньше. Соответственно, ни о каком соперничестве в экономичности с интеловскими четырёхъядерниками речь вести невозможно.

При графической нагрузке ситуация несколько отличается. Графическое ядро процессоров Kaveri обладает заметно лучшей экономичностью, чем графика Richland. Однако необходимо упомянуть один нюанс: Kaveri умеют динамически управлять частотой своего графического ядра, и при высокой нагрузке она автоматически снижается. По всей видимости, в данном случае мы как раз и столкнулись с пределом по потреблению, поскольку во время тестирования A10-7850K и A8-7600 частота их GPU периодически снижалась со штатных 720 МГц до 650 МГц, а временами — даже до 550 МГц.

Невысокое потребление демонстрируют Kaveri и при параллельной нагрузке на все ядра одновременно. Однако в данном тесте мы столкнулись с интеллектуальным управлением частотой не только GPU, но и вычислительных ядер. Как оказалось, при высокой графической нагрузке Kaveri не только сбрасывают частоту своего GPU, но и ограничивают частоту процессорных ядер 3-гигагерцовой величиной. В результате при одновременной высокой нагрузке на все ресурсы гибридного процессора его потребление оказывается не слишком большим, но это, естественно, сказывается и на производительности.

#Разгон

Старшая модель Kaveri, A10-7850K, формально относится к числу оверклокерских моделей, обладающих разблокированными множителями, — на это недвусмысленно указывает литера K в конце модельного номера. Но в данном случае это скорее дань традиции, нежели реальная сильная сторона новинок. Новый, применяемый для изготовления Kaveri, 28-нм SHP (Super High Performance) техпроцесс совершенно не способствует появлению у этих APU нераскрытого частотного потенциала. И даже с теоретических позиций новые гибридные процессоры должны гнаться ещё хуже, чем их предшественники, тоже не отличавшиеся хорошими возможностями разгона.

Это подтвердилось и на практике. Максимальной частотой, при которой A10-7850K, с одной стороны, сохранял стабильность, а с другой — не снижал свою скорость из-за превышения предельной температуры, оказалась 4,4 ГГц. Напряжение питания на процессоре при этом пришлось поднять до 1,375 В.

Следует подчеркнуть, что разгон A10-7850K — не такая уж и тривиальная процедура из-за интеллектуальных алгоритмов динамического управления частотой в зависимости от температурного режима и нагрузки. Увеличение процессорного множителя выше номинала на первый взгляд проходит очень легко и редко когда вызывает проблемы со стабильностью. Но при тестировании под нагрузкой нередко выясняется, что процессор для сохранения своей работоспособности самовольно сбрасывает частоту отдельных ядер существенно ниже заданных в BIOS материнской платы значений. К сожалению, эта интеллектуальность никак не отключается, поэтому при рассмотрении оверклокерских результатов, помимо всего прочего, требуется уделять отдельное внимание проверке реальных частот всех четырёх процессорных ядер. Такое самопроизвольное «торможение» процессора, к сожалению, не даёт возможности существенно поднимать его напряжение питания.

Попутно с традиционной процессорной частью можно разогнать и встроенное в APU графическое ядро. С увеличением напряжения на северном мосту процессора до 1,375 В, стабильности GPU нам удалось добиться при повышении его частоты в BIOS материнской платы до 960 МГц.

Впрочем, на самом деле, разгон графики в A10-7850K имеет мало практического смысла. Во-первых, отнюдь не частота ограничивает производительность GPU, а пропускная способность шины памяти. Во-вторых, при повышении частоты GPU вновь приходится сталкиваться со слишком интеллектуальным автономным управлением частотой. Увеличение частоты графического ядра приводит к тому, что в реальности при 3D-нагрузке она начинает систематически сбрасываться до более низких значений, и наблюдаемая на практике игровая производительность практически не возрастает.

Иными словами, AMD старалась сделать из Kaveri процессоры с предсказуемым энергопотреблением и тепловыделением, а это потребовало внедрения технологий управления реальной частотой, которые плохо уживаются с оверклокингом. Это значит, что Kaveri для экспериментов по разгону подходит неважно.

#Выводы

В целом Kaveri оказался очень неоднозначным продуктом, и мнения о нём могут кардинально различаться в зависимости от того, под каким углом смотреть на новинку. Об этом мы уже говорили, когда рассматривали модификацию A8-7600, это же должны повторить и сейчас, по итогам знакомства с A10-7850K.

Новый процессор безумно интересен тем, что он развивает концепцию гетерогенных вычислений и внедряет технологию HSA, которая позволяет разработчикам программных продуктов легко перейти к написанию алгоритмов, исполняющихся на вычислительных кластерах графического ядра. Кажется, ещё немного — и AMD добьётся того, что новые приложения будут работать на её процессорах не хуже, чем на CPU компании Intel. Для этого у Kaveri есть все необходимые ресурсы и, самое главное, огромная теоретическая вычислительная мощность, кроющаяся в графическом ядре.

Однако не всё так просто. Пока существует не так много даже простых оптимизированных под OpenCL приложений, а эффективность имеющихся реализаций гетерогенных вычислений оставляет желать лучшего. К тому же на параллельные вычислители графического ядра могут быть перенесены далеко не любые алгоритмы. В результате, подчёркивая, что в теории системы на базе Kaveri могут быть очень продуктивны, мы вынуждены констатировать реальное и заметное отставание рассмотренной нами старшей модели A10 от конкурирующего четырёхъядерного Core i5 в подавляющем большинстве счётных задач. Причём такая ситуация наблюдается сейчас не только в приложениях, исполняемых исключительно на x86-ядрах, но и там, где поддержка OpenCL уже реализована.

Другое дело — игры. Здесь у AMD всё совсем хорошо, даже несмотря на то, что скорость встроенного в A10-7850K GPU категорически упёрлась в пропускную способность шины памяти. Несмотря на это, конфигурации, построенные на этом процессоре и использующие возможности интегрированного графического ядра, с полным правом могут считаться полноценными игровыми системами начального уровня. Большинство современных игр может исполняться на A10-7850K в Full HD-разрешении, а многие из них, например популярные сетевые проекты, при этом вполне сносно работают даже с выбором среднего или высокого качества изображения. Десктопные Haswell подобную игровую производительность не могут предложить в принципе, по крайне мере до тех пор, пока Intel не решится перенести в настольные модели процессоров старшие модификации своих графических ядер GT3/GT3e.

В итоге на данный момент A10-7850K можно рекомендовать лишь как основу недорогих настольных компьютеров для нетребовательных игроков. Для энтузиастов же этот процессор малоинтересен — в первую очередь из-за своей ограниченной x86-производительности. Впрочем, если AMD умерит свои амбиции и снизит цены, противопоставив A10-7850K не четырёхъядерным, а двухъядерным процессорам конкурента, мы будем готовы пересмотреть свою позицию.

← Предыдущая страница

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
⇣ Комментарии
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.