Видеокарты. Видеокарты ⇡ Участники тестирования
Главная » Расчет » Видеокарты. Видеокарты ⇡ Участники тестирования

Видеокарты. Видеокарты ⇡ Участники тестирования

Мощнейший ответ на «Гавайи» - новый однопроцессорный король в 3D

  • Часть 2 - Практическое знакомство
  • Часть 3 - Результаты игровых тестов (производительность)

Не успели отгреметь залпы фейерверков по поводу запуска новых флагманов AMD, как «зеленоватый краб» (детали смотреть ) резко активизировался и мощным движением клешни погнал ранее приготовленный шар в свою норку. Почему ранее приготовленный? Да потому, что, если уйти от аллегорий, уже в трех продуктах для игрового рынка используется один и тот же чип (ядро) - GK110. Он и в GTX 780, и в GTX Titan. И теперь он же в GTX 780 Ti. Просто с разными степенями «обрезанности». Полноценный (если вести речь о вычислениях с двойной точностью) GK110 идет исключительно в рабочие станции Tesla. В остальном можно сказать, что GTX 780 Ti имеет ядро GK110 со всеми рабочими блоками.

О деталях, как обычно, расскажет Алексей Берилло.

Часть 1: Теория и архитектура

Было понятно, что после выхода топовой видеокарты Radeon R9 290X компании AMD ее конкурент, калифорнийская компания Nvidia, обязательно выпустит еще более мощное решение. Да, номинально Radeon R9 290X не превзошла эксклюзивную модель Geforce GTX Titan по производительности, да и в сражении с Geforce GTX 780 она не всегда побеждает. Однако Nvidia вряд ли потерпела бы посягательство на лидерство от представителя конкурента на базе видеочипа Hawaii, ведь возможности их лучшего графического процессора GK110 были не исчерпаны даже в GTX Titan, основанном на таком чипе с частично отключенными исполнительными блоками.

По этой причине почти сразу после выхода топовой платы конкурента компания Nvidia на одном из своих мероприятий анонсировала скорый выход еще более мощной модели - Geforce GTX 780 Ti, которую мы сегодня и рассмотрим. Видеокарта модели Geforce GTX 780 Ti является самым мощным решением компании для тех, кто хочет играть в требовательные игры при максимальных настройках качества и в самых высоких разрешениях, включая Ultra HD. На момент своего выхода эта модель обеспечивает максимальную производительность в 3D-играх среди одночиповых видеокарт.

Чтобы добиться этого, в Geforce GTX 780 Ti применяется новая ревизия графического процессора GK110 с активными потоковыми вычислительными ядрами в количестве 2880 штук, что даже больше, чем у дорогущего эксклюзива GTX Titan! В число других улучшений, которыми отличается GTX 780 Ti, входит и повышенная до 7 ГГц эффективная частота работы видеопамяти, позволившая серьезно увеличить ее пропускную способность, а также более совершенная система управления питанием и частотой GPU, которая позволяет видеочипу работать на максимально возможной в текущих условиях частоте.

При этом, благодаря весьма энергоэффективной графической архитектуре Kepler, а также некоторым доработкам в последней ревизии видеочипа GK110 и примененной эффективной системе охлаждения, Geforce GTX 780 Ti остается достаточно тихой и прохладной видеокартой для своего уровня производительности. Это особенно важно для набирающих популярность компактных системных блоков, которые имеют жесткие ограничения по питанию, тепловыделению и шумности системы охлаждения. Geforce GTX 780 Ti вполне может применяться в данных решениях: пусть эта модель потребляет немало энергии, но она вполне соответствует требованиям по питанию и охлаждению даже для использования в таких ПК.

Однако не будем забегать слишком далеко вперед и рассмотрим все особенности новой видеоплаты подробнее. В связи с тем, что рассматриваемая сегодня видеокарта Nvidia Geforce GTX 780 Ti основана на базе графического процессора GK110 архитектуры «Kepler», о которой мы уже не раз подробно рассказывали, то читателям будет полезно ознакомиться со статьями о более ранних моделях графических решений компании:

  • Nvidia Geforce GTX 780 - урезанная версия GTX Titan, ускоритель премиум-класса;
  • Nvidia Geforce Titan - новый однопроцессорный флагман 3D-графики игрового класса;
  • Nvidia Geforce GTX 680 - новый однопроцессорный лидер 3D-графики.

Рассмотрим подробные характеристики анонсированной сегодня видеоплаты Geforce GTX 780 Ti, основанной на полной версии топового графического процессора компании Nvidia.

Графический ускоритель Geforce GTX 780 Ti

  • Кодовое имя чипа GK110;
  • Технология производства 28 нм;
  • 7,1 миллиардов транзисторов;
  • Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
  • Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических и вычислительных шейдеров, а также тесселяции;
  • 384-битная шина памяти, шесть независимых контроллеров шириной по 64 бита каждый, с поддержкой GDDR5-памяти;
  • Частота ядра 875 (турбочастота - 928) МГц;
  • 15 потоковых мультипроцессоров, включающих 2880 скалярных ALU для расчетов с плавающей запятой одинарной точности (FP32) в рамках стандарта IEEE 754-2008 и 960 ALU для расчетов с плавающей запятой двойной точности (FP64), работающих с темпом 1/8 (а не полноскоростными, как в GTX Titan;
  • 240 блоков текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • 6 широких блоков ROP (48 пикселей) с поддержкой режимов сглаживания до 32 выборок на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
  • Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort;
  • Интегрированная поддержка четырех мониторов, включая два порта Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2;
  • Поддержка шины PCI Express 3.0.

Спецификации референсной видеокарты Geforce GTX 780 Ti

  • Частота ядра 875 (928) МГц;
  • Количество универсальных процессоров 2880;
  • Количество текстурных блоков - 240, блоков блендинга - 48;
  • Эффективная частота памяти 7000 (1750×4) МГц;
  • Тип памяти GDDR5, 384-битная шина памяти;
  • Объем памяти 3 ГБ;
  • Пропускная способность памяти 336 ГБ/с;
  • Вычислительная производительность (FP32) 5,0 терафлопс;
  • Теоретическая максимальная скорость закраски 42 гигапикселя в секунду;
  • Теоретическая скорость выборки текстур 210 гигатекселей в секунду;
  • Два разъема Dual Link DVI-I, один Mini-HDMI, один DisplayPort 1.2;
  • Шина PCI Express 3.0;
  • Типичное энергопотребление (TDP) 250 Вт;
  • Один 8-контактный и один 6-контактный разъемы питания;
  • Двухслотовое исполнение;
  • Рекомендуемая цена для рынка США - $699 (для России - 24990 руб).

Название новой платы соответствует системе наименований, принятой в рамках текущего семейства Geforce GTX 700. Nvidia дала самой быстрой своей видеокарте такое же наименование, что и менее мощной GTX 780, но добавила к нему суффикс «Ti» (не путать с Titan!). Новинка Geforce GTX 780 Ti будет продаваться в США за $699 (у нас - за 25 тысяч рублей, с учетом налогов и дополнительных расходов). Она располагается в линейке компании Nvidia над Geforce GTX 780, а поступление модели на наш рынок ожидается после 15 ноября.

Несмотря на мощную новинку, Geforce GTX Titan, за который просят аж $1000, продолжит существовать в параллельной вселенной продаваться как специализированное решение для CUDA-разработчиков, которым нужна полноскоростная обработка данных в формате с двойной точностью, а также большой объем локальной памяти в 6 ГБ. Тем же, кому не нужны эти возможности, а требуется просто максимальная 3D-производительность, лучше подойдет самая быстрая видеокарта Geforce GTX 780 Ti с увеличенным количеством вычислительных ядер, работающих на более высокой частоте.

Что касается решений компании AMD, которые могут быть конкурентами для представленной сегодня GTX 780 Ti, то тут всё просто. Прямого соперника для новой модели у AMD нет, Radeon R9 290X явно будет несколько медленнее, чем GTX 780 Ti, которая, в свою очередь, должна превзойти в играх даже GTX Titan. Однако несмотря на то, что настоящего соперника для GTX 780 Ti в семействе Radeon R9 не существует, сравнивать новинку мы будем с R9 290X - ближайшей к ней по цене и являющейся топовой одночиповой моделью AMD.

В характеристиках GTX 780 Ti нас немного тревожит лишь то, что объем видеопамяти, по сравнению с GTX Titan, всё-таки урезали, поставив на GTX 780 Ti лишь 3 ГБ видеопамяти, а не 6 ГБ, как у эксклюзивной платы. Да, сегодня такого объема всё еще вполне достаточно, и разница заметна лишь в сверхвысоких разрешениях, многомониторном выводе изображения или стереорендеринге. Но уже в ближайшем будущем, с распространением игр для следующего поколения консолей, объема в 3 ГБ может уже не хватить. Впрочем, всегда можно надеяться, что выпуск моделей GTX 780 Ti с 6 ГБ видеопамяти наладят партнеры Nvidia, если это не будет строжайше запрещено калифорнийской компанией ради продаж пары десятков плат GTX Titan в год.

Печатная плата референсного варианта Geforce GTX 780 Ti компании Nvidia имеет длину в 10,5 дюймов (267 мм) - ровно такую же, что и у GTX 780. Для вывода изображения на плате установлено два разъема Dual-Link DVI, один HDMI и один DisplayPort 1.2 порт, как и на младшей модели. Для питания видеокарты на ней предусмотрены привычные для топовых моделей разъемы дополнительного питания: по одному 8-контактному и 6-контактному разъему. Дизайн корпуса аналогичен платам GTX Titan и GTX 780 и схож с дизайном двухчиповой видеокарты Geforce GTX 690.

Интересной новой особенностью, связанной с системой питания видеокарты, которая появилась в Geforce GTX 780 Ti, стала функция регулировки (балансировки) питания, весьма важная в случае серьезного разгона видеочипа. Как известно, современные топовые видеокарты получают питание по трем источникам: от 8-контактного и 6-контактного разъемов дополнительного питания, а также по разъему PCI Express. В обычных условиях питание видеокарты, получаемое из этих источников, сбалансировано, но при разгоне видеокарта может требовать гораздо больше питания от одного из трех указанных источников, по сравнению с другими, что может вызвать некоторые проблемы со стабильностью.

Новая функция регулировки питания, появившаяся в Geforce GTX 780 Ti, позволяет направить энергию, получаемую от одного источника к другому. Другими словами, при исчерпании возможностей одного из источников видеокарта будет получать недостающее ей питание из других. Это должно эффективно помогать при серьезном разгоне и может позволить достичь максимально возможной частоты для Geforce GTX 780 Ti по сравнению с предыдущими моделями на этом же GPU: Geforce GTX Titan и GTX 780.

Графическая архитектура

Как и ее топовые предшественники, новая модель Geforce GTX 780 Ti основана на самом сложном графическом процессоре, который получил первое практическое применение в универсальных вычислительных устройствах Nvidia Tesla. Топовый GPU компании поддерживает все возможности, известные со времен GK104 (Geforce GTX 680), и все особенности архитектуры Kepler относятся и к нему в полной мере. Полная версия графического процессора GK110 имеет в своем составе пять кластеров графической обработки Graphics Processing Cluster (GPC), каждый из которых состоит из трех мультипроцессоров SMX:

В целом GK110 состоит из 15 мультипроцессоров SMX, содержащих по 192 вычислительных блока. Каждый мультипроцессор имеет по одному движку PolyMorph Engine и по 16 блоков текстурной фильтрации. Подсистема памяти GK110, лежащего в основе Geforce GTX 780 Ti, содержит шесть 64-битных каналов памяти, что в сумме дает 384-битный доступ к ней. И так как блоки растровых операций ROP «привязаны» к контроллерам памяти, то их количество в данном GPU равно 48 блокам. Объем кэш-памяти второго уровня на весь чип составляет 1,5 МБ.

Модель Geforce GTX 780 Ti основана на графическом процессоре GK110 с 2880 вычислительными ядрами и отличается от всех предыдущих моделей на базе этого чипа тем, что все 15 блоков SMX в GK110, объединенные в пять кластеров GPC, разблокированы и используются в работе. А ведь даже Geforce GTX Titan основан на версии GK110 с одним отключенным мультипроцессором SMX, не говоря уже о модели GTX 780, имеющей еще меньше активных вычислительных блоков. Топовая новинка Nvidia содержит на четверть больше вычислительных ядер, по сравнению с Geforce GTX 780. Количество текстурных блоков TMU в данной версии чипа равно 240 штукам, да и по блокам ROP никаких ограничений нет - работают все 48.

Для того, чтобы это стало возможным, в Nvidia выпустили специальную новую ревизию данного GPU, которая была оптимизирована для достижения лучшей энергоэффективности. С соотношением производительности и потребляемой энергии в видеочипах архитектуры Kepler и так всё весьма неплохо со времени Geforce GTX 680 на базе GK104, но в обновленном GK110 она была повышена дополнительно, что дало возможность обеспечить работу видеочипа на достаточно высокой тактовой частоте при всех разблокированных мультипроцессорах в GPU.

Подсистема памяти Geforce GTX 780 Ti не изменилась по отношению к предыдущим решениям на основе GK110 и она содержит шесть 64-битных контроллеров памяти, что в целом составляет 384-битную шину. Применяется GDDR5-память объемом 3 ГБ (в случае референсных вариантов партнеры компании могут выпустить и 6-гигабайтные варианты). А вот частота видеопамяти в Geforce GTX 780 Ti была повышена даже по сравнению с Titan, и она равна 7000 МГц (эффективная частота), поэтому обеспечивается приличная пропускная способность в 336 ГБ/с, что даже больше, чем у конкурирующей модели AMD Radeon R9 290X, имеющей 512-битную шину памяти. На сегодняшний день данная модель имеет самую быструю видеопамять и максимальную ПСП для одночиповых видеокарт.

Базовая частота GPU в модели Geforce GTX 780 Ti равна 875 МГц, а турбочастота («Boost Clock») составляет 928 МГц. Естественно, новой моделью поддерживается технология GPU Boost 2.0, обеспечивающая работу видеочипа на максимально возможной частоте в различных условиях. При этом Boost 2.0 гарантирует и минимальный уровень производительности, независимый от условий питания и охлаждения в виде базовой частоты, ниже которой частота не снизится. Указанная турбочастота является средней для набора современных игр и 3D-приложений, на которой работает графический процессор этой видеоплаты, а реальная частота в играх будет отличаться для каждого приложения, также она зависит и от условий охлаждения.

Понятно, что Geforce GTX 780 Ti поддерживает все современные технологии компании Nvidia, о которых мы ранее неоднократно писали, в том числе Adaptive VSync и PhysX. Обо всех этих технологиях подробно написано в предыдущих обзорах видеокарты семейства Kepler, ссылки на которые даны в начале страницы. Так как Geforce GTX 780 Ti имеет в основе топовый графический процессор GK110 той же архитектуры, то новая модель предлагает все современные возможности в виде DirectX 11, PhysX, TXAA, адаптивного VSync и других технологий.

Игры и сотрудничество с игровыми разработчиками

Как всегда, аппаратная часть в видеокартах хоть и самая важная, но не единственная. Большую роль играет и программная поддержка, и это касается не только выпущенных вовремя оптимизированных видеодрайверов, чем занимается соответствующий отдел Nvidia, но и сотрудничества с разработчиками игр в виде помощи и удобного инструментария для внедрения современных эффектов, а также помощи по оптимизации игрового кода для собственных решений.

Nvidia является признанным лидером в деле сотрудничества с игровыми разработчиками, у них давно есть множество соответствующих программ, а игровые проекты, выходящие с помощью Nvidia, объединяются в известную программу The Way It"s Meant To Be Played (TWIMTBP). Для облегчения труда разработчиков компания недавно вышла с еще одной обобщенной инициативой, получившей название GameWorks, служащей для ускорения и упрощения внедрения новых графических эффектов в игры.

Программа GameWorks включает множество утилит и технологий, это результат работы нескольких сотен инженеров компании Nvidia, работающих над самыми современными и технологичными алгоритмами, связанными с графическими и физическими эффектами. За несколько лет компания собрала лучшие эффекты, утилиты, алгоритмы, движки, библиотеки и т. п. в то, что известно сейчас под названием GameWorks. Более того, в рамках этой кампании инженеры Nvidia продолжают работать вместе с игровыми разработчиками, помогая им внедрять эффекты, исправлять ошибки, улучшать 3D-производительность в их проектах и обучаться новым графическим технологиям.

Результат работы Nvidia в этом направлении, включающий сотрудничество в рамках программы GameWorks, можно увидеть в большом количестве самых современных и популярных игр. Все они получают от сотрудничества с Nvidia дополнительные эффекты, оптимизации производительности, а также другую поддержку. Вот лишь некоторые из последних примеров:

Эффекты, которые вошли в состав вышеперечисленных игр, включают объемные лучи света («god rays») в Assassin’s Creed 4: Black Flag, поддержку физических эффектов GPU PhysX в играх Call of Duty: Ghosts, Batman: Arkham Origins и The Witcher: Wild Hunt, имитацию глобального освещения HBAO+ в Watch_Dogs и почти всех указанных играх, DirectX 11-тесселяцию в большинстве проектов и т. д. и т. п.

Ну а Geforce GTX 780 Ti является, несомненно, лучшей видеокартой для того, чтобы насладиться всеми этими технологиями и эффектами, в максимальном качестве и при любом разрешении рендеринга. А игроки, которые уже обзавелись мониторами Ultra HD (да-да, оба два) могут получить приемлемую производительность в таких играх, как Batman: Arkham Origins и Assassin’s Creed 4: Black Flag именно на мощнейшей модели Geforce GTX 780 Ti или даже на парочке таких видеокарт, объединенных в SLI-систему.

К примеру, в игре Assassin’s Creed IV: Black Flag при всех включенных эффектах: DX11 (тесселяция), HBAO+, тени по алгоритму cfontact-hardening shadows, объемные лучи света god rays, сглаживание методом 2x TXAA и рендеринге в разрешении Ultra HD (3840×2160) потребуется система из пары видеокарт Geforce GTX 780 Ti в SLI, чтобы получить всего лишь около 32 FPS.

А чтобы поиграть в Batman: Arkham Origins со всеми эффектами: тесселяция, HBAO+, улучшенные тени (contact-hardening shadows), глубина резкости (Depth of Field), PhysX (системы частиц, турбулентность и имитация тканей), 4x TXAA сглаживание в разрешении Ultra HD, - также нужны две Geforce GTX 780 Ti - они обеспечат 46 FPS в этой игре. Чего только не сделают энтузиасты ПК-игр, на какие только траты не пойдут ради четкой картинки.

А давайте посмотрим, стоит ли графика в Batman: Arkham Origins того, чтобы потратиться на пару недешевых видеокарт. Во-первых, в этой игре используется технология Nvidia PhysX для создания реалистичных физических эффектов. Игровые настройки дают возможность полного отключения физических эффектов, но гораздо красивее и реалистичнее игра выглядит при PhysX-эффектах, выставленных хотя бы на уровень «Normal», когда включается имитация тканей для персонажей и некоторых объектов: флагов, баннеров, листов бумаги и др. При установке PhysX в положение «High» включаются эффекты модуля APEX Turbulence, которые усиливают эффекты с системами частиц, вроде дыма, снега, пара и тумана.

Хотя «нормальный» режим PhysX (с эффектами имитации тканей) можно включить на системах с любыми видеокартами, полноценные PhysX-эффекты потребуют современной видеокарты компании Nvidia с поддержкой DirectX 11 и видеопамятью объемом от 1 ГБ. При максимальных установках качества (PhysX выставлен в «High», включено сглаживание TXAA, HBAO+, улучшенные тени, тесселяция) и в высоких разрешениях рекомендуется использовать видеокарты уровня Geforce GTX 780 и выше.

Рассмотрим используемые в этой игре эффекты поближе. Имитация тканей PhysX Cloth используется в Batman: Arkham Origins для рендеринга таких реалистичных объектов, как листы бумаги, одежда персонажей, баннеры и плащ главного героя - все эти материалы взаимодействуют с другими объектами подобно настоящим.

Второй интересный эффект - APEX Turbulence. Это аппаратно-ускоренные физические PhysX-алгоритмы, помогающие создать такие эффекты с множеством частиц, как дым, снег, пар и объемный туман. Все они динамически взаимодействуют с окружающим миром, подвержены силам гравитации, ветру, взрывам и др. Более того, спрайты частиц могут отбрасывать тени друг на друга и на окружение по алгоритму particle shadow mapping, что придает им еще более реалистичный вид.

При рендеринге плаща Бэтмена в игре используется аппаратная тесселяция и наложение карт смещения (displacement mapping), что придает этому предмету одежды дополнительную детализацию и реалистичность. Неоттесселированный плащ имеет гораздо меньше проработанных деталей и выглядит не настолько объемным, так как его складки не могут отбрасывать тень сами на себя. Тесселяция плаща главного героя включается настройкой «Geometry Detail», выставленной в значение «DX11 Enhanced».

Также аппаратная DirectX 11 тесселяция с картами смещения используется и при рендеринге реалистичных деформаций лежащего снега. С выключенной тесселяцией используется попиксельный алгоритм, который дает неплохие результаты, но слишком плоские, без геометрической детализации, которая нужна также и для корректного просчета имитации глобального освещения, чтобы правильно затенять сцену. При включении же тесселяции используются динамические карты смещения, которые деформируют реальную геометрическую поверхность. Поэтому вышеперечисленные проблемы исчезают, следы на снегу приобретают объем, корректно взаимодействуют с тенями и имитацией глобального освещения (ambient occlusion HBAO+).

Эффект имитации глубины резкости в оптике (Depth of Field - DOF) давно применяется в играх, но разные алгоритмы существенно отличаются друг от друга по сложности. Одним из наиболее продвинутых является Nvidia Depth-of-Field (NVDOF) - эта техника способна отрисовывать эффект боке крупного размера при фиксированной производительности. Эффект работает и заметен не везде, но с опцией «Depth of Field», выставленной в «DX11 Enhanced», NVDOF применяется в некоторых сценах игры с приближениями к камере лиц персонажей, гаджетов и т. п.

Для улучшения техники имитации глобального освещения (Screen Space Ambient Occlusion - SSAO) компания Nvidia разработала алгоритм HBAO+, который достаточно быстро выполняется при рендеринге в полном разрешении 1920×1200 на графических процессорах уровня Geforce GTX 660 и выше и особенно эффективен на GPU с поддержкой DirectX 11. Результат работы HBAO+ выглядит даже лучше того, что получается при использовании обычного HBAO, особенно в сценах с тонкими и узкими объектами, вроде листьев и травы.

Алгоритм Nvidia HBAO+ более качественный и менее требовательный к вычислительным ресурсам, по сравнению с аналогичными техниками. Nvidia приводит такие цифры: расчет буфера HBAO+ на Geforce GTX 680 в разрешении 1920×1200 занимает 2,7 мс на кадр, тогда как традиционный алгоритм HBAO требует 9,2 мс в тех же условиях (учитывается время рендеринга всех проходов, требуемых для просчета имитации глобального освещения).

В игре Batman: Arkham Origins при рендеринге теней применяется алгоритм (Percentage-Closer Soft Shadows - PCSS) - техника, дополняющая оригинальный алгоритм проекционных теней. Чтобы его включить, нужно выставить настройку «Dynamic Shadows» в положение «DX11 Enhanced». PCSS применяется ко всем моделям персонажей и обеспечивает несколько улучшений: границы теней сильнее размываются по мере удаления от источника света, используется высококачественная фильтрация карт теней, устраняющая алиасинг, а использование теневого буфера позволяет устранить некорректное перекрытие нескольких теней. Похоже, что на скриншоте для персонажа используется улучшенный PCSS алгоритм, а для других объектов (посмотрите на «зубчатую» тень справа) - упрощенный.

Также в последней игре сериала про Бэтмена применяется полноэкранное сглаживание методом TXAA. Это сравнительно новый метод сглаживания, о котором мы уже писали не раз. Главная его задача - в устранении временны́х артефактов вроде мелькающих пикселей на краях объектов при движении. TXAA - это смесь аппаратного сглаживания и специальной постобработки - временного фильтра (temporal filter). Метод обеспечивает высокое качество сглаживания, но картинка при этом слегка замыливается, что нравится не всем. Отличие TXAA от FXAA в том, что последний призван обеспечить максимальную производительность ценой сниженного качества, а первый - максимальное качество при дополнительных (небольших) потерях в производительности.

Хорошо, есть такие симпатичные игры, как Batman: Arkham Origins и Assassin’s Creed 4: Black Flag, но за них ведь еще платить надо… Первым счастливым покупателям Geforce GTX 780 Ti не надо! Купившие топовую новинку до конца текущего года получат бесплатные цифровые копии игр Assassin"s Creed IV: Black Flag, Batman: Arkham Origins и Splinter Cell Blacklist от партнеров компании Nvidia. Так, к самой быстрой одночиповой видеокарте добавились еще три современных игры, в которых применяются последние графические технологии. А североамериканским покупателям Geforce GTX 780 Ti повезло еще больше, при покупке новинки Nvidia до 21 ноября они получат еще и ваучер на скидку $100 для покупки карманной игровой консоли Nvidia Shield.

Geforce Experience 1.7 с новой функцией ShadowPlay

О Geforce Experience (GFE) мы писали в своих статьях уже не раз, со времени ее выхода она была установлена на миллионы игровых систем во всем мире. Это часть драйверов Nvidia, которая обеспечивает дополнительные возможности, не связанные напрямую с работой GPU. Основной задачей GFE является своевременное обновление драйверов для видеокарт Geforce и оптимизация игровых настроек для пользовательской системы, исходя из системных требований игры и конфигурации ПК.

Буквально при помощи одного клика мышью можно оптимизировать графические настройки установленных на пользовательском ПК игр так, чтобы обеспечивалась достаточная производительность при оптимальном качестве картинки. GFE способна найти и установить оптимальные настройки более чем для сотни игр и для всех современных GPU компании, включая Geforce GTX 780 Ti.

Кроме игровых оптимизаций, Geforce Experience также занимается автоматической проверкой обновленных версий драйверов Nvidia, их загрузкой и установкой, что значительно облегчает задачу по обновлению драйверов, оптимизированных для самых современных игр.

Но наиболее интересной возможностью, появившейся 28 октября в последней версии , кроме новых профилей, обновленных настроек для игр и других новых возможностей, стал давно обещанный компанией Nvidia инструмент видеозахвата под названием ShadowPlay.

ShadowPlay - это простой бесплатный инструмент для захвата изображения игрового процесса в движении, использующий аппаратный H.264-кодер NVENC, встроенный во все современные графические процессоры, на которых основаны видеокарты Nvidia серий Geforce GTX 600 и 700. Соответственно, в преимущества ShadowPlay входит: минимальное влияние на общую производительность (менее 10%) из-за использования аппаратного блока кодирования видеоданных в Kepler, запись роликов в разрешении 1920×1080 с частотой кадров 60 FPS и битрейтом до 50 МБит/с, неограниченное время записи в ручном режиме (только для Windows 8) и 10–20-минутные ролики в режиме постоянной записи Shadow Mode. Увы, но продолжительность записи в Windows 7 ограничена размером файла в 4 ГБ из-за особенностей этой версии операционной системы.

Наиболее интересен режим Shadow, который записывает игровой процесс постоянно, без нужды в нажатии кнопок при начале записи, в этом режиме просто сохраняются последние 10 или 20 минут (в зависимости от операционной системы) игрового процесса в специальный буфер на накопителе. В любой момент, если в игре произошел какой-то интересный момент, требующий его сохранения (точный снайперский выстрел в сетевом шутере, веселые «баги» с проникновением через стены и т. п.), можно нажать комбинацию клавиш «Alt+F10» для того, чтобы сохранить видео в отдельном файле. А чтобы записать всю игровую сессию, потребуется выбрать ручной режим записи при помощи комбинации клавиш «Alt+F9».

Так как видео сохраняется в обычном H.264-формате, то для дальнейшего его использования и редактирования можно применить любой популярный видеоредактор: Sony Vegas, Adobe Premiere и их бесплатные аналоги, поддерживающие MP4-контейнер и формат H.264. Можно также сразу залить видеофайл и на YouTube, а в будущих версиях Geforce Experience появится возможность интеграции с онлайн-сервисом Twitch.tv, которая позволит пользователям ShadowPlay пересылать записанное на Twitch.

Из-за того, что функция ShadowPlay при работе использует блок аппаратного H.264-кодирования, который встроен во все GPU компании Nvidia семейств Geforce GTX 600 и 700, в минимальных требованиях указана видеокарта Geforce GTX 650, а мобильные GPU пока что не поддерживаются. Возможность записи можно использовать в играх, использующих DirectX 9 и выше. Не слишком мягкие требования к GPU оправданы тем, что аппаратное кодирование имеет явное преимущество по сравнению с программными решениями, использующими ресурсы CPU, такими как FRAPS. Аппаратное кодирование на графическом процессоре снижает общую производительность лишь на единицы процентов даже при записи видеороликов с максимальным качеством, в то время как программные методы обычно требуют куда большего.

Из числа других нововведений в Geforce Experience 1.7 выделим еще несколько функций. Так, Geforce GTX LED Visualizer позволяет настроить пользовательский режим яркости, мерцания и рисунка для светодиодов, подсвечивающих логотипы в таких видеокартах, как Geforce GTX 690, GTX 770, GTX 780, GTX 780 Ti и GTX Titan. А Nvidia GameStream 1.0 дает возможность играть в ПК-игры при помощи игровой консоли Shield, когда изображение рендерится на ПК и по беспроводной сети передается на карманную консоль. Помимо того, начиная с версии Geforce Experience 1.7 в ней появились оптимальные игровые настройки для пары десятков поддерживаемых GFE игр для разрешения 3840×2160 (Ultra HD или 4K). А все выходящие в будущем игры изначально будут иметь оптимальные настройки для этого разрешения в GFE.

Теоретическое сравнение с Radeon R9 290X

Интересно, что в этот раз в своих материалах для прессы Nvidia пошла на прямое и подробное сравнение новинки с конкурентом в лице Radeon R9 290X. Обычно дело ограничивалось парой диаграмм с привычными красными и зелеными столбиками, но в этот раз все достоинства своего продукта и недостатки конкурирующего были расписаны весьма подробно.

К примеру, одним из важнейших достоинств Geforce GTX 780 Ti по сравнению с Radeon R9 290X компания Nvidia считает более высокую энергоэффективность и стабильность при работе на высоких частотах при максимальной нагрузке. При этом приводятся интересные цифры сравнения Geforce GTX 780 Ti и Radeon R9 290X (при расчетах тут используется общее потребление видеокартой, включая видеопамять и другие компоненты, а не только GPU):

По данным Nvidia, модель Radeon R9 290X при максимальной частоте GPU потребляет заметно больше: 290 Вт против 250 Вт у GTX 780 Ti. При этом рассеять тепло, исходящее от GPU, их конкурентам сложнее еще и потому, что графический процессор Hawaii, применяемый в R9 290X, меньше по площади: 455 мм 2 по сравнению с 533 мм 2 для GK110, на базе которого основана модель Geforce GTX 780 Ti.

Естественно, что с каждого миллиметра поверхности GPU компании AMD приходится отводить большее количество тепла. Неудивительно, что более низкий параметр плотности тепловыделения (соотношения выделяемого тепла к площади чипа) означает более эффективное охлаждение, что выражается в более высоких тактовой частоте и производительности, а также в меньшей шумности вентилятора системы охлаждения. И если установкой более мощного кулера можно как-то отвести выделяемое тепло от Radeon R9 290X, то проблем с шумностью системы охлаждения не решить.

Таким образом, недостаток большей площади чипа, который выражается в повышенной себестоимости производства, Nvidia обратила в фундаментальное преимущество своей графической архитектуры. Иными словами, по словам Nvidia, они чуть ли не специально делают крупные по площади чипы, чтобы добиться лучшего охлаждения и производительности. В результате видеокарта Geforce GTX 780 Ti явно более энергоэффективна, по сравнению с Radeon R9 290X, поэтому она тише и прохладнее. По данным компании Nvidia, GPU в Radeon R9 290X работает на температурах до 95 градусов Цельсия, в то время как температура видеочипа Geforce GTX 780 Ti в тех же условиях не превышает 83 градусов.

Есть и еще один момент, связанный с энергоэффективностью и высоким потреблением, который позволяет Geforce GTX 780 Ti работать на более высоких частотах при мощных вычислительных нагрузках. На следующей диаграмме Nvidia указывает реальную тактовую частоту Geforce GTX 780 Ti и Radeon R9 290X от одного из производителей (в «тихом режиме», что важно), которые рендерят сцены из игры Crysis 3 на протяжении 20 минут в разрешении 2560×1440:

Как отмечает Nvidia, частоты обоих графических процессоров начинаются от отметки в 1 ГГц, но по мере возрастания 3D-нагрузки частоты начинают изменяться, начиная примерно с двухминутной отметки. Видеочип Radeon R9 290X, работающей в тихом режиме, сбрасывает частоту вплоть до 727 МГц, а Geforce GTX 780 Ti, благодаря высокой энергоэффективности и меньшей плотности тепловыделения, продолжает работу на 940 МГц при гарантированной частоте в 875 МГц. И средняя за 20 минут частота GPU в случае Geforce GTX 780 Ti получается заметно выше, чем у Radeon R9 290X: 968 МГц против 799 МГц.

Несмотря на то, что по-хорошему нужно было протестировать Radeon R9 290X еще и в суперрежиме («Uber»), Nvidia выделила важный момент - ведь игроки не бросают играть после пары минут, а делают это на протяжении нескольких десятков минут или даже часов, в отличие от тестов производительности, которые как раз очень редко когда продолжаются больше одной-двух минут. Другими словами, падение частоты ниже 1 ГГц в случае AMD Radeon R9 290X может заметно снизить реальную производительность, по сравнению с тем, что мы видим в коротких бенчмарках на всех сайтах.

Nvidia даже рекомендует «прогревать» тестируемые GPU на протяжении не менее пяти минут, чтобы получить реальную картину производительности, которую увидит конечный пользователь. Кроме того, они утверждают, что их решения с поддержкой GPU Boost обеспечивают гарантированную основную частоту (875 МГц в случае GTX 780 Ti), ниже которой реальная частота не опустится даже в самых плохих условиях, а AMD указывает для своих решений только пиковую частоту, которая никогда не достигается.

Поэтому в реальности разница по производительности между Geforce GTX 780 Ti и Radeon R9 290X (как минимум в тихом режиме) может оказаться даже большей, чем в тестах. Так как частота видеочипа Radeon R9 290X может серьезно снизиться при длительной нагрузке, игроки не получат при этом заявленного компанией AMD уровня производительности. Впрочем, это тема отдельного исследования, требующая времени и внимательного подхода. При этом обязательно нужно исследовать и Uber-режим для Radeon R9 290X.

Предварительная оценка производительности

А теперь переходим к вопросу предварительной оценки производительности нового решения. Модель Geforce GTX 780 Ti основана на том же GK110, что используется в GTX Titan и GTX 780, но имеет 2880 активных вычислительных ядер, что на четверть больше количества математических блоков в младшей модели без суффикса. Есть преимущества перед некогда топовым одночиповым решением и по скорости текстурирования, и по пропускной способности видеопамяти: 336 ГБ/с против 288 ГБ/с.

Давайте сначала оценим теоретическую производительность Geforce GTX 780 Ti, основываясь на пиковых цифрах, полученных из теоретических показателей количества исполнительных блоков и частоты работы GPU.

По большинству пиковых показателей Geforce GTX 780 Ti превосходит все остальные видеокарты, исключая лишь самые мощные двухчиповые решения. Исходя из теории, GTX 780 Ti имеет на 24% большую геометрическую производительность, скорость текстурных блоков на 35% выше и чуть более высокие показатели математической производительности и пропускной способности памяти, по сравнению со своим конкурентом в исполнении AMD.

Естественно, что на диаграмме Nvidia не представлена производительность блоков ROP, которых у Hawaii в Radeon R9 290X на треть больше. А ведь эта разница вполне может негативно повлиять на общую производительность в самых высоких разрешениях и при многомониторном рендеринге.

Но это всё в теории, а во что это теоретическое преимущество Geforce GTX 780 Ti превращается, если смотреть на скорость рендеринга в играх? Сама Nvidia приводит вот такое сравнение по нескольким современным игровым проектам:

Указанные игры запускались на тестовой системе с процессором Intel Core i7-3960X (3,3 ГГц), в высоких настройках, с включенным полноэкранным сглаживанием и в разрешении 2560×1440. Последнее означает, что меньшее количество блоков ROP и меньший объем локальной видеопамяти у Geforce GTX 780 Ti, скорее всего, никак не сказались на средней частоте кадров, по сравнению с Radeon R9 290X.

Итак, благодаря большому количеству активных исполнительных блоков, работающих на высокой частоте, Geforce GTX 780 Ti показывает в протестированных Nvidia играх заметно более высокую производительность, по сравнению с главным конкурентом. Так, Geforce GTX 780 Ti обеспечивает более чем на 40% большую скорость рендеринга в играх Assassin’s Creed 3 и Far Cry 3, а в Batman: Arkham City, Tomb Raider и Metro Last Light преимущество новинки превышает 30%.

В остальных указанных на диаграмме играх Geforce GTX 780 Ti хоть и быстрее, чем Radeon R9 290X, но уже не столь впечатляюще. Так, в Crysis 3 и Battlefield 3 (четвертую часть игры в Nvidia еще не завезли, похоже) преимущество калифорнийской платы составляет лишь 10%. При этом необходимо помнить, что это - оценка Nvidia, то есть одной из заинтересованных сторон, а независимое тестирование игровой производительности вы найдете в третьей части нашего материала.

По нашим предварительным прикидкам получается, что Geforce GTX 780 Ti должна стать самой производительной в 3D-играх графической картой, включая и Radeon R9 290X от конкурента, и Geforce GTX Titan, номинально не входящий в «игровую» линейку и стоящий гораздо больше. Хотя топовая новинка является видеокартой для небедных энтузиастов компьютерных игр и любителей разгона, но она дает лучшие возможности гораздо более широкому кругу потенциальных покупателей, чем это делала GTX Titan в свое время.

Из потенциальных недостатков модели GTX 780 Ti можно выделить лишь сравнительно малый объем видеопамяти в 3 ГБ, которого может быть недостаточно для экстремальных настроек качества в высоких разрешениях, ведь требуемый объем локальной памяти в будущем будет расти вместе с распространением игр для следующего поколения консолей. Остается надеяться, что Nvidia не будет чинить препоны на пути своих партнеров, если те пожелают выпустить модификации GTX 780 Ti с 6 ГБ видеопамяти.

Далее мы переходим к следующей части нашей статьи, которая традиционно посвящена практической части исследования в нашем привычном наборе синтетических тестов, в которых мы сравним производительность новой топовой видеокарты серии Geforce GTX 700 со скоростью близких по производительности и цене решений компаний Nvidia и AMD.

Nvidia Geforce GTX 780 Ti - Часть 2: видеоплаты и синтетические тесты →

Седьмая серия видеокарт от NVIDIA правит на рынке еще совсем недолго. Только весной нам показали GTX 780, которая и сегодня остается очень шустрой видеокартой. Но недавно компания AMD выпустила новую линейку видеокарт, и NVIDIA не смогла остаться в стороне. Нет, новой линейки нам не предлагают, пока. Нам предлагают новую видеокарту – NVIDIA GTX 780Ti, давайте о ней поговорим. Для начала мы посмотрим на слайды из официальной презентации, а потом перейдем к истязанию самой видеокарты и сравнению с прямым конкурентом – AMD R9 290X.

Что же из себя представляет видеокарта GTX 780Ti? Компания NVIDIA выделяет четыре основных фактора. Теперь у нас на 25% больше CUDA-ядер, а именно 2880 штук. Это приятно, так как теперь в нашем распоряжении полноценный GPU GK110 без заблокированных модулей.

Вторая изюминка заключается в изначальной тактовой частоте видеопамяти в 7000 МГц. Это действительно много. Видимо, таким образом NVIDIA борется с шиной памяти 512 бит у конкурента AMD R290X. Дело в том, что недавно появились мониторы с поддержкой разрешения 4K (3840 х 2160). В таком разрешении на шину памяти идет очень высокая нагрузка, требуется большая пропускная способность. Конечно, всем очевидно, что мониторы с таким разрешением не будут пользоваться спросом еще очень долго, так как цена на них сегодня около 150 тысяч рублей. Даже если через год она упадет до 50 тысяч, мониторы все равно не станут выгодной покупкой. Уже очень давно на рынке присутствуют мониторы с разрешение 2560 х 1440 за 20 тысяч рублей, но даже они слишком дорогие для большинства покупателей. И если пользователь может как-то накопить деньги на новую дорогую видеокарту, понимая, что именно ему даст такая обновка, то монитор для большинства игроков не является первостепенной вещью. Но гонка вооружений в области борьбы в сверхвысоком разрешении уже начата и вряд ли будет остановлена.

Помимо этого NVIDIA предлагает нам технологию GPU BOOST 2.0, которая очень точно подбирает максимально стабильную тактовую частоту. Четвертым бонусом идет подсистема питания, которая работает очень точно, благодаря чему мы может рассчитывать на хороший оверклокерский потенциал.

На данном слайде нам показывают превосходство NVIDIA GTX 780 Ti над AMD R9 290X. Сразу обращаешь внимание на параметр «GFLOPS», который возвышается над результатом конкурента буквально на миллиметр. Особенно если учесть, что график построен не от нуля.

NVIDIA GTX 780 Ti Performance

Судя по данному слайду, видеокарта GTX 780 Ti безоговорочно выигрывает в энергопотреблении. Нам заявляют TDP на уровне 250 Ватт. Это немного для производительной карты. Помимо этого, GTX 780 Ti ощутимо холодней, и прогревается по заявлениям компании NVIDIA лишь до 83 градусов. Неплохо, проверим это обязательно.

А вот и замеры игровой производительности. Здесь все хорошо для компании NVIDIА, и не очень хорошо для компании AMD. В большинстве современных игр новинка выигрывает от 10 до 50%. Это серьезное заявление, посмотрим, что окажется в реальности.

Характеристики выглядят очень даже внушительно. Количество потоковых процессоров 2880 шт, функционируют которые на 875 МГц, а GPU BOOST увеличивает частоту до 928 МГц. Шина памяти 384 бита, тип памяти GDDR5. Тактовая частота видеопамяти 7000 МГц. TDP 250 Ватт, питание карта получает по одному шестиконтактному и одному восьмиконтактному разъемам.

Подводя итог, NVIDIA GTX 780 Ti более производительная, более холодная и более тихая видеокарта, нежели AMD R9 290X. Каждый из этих параметров мы обязательно замерим, а теперь давайте перейдем к самой видеокарточке.

Компания NVIDIA решила не придумывать GTX 780 Ti новый дизайн, а воспользоваться тем же, который был у NVIDIA TITAN. С одной стороны, когда покупаешь новый продукт, хочется чтобы и внешность была новая. Конечно, основное кроется под теплораспределительной крышкой, но покупают-то все же глазами. А с другой стороны, компания NVIDIA явно нашла очень удачный дизайн, который не стареет и, если можно так сказать, вне времени. Он просто удачный и стильный.

Весь корпус выполнен из алюминия, что придает видеокарте солидный вес. В центре есть прозрачное окно из пластика, через которое виднеется массивный радиатор. Правда, красиво это ровно до того момента, пока радиатор не забьется пылью. А самостоятельное вскрытие карты для прочистки грозит лишением гарантии.

Видеокарта оснащена четырьмя видеовыходами: один HDMI, одним DisplayPort и двумя DVI. Все четыре разъема могут быть задействованы одновременно.

На верхней грани видеокарты расположились два разъема дополнительного питания, один шестиконтактный и один восьмиконтактный. Название видеокарты имеет светодиодную подсветку и красиво горит в темноте. Еще один маленький плюс дизайна.

На обратной стороне видеокарты нет ровным счетом ничего интересного. Разве что, несколько танталовых конденсаторов.

Дизайн печатной платы тоже не поменялся, практически все элементы остались на тех же местах, что и у NVIDIA TITAN.

В центре платы мы видим сам GPU с маркировкой GK110-425-B1. Вокруг него двенадцать микросхем видеопамяти общим объемом три гигабайта. Почему только три? Хороший вопрос. Для этой видеокарты в самый раз было бы иметь шесть гигабайт видеопамяти, раз она нацелена на борьбу в высоких разрешениях.

Подсистема питания не изменилась и работает по схеме 6+2, где 6 фаз отведено на видеопроцессор, и еще две фазы отдано видеопамяти.

Система охлаждения держится на множестве маленьких винтиков, которые в народе именуют звездочками. В центре СО мы видим небольшую полированную площадку, которая и контактирует с самим GPU. Микросхемы видеопамяти и элементы подсистемы питания передают свое тепло радиатору через термопрокладки.

На этом мы заканчиваем изучение видеокарты и переходим к таблице технических характеристик.

Таблица технических характеристик

NVIDIA GTX 780 AMD R290X
Ядро GK110 GK110 Hawaii
Техпроцесс, нм 28 28 28
Количество потоковых процессоров 2880 2304 2816
Количество блоков (ROPs) 48 48 64
Частота ядра, МГц 875 863 1000
Шина памяти, бит 384 384 512
Тип памяти GDDR5 GDDR5 GDDR5
Объем памяти, Мбайт 3072 3072 4096
Частота памяти, МГц 7000 6008 5000
Поддерживаемая версия DirectX 11.1 11.1 11.2

Различия между обычной GTX 780 и GTX 780 Ti весьма заметны. Здесь и увеличенное количество ядер, возросшее число текстурников и увеличенная тактовая частота видеопамяти. И если обычную GTX 780 новинка от AMD – R9 290X обгоняла практически во всех приложениях, то здесь расстановка сил, скорее всего, поменяется.

Разгон и температуры

По интернету долго и упорно ходили слухи, что полноценный GK110 будет хорошо разгоняться. Дело в том, что предыдущие карты NVIDIA обычно показывали средненький разгон, без выдающихся результатов до серьезной смены охлаждения. Мы проверим разгон GTX 780 Ti на стоковом охлаждении, и посмотрим, сможет ли она нас удивить.

Итак, стоковая тактовая частота видеопроцессора 875 МГц. В режиме саморазгона нам обещается до 928 МГц. Но NVIDIA особое внимание уделила технологии GPU BOOST 2.0. Давайте проверим, как же на самом деле тактовая частота у видеопроцессора под нагрузкой. Нагрузка создавалась бенчмарком 3DMark 13.

Тактовая частота все время находилась на отметке в 1020 МГц. Стоит отметить, что это очень качественный и серьезный бенчмарк, который загружает карту полностью, и не дает ей расслабляться. Тем более, что мы запускали его в режиме Extreme. Поэтому здесь мы получили именно то, что карта действительно может, без влияния кривого кода какой-нибудь игрушки.

Такой результат не может не радовать, особенно если учесть, что это стоковая система охлаждения. А тактовая частота новых видеопроцессоров в авторазгоне зависит также и от температуры. Кстати о температуре. Мы получили максимальное значение в 78 градусов, это очень хорошо.

Разгонять видеопроцессор мы будем на штатном напряжении, не внося каких-либо изменений в работу всего устройства в целом.

Видеопроцессор смог стабильно функционировать на частоте 1126 МГц. Это очень хороший показатель. Относительно стоковых 875 МГц мы получили прибавку в 251 МГц. Это действительно очень хороший результат, особенно если учесть стоковое охлаждение и родное напряжение. Давайте посмотрим, какова реальная частота под нагрузкой. Видеопамять разогналась до 8000 МГц. Это тоже очень высокий показатель.

Фактическая тактовая частота твердо стояла на отметке в 1270 МГц. Ну что сказать, это великолепный результат. Признаться, мы ожидали получить не больше 1100-1150 МГц. Компания NVIDIA действительно выпустила отличный GPU. Если поменять систему охлаждения на более производительную и увеличить напряжение на видеопроцессор, то результат может превзойти все ожидания. Температура при этом увеличилась лишь до 81 градуса.

Что касается температуры в популярной утилите FurMark, то мы получили следующие результаты. Под нагрузкой в номинале карта прогрелась до 84 градусов, что всего на 1 градус больше, чем обещала NVIDIA.

Под нагрузкой в разгоне мы получили все те же 84 градуса. Скорость вращения вентилятора при этом увеличилась с 59% лишь до 61%. Само собой, уровень шума не изменился, что очень приятно. Нужно отметить, что карта совершенно не шумит под нагрузкой.

На сайте GeForce.com стала доступна новая версия GeForce Experience — 1.8 . Помимо новых профилей, обновленных настроек и некоторых других новых возможностей, в GeForce Experience 1.8 включен долгожданный игровой инструмент захвата изображения GeForce ShadowPlay.

Быстрый, бесплатный и простой инструмент, ShadowPlay – это новый подход к записи игрового процесса, осуществляемый с помощью аппаратного H.264-кодера NVENC, встроенного в GPU серий GeForce GTX 600 и 700.

Режим Shadow постоянно записывает игровой процесс, сохраняя от 10 до 20 минут игры во временный буфер жесткого диска. Если вы совершили нечто потрясающее, просто нажмите Alt + F10, чтобы сохранить этот памятный момент в нужную папку. Чтобы предотвратить нагромождение видеофайлов на жестком диске, ShadowPlay сохраняет файл только при нажатии горячих клавиш.

Сохраненный материал затем можно отредактировать в популярных редакторах, таких, как Sony Vegas, Adobe Premier, в бесплатном Windows Movie Maker или в любом другом.mp4-совместимом видеоредакторе, и сразу выложить на YouTube. Вы также можете сначала загрузить «сырой» файл на YouTube и затем отредактировать его с помощью встроенных инструментов. В следующих версиях GeForce Experience, ShadowPlay получит интеграцию с онлайн-сервисом Twitch.tv, что позволит пользователям ShadowPlay пересылать записанные файлы прямо на Twitch.

ShadowPlay использует аппаратный кодер H.264, встроенный в видеокарты серии GeForce GTX 600 и 700, для записи в разрешении 1920×1080 с кадровой частотой 60 fps. Поддерживаются все игры, использующие DirectX 9 или более поздние версии этого интерфейса. По сравнению с программными решениями, использующими для записи геймплея ресурсы CPU, аппаратное кодирование силами GPU снижает производительность всего на 5-10% при записи видеороликов максимального качества с битрейтом 50 Мбит/с. Благодаря автоматическому кодированию в H.264, сжатию и записи в формат MP4, ShadowPlay предотвращает засорение жесткого диска огромными мультигигабайтными файлами.

Если вы хотите записать всю игровую сессию, выбирайте ручной режим с помощью комбинации клавиш Alt + F9 – в данном режиме инструмент работает аналогично традиционным приложениям для записи игрового процесса. В случае Windows 7, из-за особенностей ОС, размер файла ограничен 4ГБ, но в Windows 8 и Windows 8.1 размер файла ограничен только наличием места на жестком диске, так что вы легко сможете создавать многочасовые видеоролики.

Сразу после выпуска бета версии,NVIDIA выпустила обновление, которое включает в себя следующие изменения/дополнения:

  • В Win7 устранено ограничение размера файла в 3,8 ГБ.
  • Запись видео игры до 20 минут в режиме Shadow.
  • Неограниченная по времени запись в ручном режиме.
  • Когда файл достигает размера 3,8 ГБ, ShadowPlay создает новые файлы.
  • Запись видео без изменения масштаба до 1080p. При более высоких разрешениях сохраняется форматное соотношение.
  • Добавлена запись микрофона.

    Видеокарта NVIDA GTX 780 Ti одержала безоговорочную победу над AMD R9 290X. Нет ни одной игры, в которой 290X победила бы. Обратите внимание на огромный прирост производительности в разгоне.

    Заключение

    Видеокарта NVIDIA GTX 780 Ti показала себя очень качественным продуктом. Она быстра, холодна и хорошо выглядит. Производительность во всех протестированных играх оказалась выше, чем у AMD R9 290X. Особенно порадовал отменный разгонный потенциал. Видеопроцессор стабильно функционировал на частоте 1270 МГц. Это очень высокий показатель, который встречается редко. Стоит отметить, что разгонялась карта на стоковой системе охлаждения и номинальном напряжении. В свете этого очень хочется увидеть что-то вроде ASUS GTX 780 Ti DirectCU II TOP. Вполне вероятно, что такой видеокарте сможет покориться частота в 1350-1400 МГц.

    Несколько удивил объем видеопамяти – всего три гигабайта. Хотя стоит признать, что даже в разрешении UltraHD (4K), этого объема должно хватать на все современные игры.

    Видеокарта оказалась очень холодной и совершенно бесшумной, что вдвойне приятно. Даже FurMark не смог прогреть карту выше 84 градусов в разгоне.

    Все это наталкивает на мысли, что скоро нам покажут еще одну модификацию видеокарты GTX 780 Ti, тактовая частота которой будет под гигагерц, объем памяти будет 6-12 гигабайт и функционировать память будет на 7500-8000 МГц. Если такая видеокарта увидит свет, то мы даже боимся представить, сколько с нас за неё попросят. Ведь обычная GTX 780 Ti стоит сегодня в магазинах Москвы от 24 000 рублей.

    Видеокарта получает награду выбор редакции.

    В принципе, перемаркировка старых SKU — не зазорное дело, коль скоро цены неуклонно идут вниз. Скажем, пресловутые Radeon R9 280X и GeForce GTX 770 сейчас стоят на добрых $200-250 меньше, чем их предшественники. Проблема в том, что по-настоящему новые и более производительные графические чипы, которым предназначена освободившаяся ценовая ниша в сегменте High-End, пришлось также выпустить, не дожидаясь заветного дня, когда TSMC запустит процесс фотолитографии по норме 20 нм.

    Как для AMD, так и для NVIDIA нелегкой задачей стало впихнуть GPU, которые, согласно закону Мура, должны включать вдвое больше транзисторов, чем чипы, выпущенные двумя годами ранее, в те же самые круглые цветные пластины, произведенные по норме 28 нм. GeForce GTX TITAN на долгожданном чипе GK110 дал почувствовать вкус будущего только тем, кто был готов отдать за него круглую сумму в $1 000, и даже GeForce GTX 780 , будучи «облегченной» разновидностью GTX TITAN, изначально не вписался в цену $499-549, стандартную для топовых дискретных видеоадаптеров, и установил новую планку в $650 (впрочем, теперь уже $499).

    В результате того, что в GeForce GTX 780 Ti вернулись три из пятнадцати крупных строительных блоков архитектуры Kepler — потоковых мультипроцессоров, новый флагман имеет на 20% большую производительность в части выполнения шейдерных инструкций и текстурирования.

    Столь же важно и другое: NVIDIA перенесла на GTX 780 Ti эксклюзивное достижение GeForce GTX 770 — поддержку видеопамяти с частотой 7 ГГц, что способствует увеличению пропускной способности на 14 %.

    Таким образом, GTX 780 Ti во всех отношениях превосходит не только GTX 780, но и GTX TITAN. Единственное достоинство TITAN по сравнению с новинкой (помимо 6 Гбайт памяти) — это разблокированные ядра CUDA двойной точности (FP64), количество которых с ядрами FP32 в GK110 соотносится как 1 к 3. Стало быть, TITAN может потенциально выполнять расчеты двойной точности в compute-приложениях на скорости 1/3 от FP32, а GeForce GTX 780 Ti ограничен унылой планкой 1/24.

    GTX 770 GeForce GTX 780 GeForce GTX TITAN GeForce GTX 780 Ti GeForce GTX 690
    Основные компоненты
    GPU GK104 GK110 GK110 GK110 GK104
    Число транзисторов 3 540 млн 7,1 млрд 7,1 млрд 7,1 млрд 2x3540 млн
    Техпроцесс, нм 28 28 28 28 28
    Тактовая частота GPU, МГц: Base Clock / Boost Clock 1046/1085 863/900 836/876 875/928 915/1019
    Потоковые процессоры 1536 2304 2688 2880 2x1536
    Текстурные блоки 128 192 224 240 2x128
    ROPs 32 48 48 48 2x32
    Видеопамять: тип, объем, Мбайт GDDR5, 2048 GDDR5, 3072 GDDR5, 6144 GDDR5, 3072 GDDR5, 2x2048
    Тактовая частота памяти: реальная (эффективная), МГц 1753 (7010) 1502 (6008) 1502 (6008) 1750 (7000) 1502 (6008)
    Разрядность шины памяти, бит 256 384 384 384 2x256
    Интерфейс PCI-Express 3.0 x16
    Вывод изображения
    Интерфейсы 1 х DL DVI-I,
    1 x DL DVI-D,
    1 x HDMI 1.4a,
    1 x DisplayPort 1.2
    2 х DL DVI-I,
    1 x DL DVI-D,
    1 x Mini DisplayPort 1.2
    Макс. разрешение VGA: 2048x1536,
    DVI: 2560x1600,
    HDMI: 4096х2160,
    DP: 4096x2160
    Макс. потребляемая мощность, Вт 230 250 250 250 300
    Средняя розничная цена, руб. Нет данных Нет данных Нет данных Нет данных Нет данных

    Ну а теперь сравним новинку с главным соперником — Radeon R9 290X. Примем в качестве исходных данных, что видеокарта AMD работает на частоте GPU 1000 МГц, а GTX 780 Ti — на своей средней Boost Clock (928 МГц). Это реалистичные условия, ведь для Radeon R9 290X при хорошем охлаждении вполне реально удержаться на частоте 1 ГГц без «троттлинга», да и Boost Clock графических процессоров NVIDIA вполне справедливо отражает среднюю частоту, на которой GPU работает под нагрузкой.

    • В таком случаетеоретическая производительность шейдерного массива GTX 780 Ti ненамного, но все-таки ниже, чем у соперника: 5345 против 5632 FGLOPS (около 5%).
    • Зато текстурных блоков в процессоре GTX 780 Ti куда больше — 240 против 176.Это означает, что фильтрация текстур — опять-таки с поправкой на разные частоты — на GK110 происходит на 21% быстрее, чем у AMD.
    • Hawaii по-прежнему имеет на четверть больше ROP — 64 против 48, что наверняка скажется не в пользу видеокарты NVIDIA в тестах при высоком разрешении: мультимониторные конфигурации, 4К-дисплеи. Даже в 2560х1440 эффект в какой-то степени должен проявиться.
    • NVIDIA и AMD разным способом увеличили пропускную способность видеопамяти: 512-битная шина и тактовая частота 5 ГГц у Radeon R9 290X либо 384 бита и 7 ГГц у GeForce GTX 780 Ti. По результирующей пропускной способности данные примерно одинаковые — с перевесом около 5% в пользу GTX 780 Ti (336 и 320 Гбайт/с соответственно).
    • По части обработки геометрии на стороне GeForce GTX 780 Ti превосходит соперника с большим перевесом. Поскольку каждый из 15 потоковых мультипроцессоров (SMX) в составе чипа имеет свой блок Polymorph Engine, способный выдавать по одному полигону в течение двух тактов, совокупная производительность всего ядра GK110 составляет 7,5 геометрических примитивов за такт. У Radeon R9 290X — всего лишь четыре.
    • AMD Radeon R9 290 и R9 290X умеют выполнять расчеты FP64 на скорости 1/8 от FP32. GeForce GTX 780 Ti, как отмечено выше, намеренно ограничен соотношением 1/24.

    В сухом остатке преимущество полностью функционального GPU GK110 перед AMD Hawaii состоит в а) намного более высокой скорости выборки текстур (за счет 240 блоков фильтрации), которая, наряду с шейдерной производительностью, остается главным бутылочным горлышком GPU в современных играх; б) обработке геометрии, что, к примеру, важно в сценах, нагруженных тесселяцией. Сила Radeon R9 290X — в числе ROP (высокие разрешения и антиалиасинг методом SSAA, который нынче опять вошел в моду), а шейдерная производительность, по грубым оценкам, не хуже, чем у соперника. То есть, несмотря на то, что GK110 включает на миллиард больше транзисторов, чем Hawaii, избиения младенцев в бенчмарках все-таки не произойдет.

    Остался только один вопрос, который мы обошли вниманием в обзорах Radeon R9 290 и R9 290X, — объем видеопамяти. AMD оснащает свои флагманы 4 Гбайт кадрового буфера, в то время как GeForce GTX 780 Ti довольствуется 3 Гбайт. Пока рано говорить о том, что такого объема недостаточно, но вот, к примеру, для Battlefield 4 3 Гбайт уже являются рекомендацией.

    ⇡ Цены

    Как бы то ни было, цена, которую NVIDIA установила на GeForce GTX 780 Ti, говорит о том, что производитель полностью уверен в безоговорочном превосходстве своего детища над конкурентом от AMD. Выпустив базовую версию GeForce GTX 780 за $640, NVIDIA уже освоилась в пространстве выше привычной планки в $549 для топовых геймерских видеокарт, но GTX 780 Ti продвинулся еще дальше. Рекомендуемая розничная цена для рынка США составляет $699, что на $150 выше планки Radeon R9 290X. Для России рекомендована цена в 24 990 рублей. Впрочем, сколько-нибудь показательное сравнение цен по прайс-листам в российских интернет-магазинах будет возможным лишь после того, как на наш рынок потекут крупные поставки обеих новинок. К примеру, на момент написания статьи в Москве было только одно предложение Radeon R9 290X, да и то — почти за 25 тысяч. Так что пока для простоты и надежности продолжим мыслить в американских ценах.

    ⇡ G-SYNC

    Уделим немного внимания последней инициативе NVIDIA, которая не связана прямо с новым флагманским видеоадаптером, но интересна сама по себе. Известно, что зеленая компания с недавних пор ведет крестовый поход во имя плавного изображения. Именно NVIDIA представила методику FCAT, которая выявила нашумевшие проблемы AMD CrossFire с равномерностью времени подготовки кадров. Ранее для всех видеокарт на архитектуре Kepler было представлено любопытное решение - Adaptive V-Sync, которое просто-напросто включает вертикальную синхронизацию, если частота смены кадров в буфере видеокарты не меньше 60, и отключает, если фреймрейт падает ниже. G-SYNC является еще одним оригинальным подходом к вертикальной синхронизации, который на этот раз требует в определенных моментах переделать сам протокол коммуникации GPU и монитора.

    Но для начала обозначим проблему, которую призвана решить вертикальная синхронизация как таковая, и почему большинство геймеров привыкли ее игнорировать либо считать каким-то неизбежным недостатком компьютерной графики - разрывы экрана.

    Такое возникает, когда монитор считывает изображение из кадрового буфера, одновременно с чем GPU заканчивает рендеринг следующего кадра и буферы (которых на самом деле два) меняются местами. В результате та часть строк на экране, которую монитор начал «рисовать» после смены буферов, принадлежит уже другому кадру. Осюда и разрыв, который, по логике, может быть и множественным, если разница между частотой смены кадров и частотой обновления экрана достаточно велика.

    Суть вертикальной синхронизации в том, что смена буферов запрещается до того момента, когда монитор завершит цикл обновления картинки. Как следствие, в то время, когда выводится на экран содержимое одного буфера (называемого Front Buffer), в другой буфер (Back Buffer) может быть записан только один следующий кадр. В то же время в системе без V-Sync, при условии, что GPU имеет большой запас производительности, буферы могли поменяться местами несколько раз, что привело бы к пресловутому разрыву, зато задержка ввода (input lag) была бы меньше. Но это меньшая из двух издержек вертикальной синхронизации, которую с лихвой перекрывает другой эффект.

    Монитор запрашивает кадр из памяти графического адаптера с регулярной частотой (допустим, 60 Гц). Представим идеальную ситуацию, когда GPU также рендерит кадры с частотой 60 FPS. Тогда каждый из отрисованных кадров демонстрируется на мониторе один раз. Но стоит одному кадру хоть немного опоздать к очередному циклу обновления монитора, и вот уже предшествующий кадр пользователь увидел дважды, что воспринимается как микроторможение (и одновременно - задержка ввода). В реальных же играх, когда частота смены кадров колеблется, такое событие происходит гораздо чаще, а долговременная падение ниже 60 FPS приводит к тому, что фактическая частота смены кадров на экране составляет 30 FPS, иследующий шаг - 15 FPS. По этой причине большинство геймеров брезгует V-Sync, смирившись с мерзкими разрывами.

    G-SYNC представляет собой абсолютно радикальное решение - заставить монитор обновлять экран с произвольным интервалом путем модификации протокола DisplayPort. Тогда, если следующий кадр еще не готов, но вот-вот рендеринг завершится, то монитор сможет в определенных пределах задержать цикл обновления вместо того, чтобы продублировать предшествующий кадр.

    Для поддержки G-SYNC в монитор нужно установить специальный модуль, который несет на плате некий чип с логикой и три микросхемы DRAM общей емкостью 768 Мбайт. Пока что разъем под такой модуль есть лишь в одной модели - ASUS VG248QE, а саму плату NVIDIA начнет продавать до конца этого года. После рождества станут доступны варианты ASUS VG248QE с предустановленным модулем и некоторое количество мониторов от других производителей, поддерживающих G-SYNC нативно.

    ShadowPlay

    Незадолго до запуска GeForce GTX 780 Ti в статус работающей бета-версии вошла еще одна из эксклюзивных технологий NVIDIA, с помощью которых компания стремится дифференцировать свои продукты от конкурирующих предложений. ShadowPlay использует возможности встроенного в GPU семейства Kepler кодировщика H.264 (NVENC) для записи видеоряда из игр. У ShadowPlay есть две функции - во-первых, запись ролика по требованию, как это делается при помощи FRAPS или других чисто программных решений. А во вторых, ShadowPlay может просто непрерывно захватывать в фоновом режиме и удерживать в памяти последние 20 минут игрового процесса, которые по нажатию горячей клавиши сохраняются в файл-контейнер MP4.

    Доступ к настройкам ShadowPlay открывается через утилиту GeForce Experience, которая уже является частью пакета драйверов для графических карт NVIDIA. Меню содержит настройку качества, которая задает битрейт будущего видеоролика. Доступны варианты 16, 23 или 52 Мбит/с. Видео пока что записывается только в одном разрешении - 1080p — и с частотой 60 кадров в секунду. Независимо от того, в каком разрешении на самом деле идет игра, итоговый продукт будет отмасштабирован до этих параметров. Надеемся, что в финальной версии ShadowPlay появится выбор разрешений, по меньшей мере, ниже, чем 1080p, а еще лучше - вплоть до 2560х1600 без масштабирования. Но пока что есть, то есть.

    Вся соль идеи ShadowPlay в том, что работа утилиты одновременно с игрой мало влияет на игровую производительность. Отчасти это заслуга аппаратного кодировщика H.264, но есть и другая причина: «железо» Kepler предоставляет возможность напрямую считывать содержимое кадрового буфера, которая в первую очередь была нужна NVIDIA для потоковой трансляции игр в облачной платформе GeForce GRID, но в результате нашла и вот такое вполне локальное применение. Впрочем, нельзя сказать, что постоянная фоновая запись видео в буфер при включенной ShadowPlay дается полностью бесплатно.

    В трех играх из нашей тестовой обоймы при захвате изображения с максимальным битрейтом частота смены кадров снижается на 7-8% от исходного уровня. И все же это сущие пустяки по сравнению с тем, что происходит при записи игрового процесса чисто программными методами, не говоря уже о молниеносном расходе места в ПЗУ, когда продукт сохраняется в «сыром» формате. В целом использование для этой цели кодировщика, которым сегодня обладают все дискретные GPU, выглядит настолькой очевидной и простой идеей, что возникает вопрос, почему какое-либо подобие ShadowPlay не возникло еще гораздо раньше.

    ⇡ Конструкция

    Система охлаждения GeForce GTX 780 Ti в общих чертах не отличается от тех конструкций, которые установлены на базовую версию GTX 780 и GTX TITAN. Отсутствие изменений в данном случае полностью оправданно, ведь этот кулера представляет собой практически эталонный образчик «турбинки» (или blower’а) - высокоэффективной и в то же время тихой. Ну и, помимо практических достоинств, увесистую видеокарту в цельнометаллическом кожухе просто приятно взять в руки.

    На торце корпуса, где расположены разъемы SLI, вырезан логотип GeForce GTX, подсвеченный яркой зеленью.

    Впрочем, по одному признаку кулер GeForce GTX 780 Ti отличается от предшествующих реализаций: радиатор GPU, видимый через пластиковое оконце, покрашен в вороной цвет, за счет чего устройство выглядит более строго.

    Кстати, этот радиатор более компактный по сравнению с тем, что мы недавно увидели в составе Radeon R9 290/290X, но так же имеет в основании испарительную камеру. Радиатором для микросхем памяти и MOSFET’ов системы питания служит массивная металлическая рама из литого алюминия.

    Дизайн планки с разъемами остался прежним. Решетка «выхлопа» системы охлаждения делит пространство одного слота с неуклюжим портом DVI-D. Помимо него, плата несет выходы DVI-I, полноразмерные версии HDMI и DisplayPort.

    ⇡ Плата

    Графический процессор GK100, распаянный на плате GeForce GTX 780 Ti, не только является полностью разблокированным чипом, но и принадлежит к версии «кремния» B1, в которой производитель исправил некоторые мелкие ошибки и чуть-чуть уменьшил утечки тока.

    Спецификациям карты соответствуют микросхемы памяти SK Hynix с маркировкой H5GQ2H24AFR-R2C, которые выдают штатную эффективную частоту 7 ГГц. Чипы сосредоточены только на лицевой поверхности PCB, но сзади платы в зеркальных позициях размечены площадки под второй массив микросхем.

    Сама печатная плата на первый взгляд точно такая же, как и у GeForce GTX TITAN и GTX 780, но все же и здесь есть некоторые отличия. NVIDIA поменяла часть элементов в системе питания на другие аналоги - наверняка не спроста. В целом видеоадаптер по-прежнему обслуживается по схеме 6+2+1 (число фаз для GPU, чипов памяти и PLL). Напряжением на процессоре управляет все тот же ШИМ-контроллер ON Semiconductor NCP 4206.

    NVIDIA также сообщила о новой функции системы питания GTX 780 Ti, незаметной при визуальном осмотре платы, - балансировке тока на трех источниках, коими являются шести- и восьмиконтактный разъемы дополнительного питания вместе со слотом PCI-Express. Задача дополнительной автоматики - следить, чтобы при разгоне не возникала такая ситуация, когда одна из шин питания нагружена по максимуму, а другие две «отдыхают».

    ⇡ Методика тестирования

    Конфигурация тестовых стендов
    CPU Intel Core i7-3960X @ 4,6 ГГц (100x46) Intel Core i7-3970X @ 4,6 ГГц (100x46)
    Материнская плата ASUS P9X79 Pro
    Оперативная память DDR3 Kingston HyperX 4x2 Гбайт @ 1600 МГц, 9-9-9
    ПЗУ Intel SSD 520 240 Гбайт
    Блок питания Corsair AX1200i, 1200 Вт Seasonic Platinum-1000, 1000 Вт
    Охлаждение CPU Thermalright Archon
    Корпус CoolerMaster Test Bench V1.0
    Операционная система Windows 7 Ultimate X64 Service Pack 1
    ПО для карт AMD AMD Catalyst 13.11 Beta
    v8 (для Radeon R9 290); v5 (для остальных)
    + Catalyst Application Profiles 13.5 CAP1
    ПО для карт NVIDIA 331.70 (для GeForce GTX 780)
    331.58 WHQL (для остальных)

    Для измерения мощности системы используется стенд с блоком питания Corsair AX1200i. Энергосберегающие технологии CPU во всех тестах отключены. Шина PCI-Express работает в режиме 3.0. Для активации PCI-E 3.0 на видеокартах серий GeForce 600 и 700 в системе на чипсете X79 применяется патч от NVIDIA.

    В настройках драйвера NVIDIA всегда в качестве процессора для вычисления PhysX выбирается CPU. В настройках AMD всегда настройка Tesselation переводится из состояния AMD Optimized в Use application settings.

    Набор бенчмарков
    Программа API Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
    3DMark 2011 DirectX 11 Профиль Extreme - -
    3DMark DirectX 11 Тест Fire Strike (не Extreme) - -
    Unigine Heaven 2 DirectX 11 DirectX 11, макс. качество, тесселяция в режиме Extreme AF 16x, MSAA 4x 1920х1080 / 2560х1440
    Crysis Warhead + Framebuffer Crysis Warhead Benchmarking Tool DirectX 10 DirectX 10, макс. качество. Демо Frost Flythrough AF 16x, MSAA 4x 1920х1080 / 2560х1440
    Battlefield 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Going Hunting AF 16x, MSAA 4x + FXAA 1920х1080 / 2560х1440
    Batman: Arkham City. Встроенный бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 1920х1080 / 2560х1440
    DiRT Showdown . Встроенный бенчмарк DirectX 11 Макс. качество, Global Illumination вкл. Трасса Shibuya, 8 машин AF, AA 4х 1920х1080 / 2560х1440
    Far Cry 3 + FRAPS DirectX 11 DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost AF, MSAA 4x 1920х1080 / 2560х1440
    Tomb Raider. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920х1080 / 2560х1440
    Bioshock Infinite. Встроенный бенчмарк DirectX 11 Макс. качество. Postprocessing: normal AF 16x, FXAA 1920х1080 / 2560х1440
    Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Post Human AF 16x, MSAA 4x 1920х1080 / 2560х1440
    Metro: Last Light. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 1920х1080 / 2560х1440

    ⇡ Участники тестирования

    В тестировании производительности приняли участие следующие видеокарты:

    ⇡ Разгон, температура, энергопотребление

    В штатном режиме GeForce GTX 780 Ti удерживает достаточно высокие тактовые частоты под нагрузкой. Во время тестового прогона Crysis 3 GPU работал на частоте 1006—1020 МГц (ненамного больше, чем у GTX 780 и GTX TITAN) с редкими проседаниями до 993 МГц. При этом максимальное напряжение на GPU составляло 1,187 В, в то время как GTX 780 и GTX TITAN довольствуются 1,162 В.

    Если сравнивать GTX 780 Ti с Radeon R9 290X, то выходит, что обе видеокарты (при условии, что R9 290X работает в Uber Mode с более высокой скоростью вращения вентилятора) под нагрузкой стабильно держат частоту в районе 1 ГГц.

    Вот только процессор GK110 при этом сохраняет температуру в пределах 83 °C и турбинка его системы охлаждения раскручивается до 2336 об/мин, а Hawaii разогревается до 93 °C, в то время как кулер вращается на скорости 2727 об/мин.

    Забавно, но, если судить по тесту в Crysis 3, GeForce GTX 780 Ti в пиковом энергопотреблении немного превосходит Radeon R9 290X, да и системы охлаждения у соперников на вид одинаковы по мощности, но R9 290X явно испытывает трудности с теплоотводом. Возможно, причина в разной площади кристаллов GK110 и Hawaii: у первого — 533 мм 2 , а у второго — 455 мм 2 , отсюда и разная плотность теплового потока.

    Кроме того, нельзя не отметить, что система охлаждения GTX 780 Ti хороша не только изысканным дизайном и светящейся надписью, но и отличными акустическими характеристиками. Даже при скорости 4261 об/мин, что является максимумом для крыльчатки, шум нельзя сравнить с ревом штатного охладителя Radeon R9 290X на таких же оборотах. Кроме того, спектр шума у NVIDIA более мягкий и приятный слуху.

    По оверклокерским возможностям GeForce GTX 780 Ti уступает «ванильной» разновидности GTX 780, что вполне ожидаемо, если учесть дополнительное тепловыделение от трех ранее дремавших SMX и повышенное напряжение на GPU. К тому же у нового флагмана мизерный запас по TDP — его можно увеличить лишь на 6%. На всякий случай включив вентилятор на полные обороты, чтобы температура не влияла на динамику частоты, и отдав приоритет температуре в EVGA Precision, мы смогли увеличить базовую частоту до 986 МГц, а максимальное зарегистрированное значение выросло до 1130 МГц. Частота под нагрузкой достаточно стабильна — в ходе теста в Crysis 3 она не опускалась ниже 1111 МГц.

    Если судить по состоянию индикаторов Power/Voltage/OV/Utilization Limit, которыми NVIDIA снабдила видеокарты с технологией GPU Boost 2.0, препятствием на пути разгона видеокарты становится лимит энергопотребления и одновременно — напряжение питания GPU. Попытки покрутить опцию Overvoltage попросту ни к чему не привели: заданного подъема напряжения на 75 мВ на графиках не зарегистрировано.

    Base Clock, МГц Макс. Boost Clock, МГц Base Clock, МГц (разгон) Макс. зарегистрированная Boost Clock,
    МГц (разгон)
    GeForce GTX 780 Ti 876 1020 (+144) 986 1130 (+144)
    GeForce GTX TITAN 836 1006 (+145) 966 1150 (+184)
    GeForce GTX 780 863 1006 (+143) 1053 1215 (+162)

    Производительность: синтетические тесты

    • В этом тесте GeForce GTX 780 Ti предсказуемо быстрее всех однопроцессорных видеокарт, а по параметру 3DMark Score даже превосходит GeForce GTX 690.

    • А вот в более свежей версии бенчмарка результаты GeForce GTX 780 Ti поразительно точно совпадают с тем, чего достиг Radeon R9 290X.
    • И вновь GTX 780 Ti набрал больший итоговый балл, чем у GTX 690.

    Unigine Heaven 2

    • GTX 780 Ti наступает на пятки обеим видеокартам на базе двух GPU.
    • Разница между GTX 780 Ti и Radeon R9 290X весьма велика. Спасибо быстрой обработке геометрии, которая, как ничто иное, важна в этом тесте, богатом аппаратной тессляцией.

    Crysis 3

    • Из двух видеокарт - GeForce GTX 780 Ti и Radeon R9 290X — первый быстрее, и намного.
    • Фактически GTX 780 Ti подбирается к позициям Radeon HD 7990.

    Metro: Last Light

    • Radeon R9 290X держится уверенно, уступая сопернику не более 1 FPS.
    • Сам GeForce GTX 780 Ti практически равен GeForce GTX 690.

    ⇡ Производительность: разгон

    Оверклокинг GeForce GTX 780 Ti ощутимо влияет на очки в синтетических тестах 3DMark, но в играх повышение частоты большого значения не имеет. Как ни крути, а разгон GPU NVIDIA с технологией GPU Boost - не очень плодотворное занятие. Тем более что GTX 780 Ti сильно ограничен рамками TDP и не дает возможности повысить напряжение питания, как следствие - повышение частоты было не таким большим, как в случае с GeForce GTX 780 в базовой версии.

    ⇡ Игровые тесты + Unigine Heaven 2

    ⇡ Выводы

    В диапазоне цен от $400 до $550, который обычно занимают игровые видеокарты для энтузиастов, AMD сегодня сильна как никогда. Фактически впервые в истории противостояния двух главных производителей дискретных GPU видеоадаптеры AMD не только не уступают конкурентам равной стоимости, которые предлагает NVIDIA, но даже заметно превосходят их по производительности. Но у NVIDIA в запасе было секретное оружие — полностью разблокированный графический процессор GK110. Пускай GeForce GTX 780 невозможно сделать настолько дешевым, чтобы он мог предоставить такую же производительность по цене $400 (сколько стоит Radeon R9 290), зато «зеленые» в состоянии создать видеокарту, гораздо более дорогую, чем Radeon R9 290X, но при этом она безоговорочно превосходит последнего по производительности.

    Просто у GK110 изначально был запас масштабирования вплоть до тех высот, которые продемонстрировал сегодня GeForce GTX 780 Ti, а GPU Hawaii в составе Radeon R9 290X уже полностью проявил свой потенциал. Во-первых, конечно же, GK110 включает на миллиард больше транзисторов по сравнению с Hawaii. Но, что не менее важно, NVIDIA по-другому распорядилась этим бюджетом. AMD вложилась в большое количество ROP, что делает R9 290X более приспособленным к играм в 4K-разрешении, но NVIDIA сделала акцент на блоках фильтрации текстур. Преимущество в обработке геометрии также вновь на стороне топового GPU NVIDIA. Как показывают тесты, в разрешении вплоть до 2560х1440 последние параметры все еще более важны, чем скорость заполнения пикселов.

    Любопытно, что GTX 780 Ti и Radeon R9 290X очень близки по тактовым частотам GPU и, судя по всему, обладают примерно одинаковым энергопотреблением (как минимум 280-290 Вт), что само по себе говорит в пользу NVIDIA, ибо GK110 — более сложный и высокопроизводительный чип, чем Hawaii. Но при всем этом видеокарта NVIDIA еще и нагревается меньше. Нельзя не похвалить референсный кулер, который GTX 780 Ti унаследовал от своих предшественников, но дело явно не только в системе охлаждения. Похоже, что GK110 сам по себе более эффективно отдает тепло.

    Впрочем, если судить с чисто практических позиций, то GeForce GTX 780 Ti и Radeon R9 290X не являются прямыми конкурентами в силу разницы по ценам в $150. Новый флагман NVIDIA, как и базовая версия GTX 780 ранее, оказался единственным представителем собственной ценовой категории для энтузиастов, которые готовы отдать дополнительные деньги сверх привычных $500-550, составляющих цену видеокарты класса High-End. В таком качестве ему вряд ли появится альтернатива вплоть до того, как производство GPU освоит техпроцесс 20 нм.

    Напоследок замолвим слово о GeForce GTX TITAN, которая до сего момента считалась самой производительной однопроцессорной видеокартой NVIDIA. После выхода GeForce GTX 780 Ti ее продолжат продавать, и даже о снижении цены не было никаких официальных заявлений. По всей видимости, TITAN по-прежнему будет стоит $1 000, но теперь его преподносят как «просьюмерский» видеоадаптер с возможностью выполнять неграфические вычисления двойной точности на скорости 1/3 от FP32. По сути, некий аналог Quadro K6000 для не-профи. Ценность TITAN как игровой видеокарты после выхода GeForce GTX 780 Ti уже окончательно уничтожена.

    • Часть 2 — Практическое знакомство
    • Часть 3 — Результаты игровых тестов (производительность)

    В этой части мы изучим видеокарту, а также познакомимся с результатами синтетических тестов. В нашей лаборатории побывала референсная карта Nvidia.

    Платa

    • GPU: Geforce Titan (GK110)
    • Интерфейс: PCI Express x16
    • Частота работы GPU (ROPs): 875—1020 МГц (номинал — 875—1020 МГц)
    • Частота работы памяти (физическая (эффективная)): 1750 (7000) МГц (номинал — 1750 (7000) МГц)
    • Ширина шины обмена с памятью: 384 бит
    • Число вычислительных блоков в GPU/частота работы блоков: 15/875—1020 МГц (номинал — 15/875—1020 МГц)
    • Число операций (ALU) в блоке: 192
    • Суммарное число операций (ALU): 2880
    • Число блоков текстурирования: 240 (BLF/TLF/ANIS)
    • Число блоков растеризации (ROP): 48
    • Размеры: 270×100×37 мм (карта занимает 2 слота в системном блоке)
    • Цвет текстолита: черный
    • Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»): 264/86/70 Вт
    • Выходные гнезда: 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/VGA), 1×HDMI 1.4a, 1×DisplayPort 1.2
    • Поддержка многопроцессорной работы: SLI (Hardware)

    Nvidia Geforce GTX 780 Ti 3072 МБ 384-битной GDDR5 PCI-E

    Карта имеет 3072 МБ памяти GDDR5 SDRAM, размещенной в 12 микросхемах на лицевой стороне PCB.

    Карта требует дополнительного питания в виде двух разъемов: 8- и 6-контактного.

    О системе охлаждения.

    Nvidia Geforce GTX 780 Ti 3072 МБ 384-битной GDDR5 PCI-E

    Система охлаждения полностью повторяет эталонный кулер от GTX Titan. Кулер имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где пары конденсируются и т. д. Мы уже не раз рассказывали о такой схеме современного охлаждения топовых ускорителей.

    Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, дающую пониженный уровень шума. Должны сказать, что при максимальной нагрузке шум все же слегка ощущается, ведь максимальная частота вращения — выше 2200 оборотов в минуту.

    Микросхемы памяти охлаждаются центральным радиатором (у кулера есть специальная пластина, прижимающаяся к микросхемам памяти и транзисторам силового блока).

    Мы провели исследование температурного режима с помощью новой версии 4.2.1 утилиты EVGA PrecisionX (автор А. Николайчук AKA Unwinder) и получили следующие результаты.

    После 6 часов прогона карты под максимальной игровой нагрузкой максимальная температура ядра составила 84 градуса, что для такого мощного ускорителя более чем нормально.

    Комплектация. Референс-карта прибыла к нам в ОЕМ-упаковке, поэтому комплекта нет.

    Установка и драйверы

    Конфигурация тестового стенда:

    • Компьютеры на базе процессора Intel Core i7-3960X (Socket 2011):
      • 2 процессора Intel Core i7-3960X (o/c 4 ГГц);
      • СО Hydro SeriesT H100i Extreme Performance CPU Cooler;
      • СО Intel Thermal Solution RTS2011LC;
      • системная плата Asus Sabertooth X79 на чипсете Intel X79;
      • системная плата MSI X79A-GD45(8D) на чипсете Intel X79;
      • оперативная память 16 ГБ DDR3 Corsair Vengeance CMZ16GX3M4A1600C9 1600 МГц;
      • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
      • жесткий диск WD Caviar Blue WD10EZEX 1 TБ SATA2;
      • 2 SSD Corsair Neutron SSD CSSD-N120GB3-BK;
      • 2 блока питания Corsair CMPSU-1200AXEU (1200 Вт);
      • корпус Corsair Obsidian 800D Full Tower.
    • операционная система Windows 7 64-битная; DirectX 11;
    • монитор Dell UltraSharp U3011 (30″);
    • монитор Asus ProArt PA249Q (24″);
    • драйверы AMD версии Catalyst 13.11beta8; Nvidia версии 331.70(для GTX 780 Ti) / 331/58 (для остальных Geforce)

    VSync отключен.

    Синтетические тесты

    Используемые нами пакеты синтетических тестов можно скачать здесь:

    • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
    • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
    • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

    В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11.

    Синтетические тесты проводились на следующих видеокартах:

    • Geforce GTX 780 Ti GTX 780 Ti )
    • Geforce GTX Titan со стандартными параметрами (далее GTX Titan )
    • Geforce GTX 780 со стандартными параметрами (далее GTX 780 )
    • Radeon R9 290X со стандартными параметрами в режиме «Uber Mode» (далее R9 290X )
    • Radeon HD 7990 со стандартными параметрами (далее HD 7990 )

    Для анализа результатов новой видеокарты высшего класса Geforce GTX 780 Ti были выбраны именно эти решения по следующим причинам. Geforce GTX Titan является эксклюзивной моделью на базе того же чипа GK110, обладает большим объемом видеопамяти и продается намного дороже. Titan — прежде мощнейшее одночиповое решение компании Nvidia, и будет интересно посмотреть, насколько быстрее получилась новинка. Сравнение с Geforce GTX 780 будет интересно потому, что это менее дорогая видеокарта компании, основанная на таком же чипе, но имеющем на четверть меньше активных исполнительных блоков.

    От конкурирующей компании AMD для нашего сравнения были выбраны две видеоплаты, основанные на разных графических процессорах и даже разном их количестве. Radeon R9 290X на время выхода новинки Nvidia является ее ближайшим конкурентом по цене, а заодно и самой производительной видеоплатой компании AMD. А Radeon HD 7990 имеет сразу два видеочипа Tahiti и не является конкурентом для GTX 780 Ti, но нам будет интересно посмотреть, как скорость такого мощного двухчипового решения соотносится с лучшим одночиповым в исполнении Nvidia.

    Direct3D 9: тесты Pixel Shaders

    Тесты текстурирования и заполнения (филлрейта) из пакета 3DMark Vantage мы рассмотрим чуть позже, а первая группа пиксельных шейдеров, которую мы используем, включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся разве что в старых играх, очень простых для современных видеочипов.

    С простейшими тестами современные GPU справляются с легкостью, скорость мощных решений в них всегда упирается в различные ограничители, что особенно относится к Geforce. Эти тесты не способны показать возможности современных видеочипов и интересны лишь с точки зрения устаревших игровых приложений. Производительность современных видеокарт в них зачастую ограничена скоростью текстурирования или филлрейта, а видеокарты Nvidia давно перестали оптимизироваться для таких задач, что отлично показывают результаты сегодняшнего сравнения.

    Посмотрите, все платы Geforce слабо отличаются по скорости друг от друга, разница между GTX 780 Ti и Titan составляет лишь 1—4% при гораздо большей теоретической. Вышедшая сегодня новая модель видеокарты в этом сравнении хоть и оказывается лучшей среди плат Nvidia, но явно уступает главному конкуренту в лице Radeon R9 290X, которая всегда оказывается заметно впереди. Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

    Тест Cook-Torrance более интенсивен вычислительно, и скорость в нем больше зависит от количества ALU и их частоты, но также и от скорости TMU. Этот тест исторически лучше подходит для графических решений компании AMD, хотя новые топовые платы Geforce на базе архитектуры Kepler в нем также показывают сильные результаты, что мы и видим по неплохим в целом цифрам новой Geforce GTX 780 Ti.

    Самая мощная плата из семейства Geforce GTX 700 оказалась быстрее эксклюзивной GTX Titan на 5—6%, что также меньше, чем теоретическая разница, и может быть объяснено разве что упором в производительность блоков ROP. Своего главного конкурента новинка компании Nvidia в одном из тестов слегка обходит — в тесте Water, где важнее скорость текстурирования, я не математическая производительность, по которой у плат AMD есть некоторое преимущество. Поэтому во втором тесте результаты Geforce GTX 780 Ti немного ниже, чем у Radeon R9 290X. В среднем же в этих тестах явный паритет.

    Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

    Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

    • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье « ».
    • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

    Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

    Это универсальные тесты, производительность в которых зависит и от скорости блоков ALU, и от скорости текстурирования, также в них важен общий баланс чипа и эффективность исполнения вычислительных программ. Прошлые наши исследования показывают, что в этих конкретных задачах архитектура GCN от AMD выступает значительно лучше графической архитектуры Nvidia Kepler, так получилось и в этот раз.

    В тесте «Frozen Glass» скорость больше зависит от математической производительности, и в случае всех плат Geforce всегда есть некая преграда, из-за которой платы Nvidia проигрывают почти вдвое почти лучшей одночиповой Radeon. Модель Geforce GTX 780 Ti оказывается лишь на 1% быстрее GTX Titan, что лишь подтверждает странный упор производительности для всех Geforce.

    А вот во втором тесте «Parallax Mapping» новая видеокарта Geforce GTX 780 Ti показала производительность на 15% выше, чем у GTX Titan, что уже очень близко к теории. Что касается сравнения с конкурентом, то сопоставление новинки с соперничающей моделью Radeon HD R9 290X не самое радужное — плата AMD быстрее и в этом тесте — почти на треть. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

    В этих условиях положение видеоплат производства компании Nvidia несколько улучшилось, ведь они традиционно справляются с текстурными выборками лучше, чем с математическими вычислениями. Но Radeon R9 290X все равно опережает сегодняшнюю новинку с хорошим запасом, особенно в тесте Frozen Glass, где разница остается неприличной. Новинка на 4—12% быстрее, чем GTX Titan, что более-менее соотносится с теорией. Что касается сравнения с R9 290X, то GTX 780 Ti близка к ней только в тесте Parallax Mapping, да и то разница превышает 20%.

    Впрочем, это были давно устаревшие задачи, с упором в текстурирование, чего почти не встречается в играх. Дальше мы рассмотрим результаты еще двух тестов пиксельных шейдеров, но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9. Они более показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны и включают большое количество ветвлений:

    • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье «Современная терминология 3D-графики ».
    • Fur — процедурный шейдер, визуализирующий мех.

    Эти тесты уже совсем не ограничены производительностью только текстурных выборок или филлрейтом, и скорость в них более всего зависит от эффективности исполнения сложного шейдерного кода. В самых тяжелых DX9-тестах из первой версии пакета RightMark видеокарты производства Nvidia в предыдущие годы были несколько сильнее, но архитектура GCN помогла видеокартам AMD вырваться вперед как минимум в тесте сложного параллакс-маппинга, особенно после тщательной доводки драйверов Catalyst.

    Топовая новинка компании Nvidia показывает в этих задачах очень хороший результат, опережая лучшую из предшественниц на базе того же чипа GK110 на 11%, что близко к теоретическим цифрам разницы в математической производительности. Что касается сравнения с самой мощной топовой видеокартой на базе чипа Hawaii от конкурента, то GTX 780 Ti отстает от нее лишь в тесте параллакс-маппинга. А вот в тесте Fur новая плата Radeon R9 290X всё же проиграла Geforce GTX 780 Ti, хотя и не так уж сильно. В общем, в этих тестах ситуация неоднозначна.

    Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

    Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

    Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

    Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

    Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

    Производительность в этом тесте зависит от количества и эффективности блоков TMU, влияет и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

    В задачах процедурной визуализации меха с большим количеством текстурных выборок за пару поколений графических архитектур компания AMD сократила разницу с платами Nvidia, а с выпуском видеочипов на базе архитектуры GCN и вовсе вырвалась вперед, и теперь именно платы Radeon являются лидерами в этих сравнениях, что говорит о высокой эффективности выполнения ими данных программ.

    Новая топовая плата Geforce GTX 780 Ti опережает эксклюзивную модель GTX Titan на 11—12%, обходя остальные решения Nvidia, что соответствует теории. Но, с учетом того, что в этом тесте даже платы AMD предыдущего поколения быстрее новинок серии Geforce GTX 780, рассматривать сравнение R9 290X и GTX 780 Ti нет смысла — модель компании AMD показывает слишком высокий результат, не говоря уже о двухчиповой карте предыдущего поколения, которая стала тут быстрейшей.

    Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

    Ситуация похожа на ту, что мы видели на предыдущей диаграмме, но видеокарты Nvidia уступают своим соперникам от AMD даже еще чуть больше. Новинка Geforce GTX 780 Ti оказывается быстрее модели GTX Titan также до 11%, что близко к теоретической разнице по математической производительности. К сожалению, проигрыш прямому конкуренту в виде Radeon R9 290X весьма впечатляющий. Снова подтверждается то, что преимущество в подобных вычислениях явно у чипов компании AMD, предпочитающих попиксельные вычисления.

    Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

    Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

    Диаграмма в целом похожа на предыдущую, также без включения SSAA, и в этот раз Geforce GTX 780 Ti опережает модель GTX Titan аж на 16—18%, что даже больше теоретической разницы в скорости ALU. Скорее всего, скорость тут зависит еще и от ПСП видеопамяти. Но так как видеоплаты Nvidia в этом тесте всегда справляются с работой хуже конкурирующих решений от AMD, то модель Geforce GTX 780 Ti в обновленном D3D10-варианте теста без суперсэмплинга снова показывает результат хуже, чем Radeon R9 290X, не говоря уже о двухчиповой HD 7990. Посмотрим, что изменит включение суперсэмплинга:

    Всё снова примерно так же, как и в «Fur» — при включении суперсэмплинга и самозатенения, задача получается еще более тяжелой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась лишь немного, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

    Мы снова видим, что графические решения Radeon в наших D3D10-тестах пиксельных шейдеров работают более эффективно, по сравнению с конкурирующими Geforce, и старшая топовая плата на чипе Hawaii обгоняет анонсированную сегодня Geforce GTX 780 Ti с огромным преимуществом. По сравнению с другими платами Nvidia, новинка показывает лучшую производительность, опережая модель GTX Titan на 10—11%, насколько примерно должна и по теории. Понятно, что GTX 780 отстала еще больше. Посмотрим, что будет в чисто вычислительных задачах.

    Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

    Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

    Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

    Результаты предельных математических тестов обычно лишь примерно соответствуют разнице в частотах и количестве вычислительных блоков, на них влияет разная эффективность их использования в конкретных решениях, также важна и оптимизация драйверов. В случае теста Mineral, новая модель Geforce GTX 780 Ti всего лишь на 8% обгоняет GTX Titan, что явно ниже теоретической разницы по математической производительности между ними. Вероятно, сказывается какое-то ограничение, потому что разницей в характеристиках этого не объяснить.

    Как мы уже знаем, архитектуры AMD в таких тестах всегда имели значительное преимущество перед конкурирующими решениями Nvidia, но в архитектуре Kepler калифорнийской компании удалось увеличить число потоковых процессоров, и пиковая математическая производительность моделей Geforce, начиная с GTX 680, серьезно возросла. Это мы видим по результатам нашего первого математического теста, где лучшая видеокарта Geforce хотя всё еще и уступает плате на основе чипа Hawaii, но конкурент GTX 780 Ti опережает ее уже лишь на 9%. Впрочем, судя по ценам, видеокарта Nvidia должна быть впереди, так что есть еще над чем поработать.

    Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

    А вот во втором математическом тесте мы видим совсем другие результаты видеокарт относительно друг друга. Разница между GTX Titan и сегодняшней новинкой в этом тесте стала даже чуть больше теоретической — 19%. Это гораздо больше походит на истинную разницу в математической производительности.

    К сожалению, даже при таком сильном результате, новый одночиповый топ Nvidia серии Geforce GTX 700 не может справиться со своим конкурентом от AMD, еще и имеющим меньшую цену. Geforce GTX 780 Ti не может ничего противопоставить свежей плате компании AMD, которая оказывается быстрее нее во втором математическом тесте на 12%. Радует лишь то, что GTX 780 Ti явно быстрее GTX 780 и Titan.

    Direct3D 10: тесты геометрических шейдеров

    В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

    Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

    Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

    Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близко к двукратному. Задача эта для современных видеокарт не слишком сложная, и производительность в ней ограничена скоростью обработки геометрии, а иногда — пропускной способностью памяти.

    Есть некоторая разница между результатами видеокарт на чипах Nvidia и AMD, обусловленная отличиями в геометрических конвейерах чипов этих компаний. Если в предыдущих тестах с пиксельными шейдерами платы AMD были заметно эффективнее и быстрее, то тесты геометрии показывают, что в таких задачах платы Nvidia оказываются производительнее, даже несмотря на увеличение количества геометрических блоков в Hawaii.

    Но разница между AMD и Nvidia уже не так велика, как это было раньше. У решений Nvidia с геометрической производительностью дела всегда были лучше, и поэтому они оказываются быстрее. Сегодняшняя новинка Geforce GTX 780 Ti оказывается примерно равной по производительности более раннему решению в виде GTX Titan, что говорит о тестировании производительности именно геометрического конвейера. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

    При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD, и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и все выводы остаются прежними. Новая модель Geforce GTX 780 Ti всё так же показывает производительность на одном уровне с другими платами на базе чипа GK110. А конкурирующий Radeon R9 290X всё так же отстает от них, так что в выводах ничего не меняется.

    «Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

    Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — еще и для их отрисовки. Иначе говоря, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер.

    К сожалению, но «Hyperlight» просто не работает на всех современных видеокартах компании AMD, включая и топовую Radeon R9 290X. В какой-то момент очередное обновление драйверов привело к тому, что данный тест просто не запускается на платах этой компании. И поэтому самый интересный геометрический тест нашего пакета, который предполагает большую нагрузку именно на геометрические шейдеры, ничего не может сказать о сравнении плат AMD и Nvidia.

    Но мы хотя бы можем посмотреть, что изменилось в случае решений Nvidia. Относительные результаты решений в разных режимах примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть чуть менее чем в два раза медленней.

    Скорость рендеринга в этом тесте ограничена в основном геометрической производительностью, но в случае сбалансированной загрузки геометрических шейдеров все результаты близки. Geforce GTX 780 Ti показала скорость на 6—8% выше уровня Titan, что говорит о том, что дело явно не только в геометрической производительности. Впрочем, цифры могут серьезно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

    В этом тесте наиболее важным параметром является скорость обработки геометрии, с которой дела у Nvidia обстоят прекрасно, особенно у полностью разблокированного чипа GK110, на котором основана рассматриваемая модель Geforce GTX 780 Ti. Из-за большего количества геометрических блоков Geforce GTX 780 Ti превосходит плату GTX Titan на 14—19%, а последняя, в свою очередь, ощутимо быстрее младшей платы на базе чипа GK110 — GTX 780.

    Direct3D 10: скорость выборки текстур из вершинных шейдеров

    В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

    Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

    Предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт, и пропускная способность памяти, что особенно заметно в легком режиме. Результаты видеокарт Nvidia зачастую ограничены чем-то странным, о чем говорят схожие результаты всех видеокарт, основанных на графическом процессоре GK110.

    Самой быстрой среди одночиповых решений в сравнении ожидаемо стала топовая Radeon R9 290X, а представленная сегодня новинка Geforce GTX 780 Ti проигрывает ей во всех режимах, даже в тяжелом, где разница меньше всего. Новая топовая плата Nvidia превзошла по скорости GTX Titan в этом тесте на 10—13%, что близко к теории. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

    Ситуация на диаграмме серьезно изменилась — результаты решений компании AMD в тяжелых режимах ухудшились, а для Geforce — остались почти на тех же позициях. Теперь Radeon R9 290X показывает результат заметно выше скорости новинки Nvidia только в самом простом режиме, а в среднем и тяжелом анонсированная сегодня Geforce GTX 780 Ti ее опережает. Разница между GTX 780 Ti и GTX Titan составляет 9—12%, что соответствует теории.

    Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

    Результаты во втором тесте вершинного текстурирования «Waves» в целом схожи с теми, что мы видели на предыдущих диаграммах. По каким-то причинам показатели всех плат Geforce на базе GK110 в легком режиме остаются сильно заниженными, и они чуть ли не вдвое хуже скорости двухчиповой Radeon HD 7990. Скорость же новой топовой платы Geforce GTX 780 Ti относительно своих собратьев в этом тесте неплоха, новый одночиповый топ на базе GK110 оказался быстрее GTX Titan на 8—10%. Рассмотрим второй вариант этого же теста:

    Во втором тесте текстурных выборок с усложнением задачи скорость всех решений стала ниже, и особенно серьезно пострадали видеокарты Geforce в легких режимах. Результаты сегодняшней новинки в лице Geforce GTX 780 Ti от Nvidia оказались лишь на 5% лучше, чем у GTX Titan на базе того же чипа, что говорит о том, что основным лимитом производительности в этом тесте для видеокарт Nvidia является производительность блоков ROP, скорее всего.

    3DMark Vantage: тесты Feature

    Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. Вероятно, при анализе результатов новой видеокарты Geforce GTX 780 Ti в этом пакете мы сделаем какие-то новые полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

    Feature Test 1: Texture Fill

    Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

    Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и сравнительные цифры моделей близки к соответствующим теоретическим параметрам. Старшая топовая модель Geforce GTX 780 Ti, которая вышла сегодня, в этом тесте лишь на 2% быстрее бывшей недавно наиболее производительной видеокартой GTX Titan, что не слишком близко к теории, надо признать.

    Естественно, что GTX 780 отстает от пары самых дорогих решений Nvidia по скорости текстурирования еще больше. Что касается сравнения платы Geforce GTX 780 Ti с решением конкурента Radeon R9 290X, то новинка Nvidia по текстурной скорости чуть быстрее платы, основанной на графическом процессоре Hawaii. Что было ожидаемо, исходя из теоретических показателей.

    Feature Test 2: Color Fill

    Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

    В данном случае измеряется не пиковая скорость блоков ROP, цифры из подтеста 3DMark Vantage показывают производительность блоков ROP с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно пропускную способность, а не производительность ROP.

    Поэтому результат анонсированной платы Nvidia в тесте производительности блоков ROP получился на 10% лучшим, по сравнению с GTX Titan, так как теоретическая разница по ПСП между ними есть. То же самое касается и опережения конкурента в лице Radeon R9 290X — на деле скорость именно блоков ROP у платы AMD выше, но из-за меньшей ПСП она проигрывает новинке Geforce GTX 780 Ti.

    Feature Test 3: Parallax Occlusion Mapping

    Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

    Этот тест пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

    В данном случае важны и математическая, и текстурная производительность, а возможно и скорость ROP, так как в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 780 Ti опережает более дорогую плату Nvidia лишь на 5%, что не совсем соответствует теоретической разнице в скорости текстурирования и вычислительной производительности.

    Если сравнивать новинку с решением конкурента, то в этом тесте GTX 780 Ti не может противостоять Radeon R9 290X, не говоря о двухчиповой HD 7990, так как GPU производства AMD являются более эффективными в этой конкретной задаче. Увы, но отставание GTX 780 от ближайшего по цене конкурента составляет 20%, что довольно много.

    Feature Test 4: GPU Cloth

    Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

    Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров и основными факторами влияния должна являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Но картина на диаграмме получилась весьма странная, обе видеокарты Radeon показывают частоту кадров около 130 FPS, а результаты трех Geforce также уперлись в предел, но уже на уровне около 95—100 FPS, как мы видели и ранее.

    И всё же, новинка опередила дорогущую GTX Titan на 7%, как ни странно. Новая модель топового семейства от Nvidia показывает скорость на треть хуже, чем старшая плата конкурента — Radeon R9 290X. И всё это несмотря на то, что геометрическая производительность видеокарт Nvidia должна быть выше, чем у решений конкурента, так как они имеют большее количество соответствующих исполнительных блоков. Мы еще перепроверим геометрическую производительность в тестах DirectX 11.

    Feature Test 5: GPU Particles

    Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

    Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

    Во втором геометрическом тесте из 3DMark Vantage ситуация изменилась, и в этот раз явным лидером является двухчиповая Radeon HD 7990, которая идет у нас сегодня вне зачета. Новинка компании Nvidia смогла всего лишь на 1% превзойти плату GTX Titan на базе того же чипа GK110, что говорит об упоре именно в геометрическую производительность, по крайней мере для плат Nvidia.

    Если сравнивать скорость новинки Geforce с единственным конкурентом от AMD, то новая плата весьма близка к своему сопернику — они обе показывают схожий результат в данной задаче. И это хороший результат скорее для Radeon, ведь он и стоит дешевле, да и раньше синтетические тесты имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, показывали, что платы Nvidia значительно опережают конкурирующие модели компании AMD, а теперь всё не так очевидно.

    Feature Test 6: Perlin Noise

    Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических расчетов.

    В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. В этом случае производительность решений не совсем соответствует теории и расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

    Видеокарты Radeon компании AMD, созданные на базе чипов архитектуры GCN, очень хорошо справляются с подобными задачами и показывают лучшие результаты в случаях, когда выполняется интенсивная «математика». Это не относится разве что к двухчиповой плате Radeon HD 7990, которая явно неэффективно отработала в этом случае. Однако если сравнивать анонсированную сегодня Geforce GTX 780 Ti с Radeon R9 290X, то последняя обходит плату Nvidia на 18%.

    Вышедшая сегодня на рынок видеокарта GTX 780 Ti показала скорость даже чуть медленнее модели GTX Titan того же производителя и основанную на таком же чипе, что абсолютно не соответствует теории. Сегодняшняя новинка всё-таки превзошла GTX 780 на 11%, хотя должна бы победить с куда большим перевесом. Вероятно, сказалось какое-то ограничение GPU Boost, снизившей частоту GK110 в составе GTX 780 Ti во время выполнения последнего синтетического теста пакета.

    Direct3D 11: Вычислительные шейдеры

    Чтобы протестировать новое решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

    Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

    Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia примерно одинаковая, хотя у видеокарт с GPU предыдущих архитектур были различия (любопытно, что у видеоплаты на Hawaii она снова проявилась, хоть и небольшая). Судя по нашим предыдущим тестам, результаты в задаче явно зависят не только от математической мощи и эффективности вычислений, но и от других факторов, вроде пропускной способности памяти и производительности ROP.

    В данном случае скорость видеокарт упирается в ПСП. Новая топовая плата компании Nvidia в этом тесте оказалась на 12% быстрее предшествующей модели GTX Titan. Если сравнивать новинку с платой AMD, то Geforce GTX 780 Ti и прямой конкурент Radeon R9 290X примерно равны, хотя плата Nvidia стоит несколько дороже.

    Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

    В случае этого теста расклад сил между решениями разных компаний получился совершенно иной. У видеоплат Nvidia есть явное преимущество в подобных расчетных задачах, а видеокарты Radeon не очень хорошо справляются с ними. Поэтому было бы логично, если бы в этом тесте победила мощнейшая из плат Nvidia — представленная сегодня карта модели Geforce GTX 780 Ti, имеющая больше активных вычислительных блоков и работающая на высокой частоте.

    Но нет, GTX 780 Ti в вычислительной задаче снова уступила пару процентов более дорогой GTX Titan. Скорее всего, в расчетных задачах частота графического процессора GK110 в случае игровой видеокарты опускается ниже уровня, устанавливаемого в случае «вычислительного» варианта — GTX Titan. Что же касается конкурента, то Radeon R9 290X остался далеко позади, почти вдвое уступив новинке Nvidia.

    Direct3D 11: Производительность тесселяции

    Вычислительные шейдеры очень важны, но еще одним интересным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других — для имитации реалистичной водной поверхности или ландшафта.

    Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

    Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

    В тесте простого бампмаппинга скорость чаще всего упирается в ПСП или производительность ROP, и результат новой видеокарты Geforce GTX 780 Ti подтверждает это — он почти идентичен скорости GTX Titan в этом тесте. Все Geforce в этом подтесте далеко позади Radeon R9 290X, но уже не из-за ПСП, а из-за скорости блоков ROP.

    Во втором подтесте с заметно более сложными попиксельными расчетами все несколько интереснее. Эффективность выполнения таких математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, поэтому неудивительно, что все платы Nvidia снова проиграли новому решению на базе чипа Hawaii. Radeon R9 290X на базе нового графического процессора заметно быстрее в том числе и новинки Geforce GTX 780 Ti, которая, в свою очередь, обогнала GTX Titan на впечатляющие 18%, что примерно соответствует теории по скорости математических вычислений.

    В тесте с тесселяцией результат новинки примерно такой же, что и в первом подтесте. Модель GTX 780 Ti показала почти одинаковую с GTX Titan скорость, проиграв прямому сопернику в лице Radeon R9 290X. Так получилось потому, что в этом тесте тесселяции разбиение треугольников умеренное и скорость в нем не упирается в производительность блоков обработки геометрии, поэтому скорости обработки треугольников у плат компании AMD хватает для того, чтобы показать высокие результаты.

    Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

    А в этом примере применяется уже более сложная геометрия, поэтому и сравнение геометрической мощи различных решений по этому тесту приносит и другие выводы. Все представленные в материале современные решения хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость, но в тяжелых условиях графические процессоры Nvidia всё же намного производительнее.

    Анонсированная сегодня модель Geforce GTX 780 Ti показала аномально низкий результат, по сравнению с GTX Titan на таком же чипе GK110. И отставание в 15—20% при трех самых простых уровнях тесселяции ничем не объяснить, ведь GTX 780 Ti по всем теоретическим параметрам (кроме объема видеопамяти) быстрее Titan. Вероятно, мы видим результат программной ошибки в виде неоптимизированных драйверов. И только при самой сложной тесселяции новинка вырывается вперед, как и должна.

    И сравнение с конкурентом в тяжелых условиях для новинки положительное, ведь у нее больше геометрических блоков, по сравнению с Hawaii. Поэтому GTX 780 Ti гораздо быстрее карты AMD нового поколения, но только в тяжелых условиях, когда скорость Radeon серьезно снижается, в то время как у новой платы Nvidia она остается достаточно высокой.

    Рассмотрим результаты еще одного теста — демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

    Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Впрочем, основной все равно остается именно нагрузка на блоки обработки геометрии.

    Мы протестировали решения при четырех разных коэффициентах тесселяции — в данном случае настройка называется Dynamic Tessellation LOD. Если при самом первом коэффициенте разбиения треугольников, когда скорость не ограничена производительностью геометрических блоков, новая топовая видеокарта от компании AMD показывает достаточно высокий результат, стараясь конкурировать с Geforce, но до уровня GTX 780 Ti она не дотягивается даже в этом случае. А при увеличении геометрической работы, новинка Nvidia вырывается вперед еще дальше.

    Видеокарты Nvidia в этом тесте весьма быстры, новая Geforce GTX 780 Ti оказалась на 5-10% производительнее более дорогой GTX Titan, как и должно быть по теории, в отличие от предыдущего теста. Конкуренту же для соперничества с картами Nvidia скорости всё еще не хватает, хотя в реальных играх нагрузка на геометрические блоки гораздо меньше, и там всё будет совсем иначе.

    Выводы по синтетическим тестам

    Результаты синтетических тестов видеокарты Geforce GTX 780 Ti, которая стала мощнейшей платой топовой серии компании Nvidia, а также результаты других моделей видеокарт производства обоих производителей дискретных видеочипов показали, что новая плата является одним из самых мощных решений на рынке, и она должна успешно конкурировать с другими топовыми платами, несмотря на довольно высокую цену.

    Главное, что мы определили — новинка явно быстрее Geforce GTX Titan в большинстве тестов, и это при ощутимой разнице в цене в пользу GTX 780 Ti. Неудивительно, что для игр новая плата Nvidia становится одним из наиболее мощных предложений в самом верхнем ценовом диапазоне. За исключением некоторых задач, анонсированная сегодня модель Nvidia неплохо выступила и по сравнению с мощнейшим Radeon R9 290X. Наш набор синтетических тестов показал, что по производительности они будут соперничать друг с другом и в играх, тем более что решения Nvidia там традиционно выступают лучше, чем в «синтетике».

    Новая модель Geforce GTX 780 Ti явно нацелена на тех энтузиастов, которые не готовы на компромиссы и планируют играть в современные и будущие игры при максимальных настройках в самых высоких разрешениях, и готовы заплатить за это немного больше денег, чем стоит конкурирующая Radeon R9 290X. Больше всего обрадуются те, кто уже хотел покупать Geforce GTX Titan для игр, а меньше всего — те, кто ее недавно купил. Ведь новая модель Nvidia стоит дешевле, но в играх будет даже производительнее. Давайте как раз и перейдем к оценке реальной производительности GTX 780 Ti в играх в следующей части статьи.

    реклама

    Вспомним линейку видеокарт NVIDIA. GeForce GTX 770, GTX 780, GTX Titan и GTX 690 – немного неправильная, но понятная классификация модельного ряда ускорителей компании. Но GTX 780 Ti? Зачем? Куда? С чем сопоставить? Ответ не так прост, как можно решить на первый взгляд. Если порассуждать, то…

    Шестая серия GeForce была предельно понятна: каждая следующая по рангу модель отличалась большим числом в названии. И вот появляются видеокарты с индексом, включающим в себя 7х0. При этом никуда не пропала GTX 690, она по-прежнему остается максимально быстрым двухъядерным решением. Может быть, GTX Titan затесался не в свою группу? Вполне, почему бы и нет, ведь он пришел на игровой рынок из мира расчетов и остается ультимативным предложением как для игр, так и для вычислений.

    Возникает вопрос – стоит ли NVIDIA после выпуска GTX 780 Ti снимать его с производства? Ответ также прост. Зачем? Он пользуется популярностью у тех людей, кому нужны вычисления, и у энтузиастов, тем не менее, для игр лучшим выбором должен стать GTX 780 Ti. Все потому, что пользователям наконец-то предоставили полностью работоспособный GPU с 2880 потоковыми процессорами. Да, только сейчас после определенных изменений, о которых будет рассказано ниже, графический процессор GK110 готов влиться в игровые приложения и показать, на что он способен.

    Наверное, всем интересно, почему GK110 получил новое название, вернее степпинг B1, а не скажем A2? Есть мнение, что числами обозначают исправления в металлических соединениях внутри GPU. Буквы говорят об изменениях в самих транзисторах. В любом случае радикальных изменений внутри кристалла нет – это все тот же GK110. Все, что потребовалось NVIDIA – адаптировать полную версию GK110 под требуемое тепловыделение с расчетными частотами, и сделать это было непросто.

    Скрытность разработок компании покрыта такой завесой тайны, что добиться вразумительных ответов практически невозможно, вас попросту завалят рекламными или общими фразами, из которых невозможно выяснить технические данные. Что ж, секреты надо держать нераскрытыми, даже под колкими вопросами прессы. Со своей стороны можно лишь догадываться, на какие уловки пришлось идти, чтобы уместить новую ревизию GPU в отведенный диапазон энергопотребления.

    реклама

    Технические особенности

    Как вы уже поняли, физических изменений в основных логических схемах нет. Возможно, внутри появились оптимизации, сокращающие время прохождения заданий внутри GPU, что приводит к меньшему объему одновременно работающих транзисторов. Такая схема работы существует давно и называется «темным кремнием». Все 7.1 млрд транзисторов, функционирующих единовременно, не сможет охладить ни одна система, а значит постоянно надо следить за балансом, с одной стороны которого находится производительность, а с другой – частота, энергопотребление и вытекающая из них температура. Чем лучше и экономичнее работают затворы, и держится меньшая температура, тем быстрее происходят вычисления.

    Еще до появления Hawaii со стороны конкурента, NVIDIA ввела несколько положений работы GPU. Так, базовая частота – самая низкая ступень работы GPU, GPU Boost – средняя частота GPU в играх. Чаще всего, даже после длительного пребывания видеокарты под игровой нагрузкой, GPU Boost удерживал частоту графического процессора несколько выше заявленной. Компания AMD пошла другим путем – единственный режим, в котором видеокарта полностью реализует свою мощность, это «Нормальный» или, как его еще называют – Uber режим.

    Но в отличие от конкурента, в NVIDIA считают, что пользователю нет надобности разбираться ни с переключателями BIOS, ни с настройками в драйверах – за них все сделает видеокарта, причем сама. А в чем уж можно упрекнуть разработчика GeForce, так это в том, что фиксированный лимит энергопотребления слишком близок к заводской настройке. Остается проверить – действительно ли инженеры решили общую проблему резкого роста энергопотребления?

    Технические характеристики

    Наименование R9 290 R9 290X GTX 690 GTX 780 GTX 780 Ti GTX Titan
    Кодовое имя Hawaii Hawaii GK104 GK110 GK110 GK110
    Техпроцесс, нм 28 28 28 28 28 28
    Размер ядра/ядер, мм 2 438 438 294x2 521 521 521
    Количество транзисторов, млн 6200 6200 3540x2 7100 7100 7100
    Частота ядра, МГц До 950 До 1000 915 (1020) 860 (900) 880 (930) 840 (880)
    Число шейдеров (PS), шт. 2560 2816 3072 2304 2880 2688
    Число блоков растеризации (ROP), шт. 64 64 64 48 48 48
    Число текстурных блоков (TMU), шт. 160 176 256 192 240 224
    Максимальная скорость закраски, Гпикс/с 60.6 64 58.6 41.4 42 40.2
    Максимальная скорость выборки текстур, Гтекс/с 151.5 176 234.2 165.7 210.2 187.5
    Версия пиксельных/ вертексных шейдеров 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0 5.0 / 5.0
    Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
    Эффективная частота памяти, МГц 5000 5000 6000 6000 7000 6000
    Объем памяти, Мбайт 4096 4096 2048x2 3072 3072 6144
    Шина памяти, бит 512 512 256x2 384 384 384
    Пропускная способность памяти, Гбайт/с 320 320 192x2 288.4 336 288.4
    Потребляемая мощность (2D / 3D), Вт нд / нд нд / нд нд / 300 нд / 250 нд / нд нд / 250
    CrossFire/Sli да да да да да да
    Рекомендованная на момент анонса цена, $ 399 549 999 499 699 999

    Внешний вид и размеры



    Предыдущая статья: Следующая статья:

© 2015 .
О сайте | Контакты
| Карта сайта