Из шести под-тестов три показали полезность встроенной графики, а оставшиеся три показали как будто бы полную (и не очень) бесполезность.
Начну с под-теста simple1. Это стандартное удвоение кадров, в котором эффективнее всего работает построение кадров. Для требуемых 48 к/сек необходимо рассчитать для 24 исходных кадров ровно 24 промежуточных.
Но почему же дискретная графика дает прирост результатов, а встроенная графика не дает? Ответ кроется в цифрах. Если взглянуть на результаты расчета только процессором, то видно, что они лежат в районе 126-133 к/сек. Это в 2,5 раза больше требуемой скорости 48 к/сек. При реальном проигрывании видео с плавностью скорость будет в 2,5 раза ниже, соответственно процессор будет загружен на 100/2,5 = 40%. GPU-ускорение должно еще освободить процессор, что в реальности даст меньшую частоту его работы, меньший нагрев, и как результат, меньший шум от системы охлаждения. Правда этот вывод касается горячих процессоров (Core i7 920, например), а IvyBribge - процессор достаточно холодный.
Но я не ответил на вопрос, почему встроенная графика не дала прироста? Если посмотреть показатель расчета кадров (GPU-calc), то можно увидеть там цифру 130. Это означает, что она способна рассчитывать 130 вакуумо-кадров на среднестатистических настройках плавности. Кроме этого имеются издержки на передачу данных процессор > видеокарта > процессор, что создает ограничение для применения видеокарты. В данном случае ограничение находится в районе 150 к/сек.
Анализ отличий.
1. Прирост от iGPU: 10% (на старом драйвере отрицательный: -3%).
2. Прирост от dGPU: 50% (это быстрее, чем iGPU в 1,36 раза).
3. Разгон памяти увеличил результаты CPU на 6%, iGPU - на 8%, dGPU - на 14%. Для дискретной карты на таких скоростях обработки и особенно пересылки данных является критичной частота работы оперативной памяти.
Под-тест fastest. Это еще более легкие настройки повышения плавности.
Подтверждается предположение об ограничении скорости встроенного графического ядра в районе 150 К/сек. Теперь даже от использования дискретной видеокарты не наблюдается прироста. Вся мощь карты (GPU-calc = 935 вакуумо-кадров) съедаются издержками передачи данных. Но опять же причина вполне объяснима: завышенная в 6 раз скорость кадров. В реальных задачах при проигрывании видео таких частот кадров просто не бывает. Да и при обработке и перекодировании скорости куда скромней. А на низких скоростях GPU-ускорение покажет себя уже в более выгодном свете.
Анализ отличий.
1. Прирост от iGPU: -48% (на старом драйвере отрицательный: -52%).
2. Прирост от dGPU: 2% (скорость выше, чем с iGPU в 1,96 раза).
3. Разгон памяти увеличил результаты CPU на 11%, iGPU - на 8%, dGPU - на 23%. Что еще раз говорит о критичности частоты работы оперативной памяти для дискретной карты на высоких скоростях обработки кадров (250-300 к/сек).
Под-тест simple2. Это соответствует легким настройкам при утроении кадров. Анализ векторов движения процессором выполняется с такими же затратами, как в под-тесте simple1, но при этом построение требует вдвое больших затрат от применяемого ускорителя.
В сравнении с графиком simple1 процессор показал увеличение результата со 131 до 175 к/сек, что говорит о том, что поиск векторов движения с пересчетом на один исходный кадр - это задача более трудоемкая, чем построить один новый кадр.
По грубым подсчетам для этого алгоритма у меня вышло, что построить 1 кадр для процессора в 7 раз легче, чем найти вектора. Странно. Откуда тогда приросты от GPU-ускорения 70%, если освобождается только 2/7 = 29%?
Второй вопрос: почему ограничение частоты кадров для iGPU снизилось со 150 до 120 к/сек? Затраты на расчет одного нового кадра идентичны под-тесту
simple1, процессор трудится в 2 раза меньше. Парадокс.
Дискретная видеокарта снова показала наличие ограничения для нее в районе 250-300 к/сек. Не так уже далеко ушла от встроенной графики: всего в два раза.
Но опять же повторю, Снижение результатов при использовании встроенной видеокарты наблюдается только из-за высокой скорости подачи исходных кадров. На нормальной скорости встроенное графическое ядро успешно справляется с построением даже на более тяжелых настройках.
Анализ отличий.
1. Прирост от iGPU: -34% (почти один-в-один как на старом драйвере: -35%).
2. Прирост от dGPU: 46% (скорость выше, чем с iGPU в 2,22 раза).
3. Разгон памяти увеличил результаты CPU на 5%, iGPU - на 7%, dGPU - на 10%. Еще раз подтвердилась критичность частоты работы оперативной памяти для дискретной карты на высоких скоростях обработки кадров (250-300 к/сек).
Общие выводы
- Встроенное графическое ядро Intel HD Graphics 4000 справляется с повышением плавности вплоть до настроек под-теста high. Для highest нехватило производтельности процессора, чтобы проверить;
- Несмотря на разницу производительности по синтетическим тестам в 7 раз, разница максимально доступной скорости построения кадров отличается всего в 2 раза и находится в районе 150 к/сек для Intel HD Graphics 4000 и 300 к/сек для GTX 260;
- Работа оперативной памяти на высокой частоте (1866, 2133 и 2400 МГц) может дать прирост скорости на процессоре на 4-11%%, на iGPU - на 6-9%, на dGPU - на 7-23%;
- Применение встроенного графического ядра для ускорения расчетов дает ускорение максимум на 71%, а применение дискретной видеокарты - на 97%.
Выводы касаются результатов теста SVPmark, показывающего OpenCL-расчетные возможности. Для оценки возможностей использования встроенного графического ядра Ivy Bridge не только для расчетов, но еще и для пост-обработки и для отрисовки требуются дополнительные проверки.
Post's attachments
48_fastest.png 11.08 kb, 793 downloads since 2012-05-23
48_simple1.png 11.41 kb, 803 downloads since 2012-05-23
72_simple2.png 10.86 kb, 802 downloads since 2012-05-23