vivan
спасибо за дополнение и ссылку
Почитаю...
You are not logged in. Please login or register.
SmoothVideo Project → Posts by MAG79
vivan
спасибо за дополнение и ссылку
Почитаю...
komandors
Примерно такой же, как у x264 при переходе с 32 бит на 64 бита. Но главное преимущество 64 бит не скорость, а возможность использовать больше 2 ГБ оперативной памяти.
It means the problem is solved?
river
Yeah.. It is simple. Only avisynth 2.5.8 MT SVP edition has memory optimizations for SVP use.
ffdshow.ax/avisynth.dll: 1.2.4450.0/2.6.0.3
Sorry, I didn't notice it before.
airport
Try to return standard 60 Hz video mode.
airport
I increased refresh rate from 60Hz to 80Hz
It is non standard. Does your hardware supports this?
What is your configuration (CPU, GPU, monitor)?
disabled Vsync on GPU and MPC-HC
Are you sure it is good? I don't think so.
%username%
Как обстоит дело с 10бит видео?
Скачаю подобное видео и гляну. Пока не имею опыта просмотра 10 бит.
как себя симулятор чувствует с шарпен комплекс 2, бикубиком и madVR? отдельно и вместе
Ага, погляжу. Добавил в план в шапку темы.
And one more question.
Your tearing with Ctrl-T (Ctrl-Win-T) looks like this (tearing vertical line of tearing test)?
If yes then you can find option Vertical sync in driver of your video adapter and turn it on (Force on).
airport
Decrease frame size option does resize not crop. For cropping you must use Frame crop option from SVP tray menu.
Let's look to one of these video with tearing. Maybe it will be enough to me to find the problem.
airport
Oh! Yes. I didn't notice double ffdShow at the first screen (Thanks to Chainik). It is wrong. You need to leave one ffdShow.
Additional info is text-file from SVP menu - Information - Additional information.
Upload any fragment with tearing trouble. Source video without any transcoding.
Why you use decrease frame size to 75% of original size for 640x480 video?
river
4 core CPU with HT with "threads:auto" setting gives 9 SVP-threads. It is not very high value to heavy memory use. You are not need to change it.
Из шести под-тестов три показали полезность встроенной графики, а оставшиеся три показали как будто бы полную (и не очень) бесполезность.
Начну с под-теста simple1. Это стандартное удвоение кадров, в котором эффективнее всего работает построение кадров. Для требуемых 48 к/сек необходимо рассчитать для 24 исходных кадров ровно 24 промежуточных.
Но почему же дискретная графика дает прирост результатов, а встроенная графика не дает? Ответ кроется в цифрах. Если взглянуть на результаты расчета только процессором, то видно, что они лежат в районе 126-133 к/сек. Это в 2,5 раза больше требуемой скорости 48 к/сек. При реальном проигрывании видео с плавностью скорость будет в 2,5 раза ниже, соответственно процессор будет загружен на 100/2,5 = 40%. GPU-ускорение должно еще освободить процессор, что в реальности даст меньшую частоту его работы, меньший нагрев, и как результат, меньший шум от системы охлаждения. Правда этот вывод касается горячих процессоров (Core i7 920, например), а IvyBribge - процессор достаточно холодный.
Но я не ответил на вопрос, почему встроенная графика не дала прироста? Если посмотреть показатель расчета кадров (GPU-calc), то можно увидеть там цифру 130. Это означает, что она способна рассчитывать 130 вакуумо-кадров на среднестатистических настройках плавности. Кроме этого имеются издержки на передачу данных процессор > видеокарта > процессор, что создает ограничение для применения видеокарты. В данном случае ограничение находится в районе 150 к/сек.
Под-тест fastest. Это еще более легкие настройки повышения плавности.
Подтверждается предположение об ограничении скорости встроенного графического ядра в районе 150 К/сек. Теперь даже от использования дискретной видеокарты не наблюдается прироста. Вся мощь карты (GPU-calc = 935 вакуумо-кадров) съедаются издержками передачи данных. Но опять же причина вполне объяснима: завышенная в 6 раз скорость кадров. В реальных задачах при проигрывании видео таких частот кадров просто не бывает. Да и при обработке и перекодировании скорости куда скромней. А на низких скоростях GPU-ускорение покажет себя уже в более выгодном свете.
Под-тест simple2. Это соответствует легким настройкам при утроении кадров. Анализ векторов движения процессором выполняется с такими же затратами, как в под-тесте simple1, но при этом построение требует вдвое больших затрат от применяемого ускорителя.
В сравнении с графиком simple1 процессор показал увеличение результата со 131 до 175 к/сек, что говорит о том, что поиск векторов движения с пересчетом на один исходный кадр - это задача более трудоемкая, чем построить один новый кадр.
Дискретная видеокарта снова показала наличие ограничения для нее в районе 250-300 к/сек. Не так уже далеко ушла от встроенной графики: всего в два раза.
Но опять же повторю, Снижение результатов при использовании встроенной видеокарты наблюдается только из-за высокой скорости подачи исходных кадров. На нормальной скорости встроенное графическое ядро успешно справляется с построением даже на более тяжелых настройках.
Общие выводы
- Встроенное графическое ядро Intel HD Graphics 4000 справляется с повышением плавности вплоть до настроек под-теста high. Для highest нехватило производтельности процессора, чтобы проверить;
- Несмотря на разницу производительности по синтетическим тестам в 7 раз, разница максимально доступной скорости построения кадров отличается всего в 2 раза и находится в районе 150 к/сек для Intel HD Graphics 4000 и 300 к/сек для GTX 260;
- Работа оперативной памяти на высокой частоте (1866, 2133 и 2400 МГц) может дать прирост скорости на процессоре на 4-11%%, на iGPU - на 6-9%, на dGPU - на 7-23%;
- Применение встроенного графического ядра для ускорения расчетов дает ускорение максимум на 71%, а применение дискретной видеокарты - на 97%.
Выводы касаются результатов теста SVPmark, показывающего OpenCL-расчетные возможности. Для оценки возможностей использования встроенного графического ядра Ivy Bridge не только для расчетов, но еще и для пост-обработки и для отрисовки требуются дополнительные проверки.
iGPU против dGPU
Я неделю назад начал тесты по сталкиванию лбами встроенной и дискретной графики. Далее оформлял результаты. И вот теперь наконец готов предоставить их на всеобщее обсуждение.
Еще перед тестированием было изначально ясно, что встроенная графика проиграет дискретной. Но у меня оставался еще целый список вопросов: насколько встроенная графика слабее в штатном режиме? а если разогнать частоту памяти? нужна ли быстрая память для Ivy Bridge? а если разогнать процессор? а если разогнать графическое ядро?...
На часть вопросов ответы уже есть. О них и пойдет речь. Для начала опишу, что с чем сравнивал.
Привел типичные характеристики железа, работающего в штатном режиме. Отдельно разгонял память с 1333 до 2400 МГц, отдельно центральный процессор с 3400 до 4600 МГц. Измерения производительности и стабильности делал при помощи SVPmark. Ниже приведены результаты только по реальным тестам, т.к. они важней синтетики с точки зрения пользования пакетом SVP на этом железе.
Сравнивались следующие величины:
1. Какую прибавку процессору дает встроенное графич. ядро (iGPU). Старый (iGPU old) и новый драйверы.
2. Какую прибавку процессору дает дискретная видеокарта (dGPU). На сколько процентов результаты ускорения на dGPU быстрее, чем на iGPU.
3. Какой прирост скорости дает разгон памяти с 1333 до 2400 МГц в зависимости от применяемого ускорителя.
Под-тест good. Соответствует оптимальным настройкам плавности в SVP 3.0. набор настроек и скорость расчетов в SVP 3.1 немного поменялись, но можно считать это изменение незначительным. Качество увеличилось, но оптимальные настройки остались примерно на том же уровне производительности.
Процессор справляется даже без ускорителей, выдавая 71-76 к/сек. Это выше необходимых 60 к/сек.
Под-тест high. Соответствует настройкам плавности, немного выкрученным в сторону повышения качества в ущерб производительности. Процессор без ускорителя не справляется, показывая только 46-48 к/сек из требуемых 60-ти. Применение любого ускорителя сразу решает эту проблему и скорость повышения плавности преодолевает планку в 60 к/сек.
Под-тест highest. Соответствует максимально тяжелым настройкам плавности, сильно выкрученным и не гарантирующим повышение качества, но требующим еще больше производительности. Этот случай уже не такой широкоприменяемый как первые два и представляет собой проверку запаса производительности на перспективу. Как можно увидеть, тест и правда очень требовательный. Процессор не справляется ни без ускорителя, ни с ускорителем, и даже в разгоне до 4600 МГц показывает результат только 54 вместо положенных 60 к/сек.
Xant1k
в MPC
Хорошо. Теперь с используемым плеером ясно.
Дрожание 0 из-за ReClock'а - это тоже хорошо. Но раз есть окно статистики, значит полноэкранный D3D режим не использовался? Без него выпавшие кадры - не редкость даже на самых производительных системах. Другое дело, что из полноэкранного режима такую статистику не посмотришь и не скажешь чему стала равна цифра. Нулю или также набегает до нескольких сотен за фильм.
Предлагается:
1. Использовать отрисовшики, наиболее стойкие к выпавшим кадрам. Это madVR Exclusive и EVR Custom с полноэкранным D3D.
2. Статистику выпавших кадров смотреть в madVR по Ctrl-J, я считаю его показания ниболее честными.
river
Processing threads: Auto
Sorry, I can't find your config description (I need CPU model name).
And what GPU you have? Why you don't using its acceleration?
Decrease grid step: To small step 6-8 px.
This is the most likely cause. Increase this value and you will see lesser memory use.
airport
Thank you. All is good there.
1. Maybe you can upload a little sample?
2. And show additional info from SVP menu please. There should be the answer.
river
AVSmem=1024
You can change this value. Maybe you will get some memory use reducing.
But I think reason is threads count and SVP hard settings.
I can say more precisely if you place here your additional info file content from SVP menu.
Xant1k
EVR CP
Так отрисвщик в PotPlayer'e называется, и представляет собой сильно перекроенный EVR. В MPC-HC более правильный отрисовщик и называется он EVR Custom Pres.Xant1k
многова-то дропов
Разве этой статистике можно доверять? Я не думаю.
Я вообще вижу что эта статистика не предназначена для оценки плавности. Т.к. нужно две цифры: пропущено кадров / повторено кадров. Кроме этого не хватает точной частоты обновления экрана.
И на последок, я не понимаю, как может быть дрожание кадров = 0 при наличии дропов?
Кривая статистика?!
Исчерпывающий ответ дал Chainik:
http://forum.doom9.org/showthread.php?t=164772
24th April 2012forget about x64 . developers say that 64bit is very unfinished. also not all plugins are available for x64
SEt wrote:No one maintains x64 build for a long time now. That's why it's buggy and totally unstable. You aren't forbidden to use it, but in current state don't expect it to do anything right.
Вольный перевод:
Т.е. нет в природе законченного Avisynth x64, никто не управляет сборками x64. Они содержат ошибки и нестабильны. В текущем состоянии (24 апреля 2012) от них сложно ожидать правильного результата.
Стыдно!
Take screenshot of DS-Filters while playing please.
MPC HC menu - Play - Filters
Like this:
Can I download one of these movies from Internet?
Maybe you have a link. Then I can take a closer look.
airport
Can you show properties of these "some of your movies"?
river
SVP uses 32 bit players. It means 2 GB limit for all DirectShow chain: player - splitter - decoders - ffdshow avisynth + SVP libraries - renderer.
Each of them wants some meory to work.
1. You can reduce memory use of them. For example: Comparing of memory consumption of different decoders.
2. You can change some SVP settings to reduce memory use.
3. And, of course, you can disable memory control function: hidden setting ReloadAVSFactor=0
Вчера предварительно проверил разгонный потенциал HD Graphics 4000.
Графическое ядро работает на частоте 350 (в простое), 650 (в нагрузке), 1150 (в максимальной нагрузке). Судя по показаниям GPU-Z, ядро достаточно быстро переключается между частотами.
Так вот в BIOS имеется возможность задать максимальную частоту, на которую будет переключаться видеокарта. Частота задается с шагом 50 МГц. Без поднятия напряжения на графическом ядре у меня оно заработало и прошло тест SVPmark на частоте 1500 МГц. Разгон составил (1500-1150)/1225 = 30%. При этом показатель GPU-calc вырос с 130 до 162, что составило 25%. Это показатель синтетического теста. Влияние на результат реальных тестов проверю позже.
Chainik
что с ним происходит при одновременном декодировании + SVP + madVR?
К сожалению, на текущих драйверах у меня не получилось заставить IviBridge это сделать на встроенном видео Intel HD Graphics 4000. С идеальной плавностью работает либо SVP OpenCL-ускорение вплоть до разрешения для FullHD, либо madVR (на мониторе 1920x1200, размер имеет значение).
Появилось два вопроса:
1. Справится ли встроенная видеокарта с этой же задачей на мониторе 1680x1050?
2. Почему расчетные кадры сдвинуты на пиксел вправо и вниз?
Ответ на первый вопрос смогу дать, когда подключу и проверю это дело, а со вторым вопросом надо будет более подробно поразбираться. Для начала выяснить на обоих ли версиях драйвера происходит такая проблема, а затем уже либо придется вносить изменения в SVP-шейдеры, либо искать настройку драйвера, чтобы кадры не сдвигались.
SmoothVideo Project → Posts by MAG79
Powered by PunBB, supported by Informer Technologies, Inc.