Topic: GPU ускорение
Имею коре квад и GTS450. При включении GPU ускорения нагрузка на проц скорее растет, чем падает. Вроде перепробовал все что мог...Где косяк не пойму. Во вложении лог SVPmark 3
You are not logged in. Please login or register.
SmoothVideo Project → Эксплуатация SVP → GPU ускорение
Имею коре квад и GTS450. При включении GPU ускорения нагрузка на проц скорее растет, чем падает. Вроде перепробовал все что мог...Где косяк не пойму. Во вложении лог SVPmark 3
alerto
для начала драйвер 280.26 на что-нибудь другое сменить
да и вообще, бонус от GPU ускорения сильно зависит от настроек, примерно в диапазоне от 0 до 2-х раз
для минимальных параметров SVP польза от GPU может вообще отсутствовать
прошу не пинать, у меня пару вопросов. Взял поюзать тазик, вспомнил про SVP , решил попробовать:
монитор подключен к интелу HD4000 а плазма панас к нвидиа 680.
SVP c аппаратным ускорением вылетает (вернее крешится плеер). Без ускорения - нормально.
Вопрос раз - почему?
Вопрос два - где в SVP выбор адаптера для ускорения
спасибо
пс: тесты свпмарк прогнал, вроде все нормально, с 60 fps - [SVP] highest: 0.82x (49.1 fps) только коэффициент меньше 1 (и интел выбирал и нвидиа)
sbahmach
Вопрос два - где в SVP выбор адаптера для ускорения
В версии 3.1.3, которой нет
Вопрос раз - почему?
Может быть потому и.
Попробовать дописать в файлик override.js строку
smooth.gpuid=11;
и поперебирать значения 11, 12, 21
Если и так не поможет - снести интеловский OpenCL-runtime.
Chainik
вроде не падает и уплавняет с галкой ГПУ ускорение.
ОК, спасибо.
поставил значение 21 пока.
А для интела и нвидиа какие ставить? Просто хочу попробовать проверить и на том и на том адаптере.
и еще вопрос, где можно посмотреть что работает аппаратное ускорение, кроме как сравнивать с нагрузкой на проц. По нагрузке - вроде работает. Может есть какая нибудь "красная лампочка" показывающая задействованно или нет ГПУ ускорение в СВП ?
и раньше вроде были пресеты для выбора типа Простой, Лучше качество, Максимальное качество и тп. Ну чтоб таким как я не особо заморачиваться с опциями. Сейчас не нахожу.
sbahmach
Есть такая "красная лампочка". В тексте AVS-скрипта будет указано GPU=0 либо не 0.
если бы не работало (или значение gpuid не валидное) - падало бы с ошибкой
MAG79
ок, спасибо.
Времени реально много нет разбиратся с СВП. Цель по быстрому проверить ваш труд - выжать из железа по-максимуму в плане уплавнения какого-нибудь БД. Ну и решить приемлемо это мне или нет
Интел в плане ускорения покруче, 4к видео легко ускоряет. Не так конечно как заявлено 4кх4к но 3200х3200 идут без дропов с дхва, дальше хуже, а уже на 3840х3840 не идет. Тянет даже 4096x2160x60p с дхва. Это я к тому, что запас у интела огромный. У НВИДИА с этим хуже намного.
как мне переключатся с одного адаптера на другой? ну хотя бы не по-горячему а с перезапуском СВП и плеера
Когда я просто воспроизвожу файл с аппаратным ускорением на встроенных фильтрах мрс, то работает/декодит видеокарта, на экране которой окно плееера (к какому адаптеру подключен монитор). Перетаскивая окно на другой экран - переключается ускорение и на другую видюху. Все как бы просто.
Если же внешние фильтры использовать типа ЛАВ, то тут уже они рулят ситуацию.
Хотелось бы понять как это делать с SVP
так если в том же LAV поставить QuickSync-декодер, то оно никуда уже не денется
декодирование через HD4000, ускорение SVP через NV, вывод-ресайз-шейдеры - не знаю, наверное "на экране которой окно плееера"
так если в том же LAV поставить QuickSync-декодер, то оно никуда уже не денется
декодирование через HD4000, ускорение SVP через NV, вывод-ресайз-шейдеры - не знаю, наверное "на экране которой окно плееера"
с декодированием и с выводом это я разберусь, да и не особо важно сейчас, хотя например в случаях LAV DXVA nativ / copy-back, какую карту цепляет интересно. Это отдельная тема.
Мне интересно как менять ускорение SVP через.... такую то карту. Пусть то редактированием скриптов или другим неудобным способом, но главное результат - перенаправить работу СВП на определенную карту и убедится что именно она участвует в ускорении.
на HD4000 все-равно сейчас работает с глюком (картинка дрожит на пиксель), так что выбор не большой
Chainik
Ясно, спасибо.
sbahmach
как мне переключатся с одного адаптера на другой?
дописать в файлик override.js строку
smooth.gpuid=11;
и поперебирать значения 11, 12, 21
Значения gpuid можно подсмотреть в CLInfo или в GPU Caps Viewer (вкладка OpenCL).
Первая цифра - это platform number, вторая - device number.
MAG79
Number of platforms : 2
Number of devices : 2 (Intel(R) OpenCL)
Number of devices : 1 (NVIDIA CUDA)
получается интел - 22, а нвидиа - 21 у меня (если я все правильно понял)
sbahmach
Не совсем. Number of devices - это количество устройств. А номер устройства - просто смотреть по порядку вывода.
Номер показывает GPU Caps Viewer, а CLInfo - не показывает.
Твои устройства должны располагаться в разных платформах, насколько я могу судить.
Приложи целиком выхлоп CLInfo. Мы точно подскажем.
sbahmach
Number of platforms: 2
...
Platform Name: Intel(R) OpenCL (первая платформа, =1*)
Number of devices: 2
Device Type: CL_DEVICE_TYPE_CPU
Name: Intel(R) Core(TM) i7-3770K CPU @ 3.50GHz (=11)
...
Device Type: CL_DEVICE_TYPE_GPU
Name: Intel(R) HD Graphics 4000 (=12)
...
Platform Name: NVIDIA CUDA (вторая платформа, =2*)
Number of devices: 1
Device Type: CL_DEVICE_TYPE_GPU
Name: GeForce GTX 680 (=21)
Т.е. в твоем случае
gpuid=11 - это OpenCL на процессоре, тот еще тормоз
gpuid=12 - это OpenCL на HD Graphics 4000
gpuid=21 - это OpenCL на GTX 680
Тебе нужны значения 12 и 21.
MAG79
Я понял, в GpuCapsViewer с этим разобрался, там наглядней.
Спасибо за ликбез. Завтра буду гонять.
sbahmach
Поглядел версию драйвера для HD 4000 из отчета CLInfo: 8.15.10.2618
Это устаревший драйвер. Рекомендую обновиться. Последние для win7, это 15.26.12.64.2761
Вот тут есть сравнение скорости и описание особенностей работы HD 4000 в SVP: IvyBridge и SVP
cpu-устройства не учитываются
sbahmach
Тебе нужны значения 12 и 21
cpu-устройства не учитываются
Тогда значения 11 и 21.
скажите, если у меня gеforce 9500 GT, ее явно нехватает для свп, при высоких настройках.
1. можно ли докупить еще недорогую карту, так чтоб они юзались обе, такое возможно? Если такое возможно, подскажите какого уровня карту стоит докупать к паре к 9500 GT.
2. Если 2 карты юзать невозможно, скажите какого уровня нвидиа минимально достаточно для свп (макс профиль)
1. только если декодирование и вывод на экран на одной карте, а расчет SVP на второй
2. все давно написано
Поставил куталист 12.8 - ацтой, после нагрузки на карту сбрасывает частоты до 400МГц вместо 250МГц. Карта греется сильно.
Снес, перегрузился на стандартном видеодрайвере, вычистил амдэшные папки, поставил куталист 12.1. Все стало сразу хорошо, но в SVP засвечен пункт SVPGPU.
Как исправить? гефорц не предлагать.
Number of platforms: 1
Platform Profile: FULL_PROFILE
Platform Version: OpenCL 1.2 AMD-APP (938.2)
Platform Name: AMD Accelerated Parallel Processing
Platform Vendor: Advanced Micro Devices, Inc.
Platform Extensions: cl_khr_icd cl_amd_event_callback cl_amd_offline_devices cl_khr_d3d10_sharing
Platform Name: AMD Accelerated Parallel Processing
Number of devices: 1
Device Type: CL_DEVICE_TYPE_CPU
Device ID: 4098
Max compute units: 6
Max work items dimensions: 3
Max work items[0]: 1024
Max work items[1]: 1024
Max work items[2]: 1024
Max work group size: 1024
Preferred vector width char: 16
Preferred vector width short: 8
Preferred vector width int: 4
Preferred vector width long: 2
Preferred vector width float: 4
Preferred vector width double: 0
Native vector width char: 16
Native vector width short: 8
Native vector width int: 4
Native vector width long: 2
Native vector width float: 4
Native vector width double: 0
Max clock frequency: 4399Mhz
Address bits: 32
Max memory allocation: 1073741824
Image support: Yes
Max number of images read arguments: 128
Max number of images write arguments: 8
Max image 2D width: 8192
Max image 2D height: 8192
Max image 3D width: 2048
Max image 3D height: 2048
Max image 3D depth: 2048
Max samplers within kernel: 16
Max size of kernel argument: 4096
Alignment (bits) of base address: 1024
Minimum alignment (bytes) for any datatype: 128
Single precision floating point capability
Denorms: Yes
Quiet NaNs: Yes
Round to nearest even: Yes
Round to zero: Yes
Round to +ve and infinity: Yes
IEEE754-2008 fused multiply-add: Yes
Cache type: Read/Write
Cache line size: 64
Cache size: 16384
Global memory size: 2147483648
Constant buffer size: 65536
Max number of constant args: 8
Local memory type: Global
Local memory size: 32768
Kernel Preferred work group size multiple: 1
Error correction support: 0
Unified memory for Host and Device: 1
Profiling timer resolution: 232
Device endianess: Little
Available: Yes
Compiler available: Yes
Execution capabilities:
Execute OpenCL kernels: Yes
Execute native function: Yes
Queue properties:
Out-of-Order: No
Profiling : Yes
Platform ID: 6EC66514
Name: AMD FX(tm)-6100 Six-Core Processor
Vendor: AuthenticAMD
Driver version: 2.0 (sse2,avx,fma4)
Profile: FULL_PROFILE
Version: OpenCL 1.2 AMD-APP (938.2)
Extensions: cl_khr_fp64 cl_amd_fp64 cl_khr_global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int32_base_atomics cl_khr_local_int32_extended_atomics cl_khr_byte_addressable_store cl_khr_gl_sharing cl_ext_device_fission cl_amd_device_attribute_query cl_amd_vec3 cl_amd_printf cl_amd_media_ops cl_amd_popcnt cl_khr_d3d10_sharing
%username%
Драйвер поставил, а OpenCL для видюхи кто ставить будет?
Я бы предложил:
1. снести этот тормозной OpenCL на CPU (пользователям он все-равно не нужен, так лишь разработчикам для отладки).
2. вычистить остатки AMD драйверов (например, Driver Sweeper'ом).
3. установить 12.1 по новой. Обратить внимание на наличие OpenCL в этом драйвере, если нет доставить его ручками.
SmoothVideo Project → Эксплуатация SVP → GPU ускорение
Powered by PunBB, supported by Informer Technologies, Inc.