Взято отюда
Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1 сообщение(ий)):
У вас нет прав чтобы видеть скрытый текст, содержащейся здесь.
|
Sandy Bridge | Quick Sync - секретное оружие
Вы когда-нибудь слышали, чтобы Intel застала AMD и nVidia врасплох на рынке графики? И всё же, движок Quick Sync оставался тайной, сокрытой в стенах Intel, вплоть до IDF 2010. Можете ли вы поверить, что впервые эта концепция появилась пять лет назад? В то время, первые Blu-ray приводы только начинали продаваться, знаменуя переход от видео низкого разрешения к контенту высокой чёткости (HD), а рынок мобильных систем рос быстрее сегмента настольных компьютеров.
В Intel поняли, что ПК был и остаётся единственной платформой для создания контента, и что неприемлемо, если редактирование видео отнимает все выходные. Именно тогда инженеры в Intel решили повысить производительность кодирования и декодирования в Sandy Bridge – решив, тем самым, проблемы создателей контента. Они создали конвейер обработки видео в формате выделенной логики с фиксированными функциями, которая служит двум целям - во-первых, обеспечивает достойную производительность, во-вторых, сохраняет энергопотребление на минимальном уровне.
Название Quick Sync логика с фиксированными функциями получила позднее. Это чисто маркетинговое название для функции ускорения кодирования и декодирования видео.
Наши постоянные читатели могут возразить, указав что AMD и nVidia уже ускоряют эти вещи при помощи CUDA и Stream (нынче именуемой APP). Это действительно так. Но обе компании используют общецелевое, в каком-то смысле стандартное, железо для увеличения производительности за пределы того, что может быть достигнуто чисто программным путём. И пока нам прививали привычку думать, что вычисления на общецелевом GPU и есть будущее, по крайней мере, альтернативное ограниченному параллелизму, реализуемому на центральном процессоре, мы забывали о том, что задачи о которых мы говорим здесь не могут исполняться также быстро или также эффективно (с точки зрения энергопотребления) в общецелевых блоках, если сравнивать их со специализированными.
Итак, в чём же суть? Мы знаем что видео – не важно, идёт ли речь о воспроизведении или о кодировании, по сути обыденная вещь. Выделение ядер процессора для этих целей их нагружает и требует большого количества энергии. Мы долгие годы наблюдали как много нужно для этого ресурсов в многочисленных обзорах процессоров, опубликованных на THG (достаточно вспомнить результаты замеров в MainConcept и HandBrake). Разработчикам программ приходилось колдовать над параллелизмом своих приложений, чтобы обработка видео в них происходила быстрее. А это означало больше загрузки, больше расходуемой энергии, больше выделяемого тепла, и так далее. Мы имеем ввиду, что обработка видео – один из самых ресурсоёмких сценариев тестирования, которым мы систематически нагружали новые процессоры.
Ответом Intel стало создание специального вычислительного блока в Sandy Bridge, который не занимается ничем другим, кроме видео. По словам доктора Хун Цзян, старшего инженера и главного медиа-архитектора Sandy Bridge, это решение было основано на концепции распространённости видео и связанных с его обработкой задач. Intel буквально поставила на то, что решить вопрос с обработкой видео важнее для большей части её клиентов, нежели потратить транзисторы на увеличение производительности в играх. Конечно, помогло и то, что работа с видео всегда была одним из козырей Intel. Инвестиции в Quick Sync идут гораздо дальше скромного выигрыша в 3D.
Sandy Bridge | Что делает Quick Sync?
QuickSync предназначен для двух основных задач: ускорения кодирования и декодирования видео.
Intel уже имеет достаточный опыт в области реализации ускорения декодирования видео. Существующие процессоры с интегрированной графикой могут справиться с воспроизведением MPEG-2, VC-1 и AVC. Однако, компенсация движения (наиболее сложная часть в конвейере декодирования) и фильтрация артефактов (loop filtering в VC-1 и AVC) происходит у них в блоках общего назначения, что "съедает" больше мощности, чем необходимо. В Sandy Bridge эта проблема решена перемещением всего конвейера декодирования в эффективный многоформатный кодек с фиксированными функциями. Добавлена и поддержка MVC для воспроизведения 3D Blu-ray. Масштабирование видео, подавление шумов, деинтерлейсинг (процесс создания одного кадра из двух полукадров чересстрочного формата для дальнейшего вывода на монитор), улучшение цвета оттенков кожи, управление цветопередачей, улучшение контрастности – за все эти функции отвечают специализированные блоки логики в графическом процессоре.
Для ускорения кодирования предусмотрена логика с фиксированными функциями, которая работает совместно с программируемыми исполнительными блоками. К исполнительным блокам (EU) прикреплён блок медиа-сэмплирования (Intel называет его сопроцессором), обеспечивающий работу алгоритма предсказания движения, дополняя программируемую логику. Задачи декодирования, решаемые в процессе перекодирования, проходят через тот же конвейер с фиксированными функциями, о котором уже шла речь, что приводит к росту производительности. Вы можете подавать на вход поток MPEG-2, VC-1 или AVC, и получать MPEG-2 или AVC на выходе.
Разработчики могут использовать Quick Sync по-разному, в зависимости от поставленных перед приложением задач. Возьмём в качестве примера CyberLink – их продукт PowerDVD 10 опирается только на ускорение конвейером декодирования видео. В отличие от него, приложение MediaEspresso использует больше возможностей – движок будет считывать файл, декодировать его, кодировать и превращать в выходной поток. Наконец, в приложении PowerDirector, предназначенном для видеомонтажа, новый конвейер будет полезен при пост-обработке, то есть при наложении эффектов и компоновке ещё до передачи потока на этап кодирования.
Sandy Bridge | Quick Sync против APP и CUDA
Мы использовали несколько приложений для воспроизведения контента (декодеров) и несколько приложений для конверсии (кодирования/перекодирования) видео для экспериментов.
Приложение CyberLink MediaEspresso может использовать все преимущества технологии AMD Stream (которая теперь называется APP) и nVidia CUDA API. По сравнению с компьютером без аппаратного ускорения, используя CUDA и APP можно получить заметный прирост производительности. Но Sandy Bridge, благодаря оптимизации MediaEspresso под Quick Sync, оказывается в совершенно другой весовой категории. Всего 22 секунды заняло преобразование почти 500 мегабайтного исходного видео в разрешение 1024x768 для проигрывания на планшете Apple iPad.
С MediaConverter 7 всё оказалась сложнее. Пререлизная версия была оптимизирована и под Quick Sync, и поддерживала ускорение с помощью AMD Stream, а вот видеокарту GeForce GTX 570 она не распознала. Тогда мы решили использовать текущую доступную демо-версию, но и в ней не смогли включить CUDA. Однако, полученные результаты показывают, что ускорение действительно включено. У приложения Arcsoft есть дополнительное преимущество в виде индикатора используемых ресурсов.
Полученные результаты очень интересны. Без ускорения, кодирование видео с профилем для Apple iPad прошло за 1:35, при этом загрузка процессора Core i7-2600K составила около 30%. После установки видеокарты nVidia, нагрузка выросла до 50%, но задача была выполнена почти на 20 секунд быстрее. С видеокартой Radeon HD 6870 нагрузка снизилась а производительность возрасла. Но включение оптимизации под Quick Sync впечатляет больше всего: задача была выполнена за 41 секунду, а ядра процессора почти не нагружались.
К сожалению, чтобы в полной мере ощутить преимущество от технологии Quick Sync, вам придётся использовать интегрированное графическое ядро Intel. Ни MediaEspresso, ни MediaConverter не могут определить наличие конвейера Intel после установки в компьютер дискретной видеокарты. Если вы работаете с контентом на игровом компьютере, Quick Sync вам не поможет.