Главная/ Статьи/ Технологии мастеринга: максимайзеры. Часть 2
Технологии мастеринга: максимайзеры. Часть 2

Технологии мастеринга: максимайзеры. Часть 2

Автор: Алексей Лукин

Перегрузка между отсчетами

Подавляющее большинство максимайзеров — цифровые приборы. Действительно, в аналоге практически невозможно сделать «заглядывание вперед», и поэтому аналоговые пиковые лимитеры обречены либо на мгновенное время атаки (что приводит к изломам амплитудной огибающей), либо на пропуск некоторой перегрузки (клиппирование). Цифровые максимайзеры способны «заглядывать вперед» и заранее реагировать на атаку, за миллисекунды до наступления пика.

Рис. 1. Аналоговые и цифровые пиковые уровни могут не совпадать. Разница может составлять до 3 дБ

Цель большинства цифровых максимайзеров — не допустить превышения порога цифровой волной, то есть ограничить значения всех отсчетов сигнала величиной порога. Однако такое цифровое ограничение не обеспечивает отсутствие превышения порога в аналоговой волне, восстановленной по цифровому сигналу. Действительно, аналоговая волна, плавно осциллируя между дискретными отсчетами, может превышать уровень цифровых отсчетов на величину до 3 дБ (рисунок 1). Как это может сказаться на звуке?

Во-первых, может произойти перегрузка ЦАП. Обычно ЦАП используют передискретизацию — цифровое повышение частоты дискретизации сигнала. В этом случае восстановленные цифровые значения волны между отсчетами исходной цифровой волны могут переполнить разрядную сетку ЦАП (что часто и происходит). Таким образом, клиппирование «аналоговой» волны привело к искажениям звука еще до того, как сигнал стал аналоговым. Но даже если ЦАП правильно восстановил волну выше уровня 0 дБFS, то остальные компоненты аудиотракта (например, операционные усилители) могут оказаться не столь устойчивыми к перегрузкам.

Тест

Вот простой тест, позволяющий определить работоспособность функции устранения аналогового клиппирования у максимайзера. Сгенерируем в цифровом файле синусоиду с частотой, равной четверти частоты дискретизации, и начальной фазой 45° (рис. 1). Для такой синусоиды аналоговая волна превышает значения цифровых отсчетов на 3 дБ. Пропустим эту синусоиду через максимайзер. Установим порог как можно ниже. Если максимайзер не позволяет разогнать уровень цифровых отсчетов сколько-нибудь заметно выше, чем -3 дБ, то он правильно определяет пики аналоговой волны. Если же он привычно разогнал цифровые отсчеты до 0 дБ, то детектирование пиков в нем осуществляется по цифровой волне.

Оказывается, можно осуществить лимитирование в цифровом формате так, чтобы в восстановленной аналоговой волне также не содержалось превышений порога. Для этого достаточно с помощью передискретизации алгоритмически восстановить аналоговую волну и провести детектирование пиков не по цифровым отсчетам, а по аналоговой волне. Дальнейшее лимитирование цифровой волны осуществляется как обычно, но с использованием новой, «аналоговой» информации о пиках сигнала.

Традиционное средство для борьбы с проблемой аналогового клиппирования – это занижение параметра ceiling (коэффициента усиления после лимитирования) на доли децибела. Как теперь очевидно, такая мера совершенно недостаточна. Для реального аудио аналоговое превышение порога часто составляет 1…1,5 дБ, а не доли децибела.

Сглаживание амплитудной огибающей

Тест

Для иллюстрации этих искажений проведем следующий простой эксперимент. Возьмем любую аудиозапись и отфильтруем в ней все частоты выше 3 кГц. После этого пропустим запись через максимайзер. Установим порог так, чтобы лимитер не бездействовал, и будем слушать результат. Если мы выбрали максимайзер с разрывами или изломами амплитудной огибающей, то в записи будет слышен заметный треск (рис. 2).

Разрывы и изломы амплитудной огибающей — обычное явление для подавляющего большинства максимайзеров. Они приводят к соответствующим разрывам и изломам в форме волны выходного звука. В терминах спектра это означает, что спектр возникающих интермодуляционных искажений становится широким, охватывающим все частоты. При этом слышимость искажений многократно возрастает. Действительно, при гладкой амплитудной огибающей интермодуляционные искажения обычно группируются вокруг пиков в спектре сигнала, где они с большой вероятностью будут психоакустически замаскированы этими пиками. При наличии же изломов и разрывов амплитудной огибающей спектр искажений расширяется и может выйти за порог маскировки. Искажения становятся слышны как треск.

Рис. 2. Сонограмма треска, появляющегося в записи, после обработки максимайзером. Верхний отрывок был обработан максимайзером без сглаживания амплитудной огибающей. Снизу – тот же отрывок, но обработанный более точным максимайзером (и с большей агрессивностью)

Зачем мы отфильтровали все выше 3 кГц? Чтобы треск стал заметнее. Если бы мы не отфильтровывали ВЧ, то треск был бы тот же самый, только он бы несколько маскировался высокими частотами исходного звука.

Операция сглаживания амплитудной огибающей невозможна без «заглядывания вперед» (look-ahead). Рассмотрим еще раз, как реализуется функция look-ahead в приборах. Так как невозможно надежно предсказать сигнал по его прошедшим значениям, то функция look-ahead осуществляется с помощью небольшой задержки выходного сигнала относительно входного. Таким образом, при выдаче выходного сигнала, соответствующего моменту времени t, у лимитера, на самом деле, уже есть входной сигнал для моментов времени вплоть до t + T, где T – время задержки. (Это можно сравнить с каналом новостей, который ретранслирует другое новостное агентство с задержкой в 10 минут. В каждый момент времени сотрудники канала уже знают, что будет через 10 минут, и могут соответственно модифицировать выдаваемые зрителям новости, достигая лучшего качества материала за счет задержки).

Следует помнить, что задержка, вносимая лимитером, может быть в некоторых ситуациях нежелательной. Например, если в разрыв линейки пульта вставить лимитер, то эта линейка будет задержана по времени относительно других каналов, что может привести к искажению тембра при микшировании. К счастью, максимайзером обычно обрабатывается уже готовый микс в процессе мастеринга, и в этом случае задержка роли не играет. (О задержке следует помнить, когда требуется синхронизация сигналов в приложениях обработки в реальном времени. Если же обработка осуществляется не в реальном времени, то приложение, выполняющее обработку (host-приложение) чаще всего может скомпенсировать задержку, т. е. выровнять выходной сигнал максимайзера по времени. Обычно задержки, вносимые максимайзерами, невелики, до 10 мс).

Если же максимайзер, работающий в реальном времени, не вносит задержки в сигнал, то это значит, что он либо допускает превышения порога, либо его амплитудная огибающая — изломанная. Третьего не дано…

Руководствуясь будущими значениями пиковых уровней, лимитер может построить плавную амплитудную огибающую, начав ослаблять усиление заранее, до начала атаки во входном сигнале.

Советы по использованию максимайзеров

Максимайзер должен быть последним звеном в цепи мастеринга. После него осуществляется только снижение разрядности аудио (часто оно совмещено с максимизацией). Все остальные обработки и преобразования звука, в том числе преобразование частоты дискретизации, должны выполняться до максимизации уровня, поскольку они могут изменить пиковые значения звуковой волны и привести к клиппированию или неполному использованию динамического диапазона.

При настройке параметров максимайзера следует отталкиваться от уровня громкости фонограммы, который нужно получить. Установите порог максимайзера в соответствии с желаемым увеличением громкости, и после этого переходите к настройке агрессивности. Если заметны интермодуляционные искажения (например, хрип на басовых нотах), уменьшите агрессивность (например, увеличивая время восстановления). Если искажения незаметны — попробуйте увеличить агрессивность, чтобы уменьшить эффект проваливания громкости (pumping).

Если порог максимайзера уже очень низко, а громкости все равно недостаточно — обратитесь к другим приборам динамической обработки. Обработайте звук компрессором. Если даже после компрессора и максимайзера «разгон» не тот — попробуйте многополосный компрессор. Если и этого мало — проверьте, не превратилась ли уже фонограмма в розовый шум.

Лимитеры и максимайзеры легко могут «убить» микродинамику фонограммы. Если компрессия обычно является художественным приемом, то лимитирование — скорее, технологическим решением. А технологию лучше оставить для специалистов по мастерингу, которые чаще всего обладают более качественной аппаратурой и средствами контроля результата.

Сравнение качества максимайзеров

А теперь — обзор популярных максимайзеров, реализованных в виде программных модулей для компьютеров. Поскольку не существует единственного адекватного критерия сравнения максимайзеров, предлагается несколько возможных тестов, нацеленных на выявление особенностей и конструктивных недостатков максимайзеров.

В нашем обзоре участвуют следующие плагины:

  • Waves L1+, L2;
  • Voxengo Elephant HQ;
  • TC Native Limiter;
  • iZotope Ozone 2 Maximizer (Brickwall mode);
  • iZotope Ozone 3 Maximizer (Intelligent mode);
  • Sonic Foundry Wave Hammer;
  • DSP-FX Optimizer;
  • Steinberg PeakMaster;
  • DB Audioware Mastering Limiter;
  • встроенный лимитер из Nuendo 2;
  • встроенный лимитер VST Dynamics из Cubase SX 2;
  • встроенный Hard Limiter из Audition.

Сразу необходимо оговориться, что здесь рассмотрены не все существующие модели. Максимайзеры выбраны по двум параметрам: качество звука и популярность. Намеренно был исключен из тестирования популярный Timeworks Mastering Compressor, так как он не является максимайзером со строгим порогом срабатывания и пропускает клиппинг. Также не включен в сравнение Steinberg Loudness Maximizer, так как в большинстве режимов он намеренно вносит в сигнал сатурационные искажения.

Критерии сравнения

Как лучше всего сравнивать максимайзеры? Слушать их в работе. Попробуем предложить некоторые условия экспериментов для более высокой объективности сравнения при прослушивании. Но прежде всего обратимся к некоторым способам сравнения, и поясним их недостатки.

Например, в ряде публикаций описан следующий метод. Через максимайзеры пропускается тестовый звук из двух синусоид (тест интермодуляционных искажений). После этого по спектрограмме делается анализ гармонических и интермодуляционных искажений (под гармоническими искажениями, по всей видимости, понимается уровень гармоник только тестового тона с более высокой частотой). Все тестируемые максимайзеры приводятся к равным условиям: времени восстановления и порогам. Как мы уже знаем, равное время восстановления при равных порогах не обеспечивает одинаковой агрессивности максимайзеров. Поэтому выводы о качестве максимайзеров на основании уровней КГИ и КНИ, измеренных в данном тесте, не совсем справедливы.

Другой распространенный вид теста — приведение входной и выходной волн к одинаковой амплитуде и их вычитание. Такой тест популярен, когда хотят показать, как максимайзеры портят звук. Действительно, большая часть полученной волны равна нулю, но в тех местах, где происходило срабатывание максимайзера, прорываются сильные щелчки, треск и обрывки исходного аудио. Пожалуй, этот тест полезен только для того, чтобы определить моменты срабатывания максимайзера. О реальном звучании максимайзера он судить не позволяет, так же как такой «разностный тест» не позволяет судить, например, о системе шумоподавления. Заметность искажений нельзя оценить в отрыве от основного звука.

Рис. 3 (a, б). Уровень искажений максимайзера на разных частотах дискретизации некорректно определять по одному тестовому тону.

Еще один популярный тест определяет «наилучшую» частоту дискретизации, на которой максимайзер дает меньше всего искажений. Берется синусоида с частотой 1 кГц, пропускается через максимайзер на различных частотах дискретизации (44,1 и 96 кГц). По графикам спектров искажений (рис. 3а) делается вывод, что максимайзер на 96 кГц звучит гораздо чище, без искажений. Такие иллюстрации есть, например, в книге Боба Каца «Mastering Audio». На самом же деле меньшее количество искажений при частоте дискретизации 96 кГц — чистое совпадение для данного конкретного тестового сигнала. Все дело в том, что 96000 делится на 1000, а 44100 не делится на 1000. Поэтому амплитудный профиль данной синусоиды с частотой 1 кГц при частоте дискретизации 44,1 кГц имеет сложную форму, вынуждая максимайзер следовать его изгибам и вносить дополнительные гармоники. Если же взять синусоиду с другой частотой, скажем, 1260 Гц (кратную 44100), то для нее можно получить прямо противоположные результаты (рис. 3б).

На самом деле, уровень искажений максимайзеров действительно зависит от частоты дискретизации. Однако зависимость не всегда простая. Дело в том, что далеко не все приборы корректно адаптируют время атаки/восстановления к различным частотам дискретизации, и у них оказывается различная агрессивность. Но если не затрагивать вопросы агрессивности, то часто оказывается, что на более высоких частотах дискретизации уровень искажений приборов динамической обработки получается меньше (как на тестовых синусоидах, так и на реальных сигналах).

Для синусоидальных сигналов это объясняется тем, что при высокой частоте дискретизации амплитудный профиль оцифрованной синусоиды ближе к константе и максимайзеру не приходится следовать его изгибам и вносить искажения. Для реальных музыкальных сигналов это объясняется тем, что интермодуляционные искажения, возникающие при обработке, распределяются по более широкой полосе частот и часть искажений оказывается не слышна. (При меньших частотах дискретизации искажения, которые были бы в ультразвуке, отражаются в слышимую часть спектра, т. н. aliasing). В некоторых высококачественных приборах динамической обработки (например, Weiss), применяется технология double sampling, т. е. передискретизация цифрового сигнала перед динамической обработкой. Преимущества такой технологии для максимайзеров небесспорны, хотя она применяется, например, в плагине Voxengo Elephant HQ (и, возможно, приводит там к неточному следованию порогу). Однако применительно к компрессорам сообщается о предполагаемом улучшении качества звука.

Как же увеличить объективность тестирования? Мы предлагаем сравнивать звучание максимайзеров на реальном звуковом материале, выставляя одинаковые значения порога и добиваясь от тестируемых максимайзеров одинаковой агрессивности. Как добиться одинаковой агрессивности? Только измеряя RMS результирующего сигнала! Пусть первый максимайзер дал на выходе сигнал с RMS, скажем, -9,25 дБ, а второй максимайзер при тех же настройках выдал -9,89 дБ. Хоть разница и невелика, но это усредненная разница в громкости по всему звуковому фрагменту. Если учесть, что максимайзер работает только над малой частью фрагмента (там, где были превышения порогов), то на самом деле громкость реально ограниченных участков могла различаться очень заметно. Поэтому мы делаем вывод, что агрессивность сравниваемых максимайзеров при данных настройках разная, и меняем параметры (время восстановления) одного из максимайзеров так, чтобы RMS выходных сигналов сравнялись. Теперь максимайзеры работают с одинаковой эффективностью, и можно проводить сравнение на слух.

Обычно в первую очередь обращают внимание на наличие и заметность интермодуляционных искажений, на дрожание и провалы громкости (pumping), на треск и другие возможные дополнительные призвуки. Таким образом, когда все максимайзеры работают в равных условиях, выдавая сигнал одинаковой громкости, лучший из них выбирают на слух.

Если же желательно привести какие-то объективные численные данные, то можно проводить тесты интермодуляционных искажений и оценивать спектр и величину искажений (разумеется, добившись предварительно равной агрессивности максимайзеров).

На рис. 6 в первой части статьи приведено сравнение двух максимайзеров при двух различных значениях агрессивности. В пределах каждого рисунка агрессивность максимайзеров совпадает. По графикам интермодуляционных искажений видно, что пики искажений практически совпадают по величине, но ширина спектра искажений сильно различается. Поэтому заметность искажений будет гораздо выше для максимайзера с более широким спектром искажений.

Иногда делается предположение, что широкий спектр интермодуляционных искажений (например, у плагина Timeworks Mastering Compressor) символизирует работу специальных сатурационных алгоритмов, имитирующих ламповые искажения. К сожалению, это весьма далеко от действительности. Широкий спектр интермодуляционных искажений, показанных на графике, возникает из-за клиппирования, которое пропускается этим плагином, и искажения в этом случае не являются гармониками тестового сигнала. Каждая из таких «гармоник» состоит из нескольких близко расположенных интермодуляционных тонов. Кроме того, спектр ламповых искажений ценится именно тем, что в нем небольшое количество гармоник. В случае же с максимайзерами мы чаще всего имеем спектр с бесконечным медленно затухающим рядом гармоник, не особо напоминающим ламповые искажения даже по спектру, а по звуку больше напоминающим треск (рис. 2.)

Сводная таблица

В этой таблице приводятся данные о наличии у протестированных максимайзеров тех или иных возможностей (или отсутствии тех или иных недостатков). Я постарался учесть как можно больше объективных критериев, важных для качественного звука. Можно ожидать, что максимайзеры со сходными характеристиками будут звучать похоже. И хотя для подробного анализа звучания необходимо внимательное прослушивание конкретных приборов, опытному пользователю данная таблица позволит составить достаточно полное представление о звучании той или иной модели. В таблице отсутствуют те функциональные возможности, которые очевидны из документации (например, наличие тех или иных органов управления), внимание сосредоточено именно на особенностях реализации алгоритмов. Порядок алгоритмов в таблице не является однозначным рейтингом качества (хотя его можно рассматривать как приблизительный рейтинг).

Критерии сравнения:

  1. No clipping — отсутствие клиппирования.
  2. Full range — полное использование динамического диапазона (возможность максимизации со строгим порогом в 0 дБ).
  3. Look-ahead — возможность заглядывания вперед.
  4. Continuous env. — отсутствие разрывов в амплитудной огибающей.
  5. Smooth env. — сглаживание амплитудной огибающей, узкий спектр искажений.
  6. ARC — возможность автоматического контроля времени восстановления (auto release control).
  7. Adjustable ARC — возможность варьировать агрессивность при включенном режиме ARC.
  8. Analog detection — возможность детектирования пиков аналогового сигнала между цифровыми отсчетами.
 No clippingFull rangeLook-aheadContinuous env.Smooth env.ARCAdjustable ARCAnalog detection
TC Native L++
iZotope Ozone 2+++
DSP-FX Optimizer++/-++
DB Mastering Limiter++++
Cubase SX Dynamics++++
Nuendo Limiter++++
CEP Hard Limiting++++
SF Graphic Dynamics++++
Waves L1+++++++
Voxengo Elephant HQ+/--/++++++
Waves L2++++++
iZotope Ozone 3++++++++

Краткие выводы

Наилучшее качество демонстрируют максимайзеры, имеющие технологию автоматического контроля времени восстановления. Максимайзер Waves L2 фактически стал промышленным стандартом для высококачественной обработки. Он сочетает технологию ARC со сглаживанием амплитудной огибающей. Недостатки L2 в том, что из него почему-то была исключена функция детектирования «аналоговых» пиков, хотя эта возможность присутствовала в максимайзере Waves L1+, и в режиме ARC у него нет возможности регулирования агрессивности. Агрессивность L2 достаточно высока (и звучит он действительно громко), и при заметных уровнях ограничения начинают проявляться интермодуляционные искажения. Избавиться от них можно, только отказавшись от режима ARC и вручную установив высокое время восстановления.

Максимайзер Voxengo Elephant HQ комбинирует режим автоматического управления временем восстановления с возможностью регулировать агрессивность. О максимайзере есть хорошие отзывы,  существуют мнения, что Elephant в ряде случаев звучит лучше L2. Учитывая регулируемую агрессивность ARC, это вполне возможно. Но ему не хватает некоторых грамотных технических решений для достижения наилучшего звука. Так, например, обычно Elephant не полностью использует динамический диапазон, а в некоторых случаях, наоборот, пропускает небольшое клиппирование. Также там нет сглаживания амплитудной огибающей, что приводит к довольно широкому спектру искажений.

Максимайзер Intelligent Maximizer из iZotope Ozone сочетает в себе режим ARC с регулируемой агрессивностью, сглаживание амплитудной огибающей и возможность детектирования «аналоговых» пиков. Этот максимайзер можно рассматривать как расширение Waves L2 в сторону настраиваемой агрессивности и детектирования аналоговых пиков.

Заключение

Максимайзер — обязательный прибор любой студии мастеринга, оказывающий заметное влияние на окончательный звук фонограммы. Мы рассмотрели принципы действия максимайзеров и основные параметры, определяющие качество их работы. Простые тесты, приведенные в статье, позволят легко проверить качество любых максимайзеров.

#Назад в Статьи