Регулирование громкости – официальный подход

Статьи

21 июня 2024

Автор: Анатолий Вейценфельд

Часть 1

В середине 2000-х годов в мировой аудиоиндустрии, прежде всего той его части, которая относится к вещанию, произошли важные изменения.

Начался давно назревший переход от измерений динамических параметров звука по объективным энергетическим (мощностным) характеристикам к измерениям, основанным на свойствах слуха. Ведь, строго говоря, привычные стрелочные (волюметр) и цвето-сегментные индикаторы показывали звукорежиссеру не громкость (в научном значении этого термина), а электрический уровень сигнала, а это не одно и то же.

Поэтому в 2006 году организация ITU – International Telecommunicational Union (МСЭ, Международный союз электросвязи) приняла так называемую «Рекомендацию 1770», которая называлась «Алгоритмы измерения громкости звуковых программ и истинного пикового уровня звукового сигнала»

Начинается она следующим предисловием:

«Ассамблея радиосвязи МСЭ,

учитывая,

a) что современные методы цифровой передачи звука предоставляют чрезвычайно обширный динамический диапазон;

b) что использование современных цифровых методов производства и передачи звука обусловливает смешение монофонических, стереофонических и многоканальных форматов и что звуковые программы производятся во всех этих форматах;

c) что слушатели желали бы, чтобы субъективная громкость звуковых программ была единой для различных источников и типов программ;

d) что имеется множество методов измерения уровней громкости, но существующие методы измерений, используемые при производстве программ, не обеспечивают индикации субъективной громкости;

e) что для целей обмена программами важно использовать единый рекомендованный алгоритм объективной оценки субъективной громкости;

f) что будущие комплексные алгоритмы, базирующиеся на психоакустических моделях, могут обеспечить более точные объективные измерения громкости для широкого спектра звуковых программ;

g) что перегрузка цифрового носителя происходит скачкообразно и поэтому следует избегать даже кратковременной его перегрузки;

h) что пиковые уровни сигналов могут увеличиваться вследствие широко применяемых процессов, таких как фильтрация или уменьшение скорости передачи в битах;

j) что существующие методы измерений не отражают истинного пикового уровня, достигаемого цифровым сигналом, поскольку истинное пиковое значение может появляться в интервале между отсчетами;

k) что возможности обработки цифрового сигнала позволяют реализовать алгоритм, обеспечивающий оценку истинного пикового уровня сигнала с высокой точностью;

l) что использование алгоритма индикации истинного пика сделает возможным точную индикацию запаса по уровню между пиковым уровнем цифрового звукового сигнала и уровнем срезания пиков,

рекомендует

1 применять, в случае необходимости объективного измерения громкости звукового канала или программы в целях содействия доставке программ и обмена ими, алгоритм, описание которого содержится в Приложении 1;

2 обеспечивать возможность использования алгоритма, описание которого содержится в Приложении 1, в качестве основы для методов индикации громкости программы при производстве и окончательном монтаже программ;

3 применять, в случае необходимости индикации истинного пикового уровня цифрового звукового сигнала, метод измерений, в основу которого положены руководящие принципы, изложенные в Приложении 2, или метод, обеспечивающий аналогичные или лучшие результаты,

ПРИМЕЧАНИЕ 1. – Пользователей следует предупреждать, что измеренная громкость является оценкой субъективной громкости и содержит определенную погрешность, обусловливаемую свойствами слушателей, звукового материала и условиями прослушивания.

далее рекомендует

1 продолжить проведение работ, направленных на расширение алгоритма, описание которого содержится в Приложении 1, для обеспечения индикации кратковременной громкости;

2 учитывать возможную необходимость обновления настоящей Рекомендации в случае, если новые алгоритмы измерения громкости будут существенно превосходить по качеству работы алгоритм, описание которого содержится в Приложении 1».

Далее документ в упомянутом выше Приложении 1 подробно описывает этот самый алгоритм. Создатели Рекомендации были совершенно правы, говоря о возможном обновлении, и в последующие годы она действительно была несколько раз обновлена, и на настоящий момент действует пятая версия Рекомендации от 2023 года.

В развитие темы МСЭ выпустил следующий документ ITU-1771, посвященный требованиям к приборам, измеряющим громкость и истинный пиковый уровень.

Вступление к этому документу декларирует:

Ассамблея радиосвязи МСЭ,

учитывая,

a) что ни среднеквадратический измеритель уровня, ни обычный квазипиковый измеритель уровня не обеспечивают точной индикации субъективной громкости;

b) что ни среднеквадратический измеритель уровня, ни обычный квазипиковый измеритель уровня не обеспечивают точной индикации истинного пикового уровня цифрового сигнала;

c) что слушатели, возможно, желают, чтобы субъективная громкость аудиопрограмм была аналогичной для различных источников и типов программ;

d) что истинный пиковый уровень цифрового сигнала может превышать максимальное выборочное значение;

e) что Рекомендация МСЭ-R BS.1770 «Алгоритмы для измерения громкости и истинного пикового уровня звука аудиопрограмм» устанавливает порядок измерения громкости и истинных пиковых уровней программ;

f) что режим обработки цифрового сигнала позволяет применить эти алгоритмы в недорогих измерительных устройствах;

g) что перед радиовещательными организациями стоят определенные требования, которые должны быть удовлетворены с помощью приборов, используемых для индикации громкости программ и истинного пикового уровня,

рекомендует,

1 чтобы измерители звука, используемые для измерения громкости программ и/или индикации истинного пикового уровня, для того чтобы помочь избежать перегрузки цифровых звуковых сигналов, удовлетворяли требованиям, указанным в Приложении 1.

(имеется в виду Приложение 1 уже к цитируемой Рекомендации 1771, а не к предыдущему документу 1770 – прим. авт).

В России новые способы регулирования громкости сигналов телерадиовещания были внедрены в 2015 году по Постановлению Правительства РФ, в связи с чем было выпущено специальное Руководство, утвержденное приказом Министерства связи и массовых коммуникаций Российской Федерации.

И вот прошло 9 лет, и тем не менее до сих пор многие работающие со звуком слабо ориентируются в вопросах регулирования громкости и новых подходах к динамике. Особенно проблема усилилась с развитием интернет-вещания, подкастинга и стриминговых сервисов. Многие полагают, что эта сфера вещания вовсе не регулируется техническими нормами. Разумеется, это не так, хотя глобальные платформы видеохостинга не публикуют свои технические нормативы в открытом доступе.

Поэтому есть смысл вновь опубликовать (в некотором сокращении) то самое Руководство с тем, чтобы те, кто практически связан с вопросами подготовки программ и вещания, могли ознакомиться исходными регулирующими документами.

Практическое руководство в области нормирования громкости звуковых сигналов в телерадиовещании в Российской Федерации

1. Методология измерений громкости в «режиме EBU» в целях нормализации уровня громкости рекламы и прерываемой ею теле- или радиопрограммы

Измеритель громкости должен предоставлять возможность работать в «Режиме EBU» (EBU mode). При использовании «Режима EBU» измеритель должен соответствовать требованиям, приведенным в этом документе, а также в рекомендациях ITU-R BS-1771 и EBU Tech3341. Таким образом, специалист может использовать измерители громкости разных производителей с минимальными расхождениями результатов измерений, вызванными разной терминологией, шкалами и методами измерения.

Спецификация измерителя громкости при работе в «Режиме EBU» не касается деталей реализации измерителя в части графических или пользовательских интерфейсов.

1.1 Три шкалы времени

В «Режиме EBU» определены три временные шкалы:

Минимальная по времени шкала называется «Мгновенная», сокращенно «M».
Временная шкала для измерения кратковременной громкости называется «Кратковременная», сокращенно «S».
Временная шкала для измерения средней (интегральной) громкости называется «Интегральная», сокращенно «I», рассчитывается как усредненное значение с момента обнуления значений измерительного прибора.

В «эфирном измерителе» с «Режимом EBU» должны быть все три шкалы времени, необязательно отображаемые одновременно. («Эфирный измеритель» – прибор измерения громкости, который может использоваться при работе в прямом эфире). «Неэфирный» измеритель громкости (специализированное программное обеспечение), работающий только с файлами и имеющий в своей реализации неполный набор из указанных выше шкал, также может считаться совместимым с «Режимом EBU», если эти шкалы удовлетворяют требованиям данного режима. Измеритель громкости должен иметь возможность отображать максимальное значение Мгновенной громкости. Это значение обнуляется при сбросе измерений Интегральной громкости.

1.2. Параметры измерений, баллистика (инерционность) измерителя

Во всех случаях измерение производится согласно ITU-R BS.1770, EBU R 128.

Параметры измерения для «Режима EBU» следующие:

При измерении Мгновенной громкости используется «скользящее временное окно» длительностью 0,4 с. Измерение не гейтируются (Гейтирование в измерителях громкости используется для отсечения значений ниже заданного порога. «абсолютное гейтирование» исключает из результатов измерения все значения ниже -70 LUFS. «Относительное гейтирование» исключает все значения, которые ниже средней громкости на 10 LU).
При измерении Кратковременной громкости используется «скользящее временное окно» длительностью 3 секунды. Измерения не гейтируются. Частота обновления для «эфирных измерителей» не менее 10 Гц.
При измерении Интегральной громкости используется «скользящее» временное окно» длиной 0,4 с. Гейтирование измерений производится согласно ITU-R BS.1770. Частота обновления для «эфирных измерителей» не менее 1 Гц.

Минимальный функционал измерителя громкости, работающего в «Режиме EBU», должен позволять:

начинать/приостанавливать/продолжать измерение Интегральной громкости одновременно с Диапазоном громкости, т.е. переключать измеритель между состояниями «работы» и «ожидания»;
сбрасывать измерение Интегральной громкости и Диапазона громкости одновременно, независимо от того, находится ли измеритель в состоянии «работы» или «ожидания».

1.3 Гейтирование измерений

При измерении Интегральной громкости применяется функция гейтирования с использованием двух пороговых значений:

абсолютного порога на уровне -70 LUFS;
относительного порога, который на 10 дБ ниже уровня, измеренного после применения первого гейтирования.

1.4. Диапазон громкости (Loudness Range)

Параметр Диапазон громкости (сокращенно LRA) показывает изменение громкости на протяжении программы. На основании полученного значения определяется, насколько необходимо изменить динамический диапазон программы. В случае, если значение Диапазона громкости программы больше установленных величин, то необходимо осуществить его сжатие.

При этом допустимое значение Диапазона громкости зависит от вида контента: (например, для классической музыки возможен максимально допустимый диапазон, а для Интернет-вещания радиостанции – минимальный).

Диапазон громкости дополняет измерение Интегральной громкости. Вычисление Диапазона громкости проводится согласно EBU Tech Doc 3342.

Диапазон громкости измеряется в единицах «LU». 1 LU эквивалентно 1 дБ.

Измеритель в «Режиме EBU» должен иметь возможность вычислять Диапазон громкости звукового сигнала одновременно с измерением Интегральной громкости. Вычисленное значение Диапазона громкости обнуляется при сбросе измерения Интегральной громкости.

Измеритель в «Режиме EBU» должен предоставлять возможность включать и выключать отображение значения Диапазона громкости.

1.5 Единицы измерений

Рекомендуется использовать следующие названия и единицы измерения:

Относительное измерение (например, относительно опорного уровня или Диапазона громкости): xx.x LU;
Абсолютное измерение (относительно полной цифровой шкалы): xx.x LUFS.

1.6. Шкалы и диапазоны

На дисплее измерителя в «Режиме EBU» показания могут отображаться в виде числовых значений или в виде показаний на шкале. Однако если показания отображаются на шкале, она должна соответствовать следующим требованиям: мелкомасштабная шкала, которая предложена в рекомендации ITU-R BS.1771 (шкала с диапазоном 30 LU, от -21 LU до +9 LU) в «Режиме EBU» должна иметь диапазон значений от -18 LU до +9 LU. Кроме того, в определённых случаях может понадобиться шкала с более широким диапазоном, поэтому измеритель должен предоставлять возможность отображать альтернативную шкалу с удвоенным диапазоном от -36 LU до +18 LU.

Шкала измерителя должна предоставлять возможность отображать значения в единицах LUFS (которые условно можно назвать абсолютными) или шкалу с альтернативной нулевой точкой, соответствующей -23 LUFS (0 LU=-23 LUFS), в этом случае шкала будет отображать относительные значения громкости в единицах LU.

Измеритель с «Режимом EBU» должен иметь две шкалы, а их отображение выбирается пользователем:

диапазон от -18.0 LU до +9.0 LU (от -41.0 LUFS до -14.0 LUFS), называется «EBU +9 scale».
диапазон от -36.0 LU до +18.0 LU (от -59.0 LUFS до -5.0 LUFS), называется «EBU +18 scale».

«EBU +9 scale» должна использоваться по умолчанию.

1.7 Требования к дисплею

Физические характеристики измерителя громкости, такие как размер, цвет и дизайн, не входят в спецификацию «Режима EBU».

Измеритель в «Режиме EBU» должен использовать точность отображения максимум до 1 десятичного знака во всех числовых показаниях громкости (например, Интегральная громкость или Диапазон громкости).

Отображение Интегральной громкости должно быть в единицах LU или LUFS. При переключении абсолютной и относительной шкалы единица отображения Интегральной громкости должна переключаться соответственно.

Единица, LUFS или LU, должна отображаться для всех значений и шкал постоянно.

«Режим EBU» не определяет, какую Интегральную громкость должен показывать измеритель, пока не имеется достаточного объема входных данных для отображения достоверного результата.

1.8 Калибровка, установка, соответствие и точность

Калибровка и установка:

Для базовой калибровки и установки уровня сигнала рекомендуется использовать синусоидальный стереосигнал 1 кГц (подается в фазе одновременно в оба канала), с пиковым уровнем -18 dBFS. Измеритель должен показывать -18.0 LUFS.

Примечание: В связи с тем, что частота 1 кГц находится на скате частотной характеристики предварительного фильтра, применяемого в алгоритме измерения громкости, к точности частоты тест-сигналов и к технической реализации предварительного фильтра предъявляются повышенные требования. Ошибка в частоте тона 1 кГц может дать результат, отличный от ожидаемого.

Минимально необходимый набор калибровочных тестов:

Измеритель громкости в «Режиме EBU», который не прошел минимальный набор калибровочных тестов, не может считаться соответствующим требованиям для работы в «Режиме EBU». В то же время измеритель, прошедший минимальный набор калибровочных тестов, не обязательно обеспечивает достаточную точность измерений по всем параметрам.

Таблица 1: Тест-сигналы

№ теста	Тест-сигнал	Ожидаемый ответ и допуски
1	Стереосинусоидальный, 1000 Гц, -23.0 dBFS (пиковый уровень на канал); подается синфазно в оба канала одновременно; длительность 20 с	M, S, I = -23.0 ±0.1 LUFS M, S, I = 0.0 ±0.1 LU
2	Как № 1, -33.0 dBFS	M, S, I = -33.0 ±0.1 LUFS M, S, I = -10.0 ±0.1 LU
3	Как № 1, перед ним стереосинусоидальный сигнал -40 dBFS 20 с, за ним стереосинусоидальный сигнал -40 dBFS 20 с	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU
4	Как № 3, перед ним стереосинусоидальный сигнал -75 dBFS 20 с, за ним стереосинусоидальный сигнал -75 dBFS 20 с	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU
5	Как № 3, но с уровнями 3 тонов -26 dBFS, -20 dBFS и -26 dBFS соответственно	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU
6	Синусоидальный с каналами 5.0, 1000 Гц, длительность 20с, со следующими пиковыми уровнями каналов: -28.0 dBFS в L и R-24.0 dBFS в C-30.0 dBFS в Ls и Rs	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU
7	Аутентичная программа 1, стерео, сегмент программы с узким диапазоном громкости (NLR); похожий по жанру на рекламу/анонс	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU
8	Аутентичная программа 2, стерео, сегмент программы с широким диапазоном громкости (WLR); похожий по жанру на фильм/драму	I = -23.0 ±0.1 LUFS I = 0.0 ±0.1 LU

*- Таблица 1 определяет предварительный набор тестов; №7 и 8 ожидают производства подходящего материала без авторских прав.

Во всех вышеуказанных тестах полученный результат не меняется, если тест-сигнал повторяется один или более раз по всей длине. Перед каждым измерением показания измерителя необходимо сбрасывать (обнулять).

Тест-сигналы для Диапазона громкости более полно описаны в EBU Tech Doc 3342.

1.9 Разное

Рекомендация ITU-R BS.1770-1 не включает в измерение низкочастотный канал LFE (Low Frequency Effect), используемый при многоканальном вещании. Европейский Вещательный союз в настоящее время рекомендует при включении канала LFE в измерение громкости учитывать его на +10 dB для компенсации того факта, что усиление воспроизведения канала LFE на 10 dB выше широкополосн х.

2. Рекомендации по выбору значений, к которым необходимо привести уровень громкости звукa

В соответствии c Рекомендацией EBU R 128 для характеристики звукового сигнала следует внедрить и использовать следующие параметры:

Программная Громкость (Programme Loudness); Мгновенная громкость (Momentary Loudness); Кратковременная громкость (Short-Term Loudness); Диапазон громкости (Loudness Range); Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak level).

Громкость программы (Programme Loudness) должна быть нормализована до целевого уровня -23,0 LUFS, с допустимым отклонением ±0,5 LU. В случае, когда точная нормализация уровня Громкости программы до целевого уровня практически недостижима (например, при прямой трансляции), допускается отклонение от значения целевого уровня ±1.0 LU.

Уровень Громкости программы должен быть измерен как единое целое, без выделения специфических элементов, таких как речь, музыка или звуковые эффекты.

Параметры Мгновенная громкость (Momentary Loudness) и Кратковременная громкость (Short-Term Loudness) используются в дополнение к Громкости программы (Programme Loudness) для контроля текущей динамики программы.

Диапазон громкости (Loudness Range) измеряется в LU, показывает динамический Диапазон громкости программы.

Параметр Диапазон громкости применяется вещателями для поддержания неизменного динамического звукового диапазона в программах одного жанра, а также для соблюдения технических ограничений оборудования на протяжении всей вещательной цепи, включая пользовательские устройства.

Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak level) в тракте формирования программы не должен превышать -1 dBTP.

Примечание: не следует путать Максимально допустимый уровень истинных пиков с текущим значением Истинного пикового уровня программы. Значение текущего Истинного пикового уровня программы может быть любым, но не превышающим максимально допустимое.

Технические требования к громкости программ на этапах подготовки и в файловых средах
Громкость программы (Programme Loudness)	-23 (±0,5) LUFS
Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak level) (Рекомендуется поддерживать мгновенный пиковый уровень не более -3 dBTP)	-1 dBTP
Технические требования к громкости программ прямого эфира
Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak level) (Рекомендуется поддерживать мгновенный пиковый уровень не более -3 dBTP)	-1 dBTP
Рекомендуемые отклонения значений Кратковременной громкости (Short-term loudness) *	-28 LUFS…-20 LUFS

* В отдельных случаях, обусловленных художественным замыслом авторов передачи, допускается наличие фрагментов с более низким уровнем значений Кратковременной громкости.

Технические требования к громкости программ хронометражом менее 30 секунд
Громкость программы (Programme Loudness)	-23 LUFS
Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak level)	-3 dBTP

Вещатели и производители программ самостоятельно выбирают организационные и технические решения для нормализации уровня громкости выходного сигнала согласно вышеуказанным параметрам.

3. Организационные мероприятия для решения задачи нормализации уровня громкости выходного сигнала согласно рекомендациям ITU-RBS.1770 и EBUR128 путем приведения уровня звука к заданному целевому значению

Данный подход подразумевает нормализацию уровня Громкости программ, анонсов и рекламы до целевого уровня -23 LUFS. Допустимое отклонение значения уровня Громкости программы от номинального ±0.5 LU. В случаях, когда сложно предсказать уровень громкости, например при прямых трансляциях, допускается отклонение ±1 LU.

Для реализации предлагаемого подхода рекомендуется:

Установить значение -23 LUFS в качестве целевого уровня громкости для производителей рекламы, программ. Для достижения целевого уровня громкости рекомендуется использование измерителей громкости в «Режиме EBU» R 128 на средствах нелинейного монтажа.
Подготовить медиаматериал с нормализацией по громкости до целевого уровня, для чего рекомендуется использовать измерители громкости в «Режиме EBU» R 128, а также использование программных модулей для расширения возможностей нормализации контента.
Осуществлять подготовку и предоставление рекламодателем рекламного материала, нормализованного до целевого уровня громкости -23 LUFS.
Рекомендуется установка измерителя громкости, работающего в «Режиме EBU» R 128, на станцию нелинейного монтажа, где происходит подготовка рекламных материалов, и/или установка программного модуля нормализации медиаматериалов в отложенном времени с заданными параметрами в автоматическом и полуавтоматическом режиме.
Внедрить автоматические или полуавтоматические системы нормализации громкости программ до целевого уровня в базе медиафайлов, с возможностями выбора стратегий нормализаций для различного материала, уже имеющегося в наличии у вещательной организации.
На данном этапе необходима установка автономных систем нормализации, обучение сотрудников анализу материала и выбора ими оптимального режима работы такой системы для каждой конкретной программы.
Обеспечить инструментальный контроль громкости во время работы звукорежиссера на выпускающем тракте теле-, радиоканала.
На данном этапе необходима установка «на выпуске» соответствующих измерителей, работающих в «Режиме EBU» R 128 на конечной точке выходного тракта телеканала, с возможностью контроля звукорежиссером (звукоинженером). Кроме того, необходимо обучение звукорежиссёра (звукоинженера) работе с новым инструментом контроля, получение опыта в нормализации уровня громкости до целевого уровня с поддержанием художественного замысла звукового сопровождения.
Установить автоматический звуковой процессор нормализации громкости на выходном тракте аппаратно-студийного комплекса (АСК).
Данный этап включает в себя установку в тракт вещателя на выходе АСК звукового процессора (работающего согласно рекомендациям EBU R 128) и его точную настройку. Возможно реализовать интеграцию системы автоматизации вещания с процессором нормализации громкости через систему планирования эфира и базу медиафайлов. Для этого необходимо наличие метаданных о типе программы (описывающих требуемую стратегию нормализации или особенности звукового сопровождения), далее эти данные необходимо внедрить через систему планирования эфира в расписание системы автоматизации как вторичные события для управления сохраненными пользовательскими настройками звукового процессора через интерфейс управления. Также возможны другие варианты реализации управления сохраненными пользовательскими настройками процессора на основании описания вещаемых программ, например вручную, по расписанию (актуально для новостных передач).
Обеспечить контроль уровней интегральной громкости у агрегаторов сигнала.
Для реализации данного этапа необходима установка оборудования автоматического контроля интегральной громкости звукового сопровождения у агрегаторов сигналов вещателей. Подобное оборудование настраивается на формирование служебных сообщений/отчетов по заданному алгоритму, например, превышение установленного целевого уровня громкости более N раз в час. Кроме того, установка подобного оборудования у агрегаторов сигналов помогает максимально эффективно отслеживать разницу в уровнях громкостей различных телеканалов и радиостанций.
Обеспечить контроль громкости в сети распространения сигнала.

Применение данного подхода позволяет решить следующие задачи:

устранение акустического дискомфорта у телезрителей или радиослушателей, связанного с резким изменением громкости между программами и рекламой/анонсами, а также между различными программами;
устранение разности звуковых уровней громкости между телеканалами, осуществляющими вещание в цифровом и аналоговом форматах;
упрощение международного программного обмена и организации международных прямых трансляций;
использование единого подхода к измерению и управлению громкостью при производстве и распространении программ.

4. Технические решения нормализации громкости звука на всех этапах производства и распространения рекламы и телерадиопрограмм

4.1 Этап производства и постпроизводства

Нормализация громкости на этапах производства и постпроизводства предполагает два подхода.

Первый подход является более актуальным на начальном этапе переходного периода и полезен при работе на «прямых эфирах». При этом подходе существующие измерители, лимитеры и методы микширования сохраняются, а уровневый сдвиг осуществляется на выходе звукового пульта для достижения целевого уровня в -23 LUFS. Измеритель громкости, размещенный после звукового пульта, дает возможность звукорежиссёру точно оценить уровень сдвига. Рекомендуется использование измерителя громкости параллельно с традиционными измерителями (обычно квазипикового QPPM) для понимания новых процессов нормализации громкости.

Для программ, подготовленных на постпроизводстве (post-production), существует возможность довольно точно определить и выполнить необходимый уровневый сдвиг, измеряя программу целиком за один проход. Точное достижение целевого уровня может представлять некоторые трудности при прямых трансляциях. Поэтому отклонение от целевого уровня в пределах ±1.0 LU является приемлемым для программ, где точная нормализация до целевого уровня -23 LUFS практически не достижима.

При использовании описываемого подхода для нормализации уровня (с учетом существующих методов нормализации) существует вероятность в постоянной необходимости сдвигать усиление в отрицательную сторону (уменьшать усиление). В связи с этим дополнительных действий по снижению динамического диапазона и/или ограничения Максимального уровня истинных пиковых значений не требуется. Потенциальное ослабление в подавляющем большинстве случаев является также причиной того, почему решение с использованием метаданных не рекомендуется применять для данного подхода.

Второй подход заключается в непосредственной нормализации звукового сигнала (что является предпочтительным). После предварительных измерений и периода тестирования преимущества нового подхода к нормализации громкости станут очевидными. Станет возможным, например, увеличение динамического диапазона для спортивных программ, где шум толпы усиливает впечатление от игры на зрителя или слушателя. В студии при наложении голоса за кадром (по творческому замыслу) часто применяют компрессию звука (следовательно, отношение громкости к пиковым значениям будет ниже), добиваясь лучшего баланса по отношению к более динамичному исходному материалу. После установки уровней отдельных сигналов и постоянного мониторинга усиления, звукорежиссер может переключиться на режим сведения аудиоматериалов «на слух». Отслеживая уровень Моментальной или Кратковременной громкости, в том числе контролируя средний уровень громкости (Интегральную громкость), можно удостовериться, что общий уровень при микшировании стремится к целевому.

Используя измеритель с числовым отображением значения Интегральной громкости («I») с точностью до одного десятичного знака или с графическим дисплеем того же разрешения, можно предсказать характер изменения громкости и принимать в случае необходимости соответствующие меры. Это должно происходить плавно, так как слишком резкие изменения в большинстве случаев неприемлемы с художественной точки зрения. При принятии Максимально допустимого уровня истинных пиковых значений -1 dBTP снижается вероятность достижения предельного ограничения (защитный лимитер, настроенный на -9 dBFS, не дает превысить это значение).

Наиболее важными для однородного субъективного восприятия громкости являются звуки «переднего плана» (например, речь, музыка или ключевые звуковые эффекты). Отдельные звуковые элементы довольно сильно отличаются как по уровню громкости, так и по уровню пиков. Например, звон двух бокалов имеет высокий пиковый уровень, но очень низкий уровень громкости. С другой стороны, динамически сжатая музыкальная рок-композиция имеет уровень громкости почти одинаковый с пиковым уровнем. Если выравнивать эти два сигнала по их пикам, рок-композиция будет гораздо громче звона бокалов. Из указанного примера видно, что не следует эти два сигнала микшировать с равной громкостью. Уровень микса всегда является индивидуальным художественным решением, но визуализация измерения громкости может помочь звукорежиссеру. Рекомендуется вначале устанавливать уровни с некоторой осторожностью, так как психологически легче постепенно добавлять уровень интегральной громкости во время микширования, чем убавлять. Обычно небольшое повышение громкости в ходе программы драматургически более естественно, а изначально «защитная» стратегия оставляет звукорежиссёру больше возможностей в случае неожиданных или непредсказуемых изменений в сигнале.

После завершения измерения громкости программы возможны два сценария:

точное достижение целевого уровня (-23.0 LUFS);
отклонение от целевого уровня в любую сторону.

Для вещания в прямом эфире наиболее вероятен второй сценарий. Если фактический уровень громкости находится в пределах допуска ±1.0 LU, то дальнейших действий не требуется. Если уровень выходит за эти пределы из-за непредсказуемого характера программы или редко встречающихся элементов переднего плана, то меры по нормализации таких случаев могут приниматься позже, путем использования процессоров громкости, которые постепенно (без резких изменений) скорректируют интегральный уровень громкости таких программ.

Изменение должно производиться плавно, для того чтобы не повредить внутреннюю динамику программы. Должна быть возможность использования различных предустановок на процессоре громкости для различного типа программ (прямых эфиров и записанных передач). Должна быть возможность обхода установленных по тракту звуковых процессоров для тех программ, у которых параметры громкости находятся в пределах допуска. Такой обход станет нормальным, когда громкость большинства программ будет приведена к целевому уровню.

На стадии постпроизводства существует большая вероятность достичь порога целевого уровня из-за самого характера рабочего процесса с возможностью изменения микса и уровней громкости. Кроме того, на данной стадии обычно бывает достаточно времени на полное интегральное измерение всей программы по завершении ее создания, а также на коррекцию усиления. В производстве на базе файлов эта коррекция может выполняться быстрее реального времени.

Часто могут возникать ситуации, когда микширование в постпроизводстве выполняется аналогично действиям при прямых эфирах, т.е., например, когда осуществляется непосредственная запись «на лету» в случае закадрового озвучивания. В ту же категорию попадает процесс перезаписи 1:1 с пленки с одновременной регулировкой громкости. Эти ситуации больше похожи на производство прямых программ и требуют соответствующего подхода. В переходный период к нормализации громкости вышеупомянутые процессоры громкости будут полезны вещателям для адаптации к системе регулирования уровней громкости и фиксации возможных выбросов. Вещателям, а также звукорежиссерам рекомендуется как можно реже использовать эти процессоры в своей работе, т.к. интегральный уровень громкости программ все чаще будет находиться в допустимых пределах.

Точный сценарий перехода, график и план внедрения различны для каждого вещателя.

Так как расширяются динамические возможности, работа с нормализацией громкости в рамках первого подхода также подразумевает контроль над значением Диапазона громкости. Это важно для обеспечения соответствующего сигнала для целевой аудитории и каналов распространения. Несмотря на то, что в производстве и постпроизводстве может быть сделан «общий» микс с относительно высоким значением Диапазона громкости и Максимально допустимым уровнем истинных пиковых значений -1 dBTP, другие платформы распространения могут требовать меньшее значение Диапазона громкости и меньшие Максимально допустимые уровни истинных пиков при сохранении уровня Громкости программы -23 LUFS.

С параметром Диапазон громкости теперь можно определять необходимые меры для потенциальной динамической компрессии программы, чтобы вместить ее в окно допуска аудитории или платформы распространения. На практике общая низкоуровневая компрессия может дать удовлетворительные результаты. Низкий порог (< -40 dBFS) и умеренный коэффициент сжатия (1:1.2 — 1:1.5) гарантируют однородную компрессию всего диапазона сигнала. В зависимости от исходного уровня громкости сдвиг до целевого уровня -23 LUFS может производиться параллельно путем регулировки компенсирующего усиления компрессора.

Рис 1. Пример для обработки Диапазона громкости (LRA) с компрессией с низким порогом (-50 dBFS) и умеренным коэффициентом компрессии (1:1.5)

Производство и постпроизводство рекламы и анонсов

При производстве и постпроизводстве рекламы и анонсов как отдельного жанра программ продолжительностью менее 30 секунд необходимо применять несколько иной подход. Для контроля динамики рекламного материала в рамках идеологии нормализации громкости, где существует опасность внезапных резких расхождений громкости (громкая реклама после долгого периода низкоуровневых сигналов чуть выше порога гейтирования в программе), параметр Диапазон громкости не подходит, так как его вычисление основано на значениях кратковременной громкости (интервал 3 секунды).

Следовательно, для очень коротких элементов имеется слишком мало точек отсчета для вычисления корректной величины Диапазона громкости. Альтернативой является использование Максимального мгновенного уровня громкости (Maximum Momentary Loudness Level) или Максимального кратковременного уровня громкости (Maximum Short-term Loudness Level). Эти параметры могут эффективно использоваться для ограничения пиков громкости, особенно для коротких элементов (<30 сек). Максимальным значением Мгновенного уровня громкости является -15 LUFS, а для Кратковременного уровня громкости – минус 20 LUFS. Для программ этого жанра, состоящих только из фоновых или творчески задуманных низкоуровневых звуков, допускается использовать уровень громкости ниже целевого. Это согласуется с применяемой ранее и предлагаемой в настоящих Рекомендациях практикой ограничения максимального уровня пиков и не приводит уровень громкости всей программы к этому максимуму.

Программы, имеющие интегральный уровень громкости ниже целевого уровня, требуют особого внимания для гарантии прохождения автоматических процессов нормализации без повреждений. Такие программы должны быть скорее исключением, а не правилом.

(Продолжение следует…)

Назад в Статьи