Регулирование громкости – официальный подход. Часть 2
Автор: Анатолий Вейценфельд
Продолжаем знакомиться с Практическим руководством в области нормирования громкости звуковых сигналов в телерадиовещании в Российской Федерации. Раздел №4 называется «Технические решения нормализации громкости звука на всех этапах производства и распространения рекламы и телерадиопрограмм».
Пункт 4.1, который называется «Этап производства и постпроизводства», был изложен в первой части публикации. В этой части излагаются в сокращении и некотором адаптационном редактировании (для облегчения понимания широким кругом читателей) последующие разделы документа.
4.2. Этап агрегации контента
Поскольку в современном телерадиовещании все активнее используются файловые рабочие процессы, на этом этапе также необходимо применять технологию нормализации громкости. Базовый принцип остается тот же: рекомендуется нормализация громкости и контроль динамического диапазона источника, особенно для вновь создаваемых программ, анонсов и рекламы. Тем не менее, поскольку метаданные являются неотъемлемой частью систем, обрабатывающих файлы, можно использовать решения, опирающиеся на их изменение.
Медиафайл может поступать через процесс загрузки, передачи из внешнего сервера или из файлового архива. Нормализацию громкости для систем, обрабатывающих файлы, можно реализовать, например, используя программное обеспечение с соответствующим алгоритмом. Для имеющихся программ (архивного материала) существует 4 варианта нормализации громкости:
- Фактическое изменение уровня громкости всех аудиофайлов до целевого уровня.
- Изменение уровня громкости только «по требованию».
- Использование результата измерения уровня громкости для регулировки уровня при воспроизведении без изменения исходного уровня громкости (в самом файле – прим авт.).
- Передача корректных метаданных громкости на оборудование потребителя, где и производится нормализация.
Выбор решения зависит от таких факторов, как инфраструктура, рабочие процессы, управление медиафондами, наличие подходящего оборудования, финансовые ресурсы, время и т.д.
Сразу после поступления медиаматериала необходимо провести измерения уровня Громкости программы, Диапазона громкости и Максимальных уровней истинных пиков – трех основных параметров звука, определенных в настоящих Рекомендациях и EBU R 128. Для очень короткого контента (<30 сек), такого как анонсы и рекламные ролики, также необходимо измерить и сохранить Максимальный уровень мгновенной громкости и Максимальный уровень кратковременной громкости. В зависимости от результатов этого измерения, последующего метода нормализации громкости и соответствия допустимому диапазону громкости вырабатывается схема обработки, состоящая из «компоновочных блоков» или «основных задач». Ниже приведены общие блок-схемы рабочего процесса.
Три базовых компоновочных блока, показанных выше, лежат в центре любого процесса контроля качества файлов в отношении технических параметров его звукового содержания. В начале любой потенциальной обработки измеряются три параметра: Уровень громкости (Loudness Level, Lk); Диапазон громкости (Loudness Range, LRA); Максимально допустимый уровень истинных пиков (Maximum True Peak Level, Max TP). Результат этого первичного измерения определяет дальнейшую обработку.
Возможно несколько разных сценариев:
1) Все три параметра в норме.
Это идеальный результат измерения: Уровень громкости программы минус 23 LUFS, Диапазон громкости в пределах, определенных вещателем (в зависимости от жанра и/или платформы распространения), а Максимально допустимый уровень истинных пиков равен или ниже максимального значения для выбранной платформы распространения.
2) Уровень громкости программы выше минус 23 LUFS. Нормализация осуществляется операцией регулировки усиления (понижения уровня):
Усиление (dB) = (Lk целевой уровень — Lk измеренный уровень)
(Пример: измеренный Lk = -19.4 LUFS; целевой уровень Lk = -23 LUFS; необходимое усиление будет (dB) = (-23 — (-19.4)) = -3.6. Max TP уменьшается на ту же величину, что и Lk).
3) Уровень громкости программы ниже минус 23 LUFS.
После повышения усиления нужно пересчитать Максимально допустимый уровень истинных пиков (исходный Max TP +Max TP), так как он потенциально может находиться выше допустимого предела. Если новый Max TP превышает допустимый предел, необходимо выполнить ограничение истинных пиковых значений, которое должно быть выполнено согласно унифицированному блоку обработки истинных пиков. Если такое ограничение невозможно или нежелательно (или потенциально слишком серьезно), в этом случае значение Lk оставляется на исходном низком уровне и применяется соответствующая установка метаданных громкости (ниже минус 23 LUFS, отражая исходный уровень громкости). Это требуется для полнофункциональной системы, поддерживающей метаданные (например, Dolby Digital или MPEG 4).
4) Громкость программы ниже минус 23 LUFS, а Диапазон громкости шире внутреннего допуска для жанра или платформы распространения.
Уровень Громкости программы можно обрабатывать согласно пункту 3. Диапазон громкости подлежит обработке (унифицированный блок LRA) и, таким образом, потенциально снижается Max TP. Хотя Max TP может превышать допустимый лимит при применении положительного сдвига усиления, обработка Max TP может не требоваться из-за снижения LRA. Поэтому необходимо вычислить Max TP во время процесса снижения LRA.
5) Диапазон громкости шире допуска для жанра или платформы распространения.
Как сообщалось ранее, компрессор с низким порогом и очень умеренным коэффициентом может использоваться для уменьшения LRA (унифицированный блок Диапазона громкости). Для файлов применяются преимущественно автоматические процессы с «целевым LRA». Альтернативно, результат измерения LRA может активировать предустановку динамического компрессора с параметрами, аналогичными вышеуказанным. Max TP может лишь уменьшиться, поэтому нет необходимости обработки истинных пиковых значений.
6) Максимально допустимый уровень истинных пиков (Maximum Permitted True Peak Level) превышен.
Превышение уровня -1 dBTP влечет за собой риск дальнейших искажений (например, в цифро-аналоговом преобразователе, конвертере или кодеке с уменьшением скорости потока). Согласно унифицированному блоку Max TP, ограничение истинных пиковых значений осуществляется путем понижения Max TP. Существенно ли изменится в результате этого громкость программы, зависит от числа и размера затронутых пиков.
Любая другая комбинация результатов первичного измерения LRA и Max TP входит в процессы, уже описанные в вышеупомянутых сценариях.
4.3 Этап формирования эфирного сигнала
Контроль уровня громкости и необходимая нормализация на этапе формирования эфирной программы должны осуществляться на конечном участке тракта аппаратно-студийного комплекса (АСК), непосредственно перед передачей сигнала для дальнейшего распространения. Такая обработка осуществляется с помощью аппаратного устройства, позволяющего реализовать нормализацию громкости без потерь. Для прямого эфира нормализация должна быть основана на непрерывном измерении громкости в течение суток.
Коррекцию следует применять в следующих случаях:
- Если долговременный уровень громкости сервисов MPEG-1 Layer II определенной вещательной организации отличается от целевого уровня минус 23 LUFS, описанного в EBU R 128.
- Если долговременный уровень громкости сервисов HE-AAC определенной вещательной организации отличается от целевого уровня минус 23 LUFS, описанного в EBU R 128, на основе применения параметра Decoder Target Level (target_level, определенного в ISO/IEC 14496-3) на уровне минус 23 LUFS.
- Если долговременный уровень громкости сервисов AC3/E-AC3 (брендовое название Dolby Digital и Dolby Digital Plus) определенной вещательной организации отличается от уровня воспроизведения звука минус 31 LUFS согласно ETSI TS 102 366, на основе применения Decoder Target Level of -31 LUFS стандарта Dolby.
Раздел 4.4. «Этап цифрового распространения эфирного сигнала» из настоящей публикации удален в целях компактности, поскольку к работе звукорежиссеров он имеет минимальное отношение.
4.5 Этап вставки региональной рекламы и региональных программ
В системах с применением локально вставленной рекламы переключение должно происходить после системы нормализации громкости. Рекламные ролики должны нормализоваться заранее к целевому уровню с помощью, например, алгоритма, реализованного в программном обеспечении постобработки медиаматериала.
В результате средний уровень громкости теле- или радиоканала должен быть равен целевому уровню в момент переключения рекламной вставки. В звуковых системах AC3/E-AC3 или HE-AAC метаданные громкости локально вставленной рекламы всегда должны корректно показывать фактическую громкость, если по какой-либо причине контент не нормализован по громкости до минус 23 LUFS. Если сигнал проходит через систему, воспроизводящую рекламу, в этом устройстве не должно применяться ни усиления, ни затухания. Алгоритмы внутри воспроизводящего устройства, предназначенные для отслеживания средней громкости основной программы, должны быть отключены, если реклама или программа прошли предварительную обработку. Измерение громкости в целях мониторинга после рекламной вставки на данном этапе опционально.
Если вставка регионального программного контента воспроизводится из файловой системы, можно применить тот же подход, что для вставок регионального рекламного контента. Если региональная программа идет в прямом эфире, необходимо обеспечить соответствие громкости. Если основные сервисы скорректированы системой нормализации в головном узле, региональный сервис также может корректироваться отдельным долговременным измерением этого сигнала. Это можно достичь только путем измерения во время регионального вещания.
В региональных центрах, где осуществляется вставка региональных программ и региональной рекламы в исходный (Федеральный) контент, соотношение цифрового и аналогового уровней звукового сигнала должно соответствовать единому значению. Значение соответствия уровней указаны в разделе 4.6.
4.6 Этап цифро-аналогового преобразования и аналогового распространения
При приеме сигнала на головных узлах распространителей вещательного аналогового сигнала осуществляемом с помощью демодуляторов, имеющих функционал цифро-аналогового преобразования (приемник-декодер), настоятельно рекомендуется, чтобы уровни звука внутри приемник-декодера не подвергались влиянию его контроля громкости.
После нормализации уровней громкости уровни пиковых значений могут оказаться слишком высокими для аналоговой системы передачи, поэтому следует применять ограничение истинных пиковых значений. Эта обработка может производиться специальным оборудованием или может быть встроена в сам аналоговый модулятор.
А. Виды испытательных звуковых сигналов
Установочный сигнал (AS) – синусоидальный сигнал частотой 1 кГц, используемый для выстраивания уровней звукового сигнала между разными звеньями звукового тракта. Соответствует уровню напряжения аудиосигнала 0 dBu, при среднеквадратичном значении напряжения 0.775 В.
Максимально допустимый сигнал (PMS) − синусоидальный сигнал частотой 1 кГц, используемый в качестве эквивалента максимально допустимого уровня звукового сигнала телерадиопрограмм. За уровень этого сигнала принимается значение на 9 dB выше уровня Установочного сигнала (AS).
Номинальный уровень звуковой программы – текущий уровень звуковой программы, измеренный посредством квазипикового измерителя (QPPM)*. Вследствие характеристик квазипиковых измерителей сигнала реальные пики измеряемого звукового сигнала программы могут быть на 3 dB выше отображаемых значений, поэтому Номинальный уровень звуковой программы принимается как Максимально допустимый сигнал (PMS) минус 3 dB.
Измерительный сигнал (MS) − синусоидальный сигнал, используемый для проведения долгосрочных измерений, а также измерений частотного спектра (на всех частотах), при испытаниях и настройках параметров звуковых трактов и их звеньев. За уровень этого сигнала принимается значение на 12 dB ниже уровня Установочного сигнала (AS).
*При измерении уровня звукового сигнала теле- радиопрограммы большую часть времени показания QPPM должны достигать или находиться ниже этого уровня и лишь изредка его превышать.
Б. Уровни аналоговых сигналов
Значения уровней аналоговых сигналов определены в таблице А.
Таблица А
Наименование параметра | Значение | Примечание |
Максимальнодопустимый сигнал | + 9 dBu (2,18 Вэфф);(+9 dB от Установочного сигнала (AS)) | В соответствии с РекомендациямиITU-R BS.645-2 |
Номинальный уровень звуковой программы | + 6 dBu (1,55 Вэфф);(- 3 dB от Максимально допустимого сигнала (PMS)) | Значение уровня согласно ГОСТ 11515, а также в соответствии с EBU R68-2000ITU-R BS.645-2 |
Уровень установочного сигнала | dBu (0,775 Вэфф); | В соответствии с Рекомендациями -R 68-2000 и ITU-R BS.645-2 в части отношения уровней AS, PMS и MS |
Уровень измерительного сигнала | -12 dBu (0,195 Вэфф);(-12 dB от уровня установочного сигнала (AS)) |
В. Уровни цифровых сигналов
Значения уровней цифровых сигналов определены в таблице Б.
Таблица Б
Наименование параметра | Значение | Примечание |
Максимальнодопустимый сигнал | -9 dBFS | Согласно EBU R68-2000 |
Номинальный уровень звуковой программы | -12 dBFS | Согласно EBU R68-2000 |
Уровень установочного сигнала | -18 dBFS | Согласно Рекомендации EBU R68-2000 |
Уровень измерительного сигнала | -30 dBFS | Отношение к AS – по Рек. ITU-R BS.645-2 |
Г. Таблица соответствия уровней испытательных сигналов
Виды испытательных звуковых сигналов и их уровни приведены в таблице В.
Таблица В
Вид сигнала | Уровни аналогового сигнала | Уровни цифрового сигнала | ||
Эффективное значение | VU-метр | QPPM | Пиковое значение (цифровой прибор) | |
Максимально допустимый сигнал | 2,18 Вэфф(+ 9 dBu) | + 4 дБ | + 3 дБ (140%) | -9 dBFS |
Номинальный уровень звуковой программы | 1,55 Вэфф(+ 6 dBu) | + 2 дБ | 0 дБ (100%) | -12 dBFS |
Установочный сигнал | 0,775 Вэфф(0 dBu) | — 4 дБ | -6 дБ (50%) | -18 dBFS |
Измерительный сигнал | 0,195 Вэфф(-12 dBu) | – 16 дБ | -18 дБ (12,5%) | -30 dBFS |
* — шкала dBr является относительной, где за 0 dBr принимается определенное конкретное значение уровня напряжения аудиосигнала dBu (в соответствии с ITU-R BS.645-2) |
Ниже приведена диаграмма отображения уровней установочного и максимально допустимого сигналов на шкалах измерителей уровней таблицы В. Шкала «dBFS» диаграммы отражает значения уровней цифровых сигналов, предписываемые настоящим стандартом.
Диаграмма уровней установочного и максимально допустимого сигналов
Д. Сверка и согласование звуковых трактов
Для сверки уровней звуковых трактов рекомендуется использовать цифровой установочный синусоидальный сигнал частотой 1 кГц с уровнем минус 18 dBFS, что должно соответствовать 0 dBu (среднеквадратичному значению напряжения 0.775В) в аналоговом сигнале.
В связи с тем, что в мировой практике используются два значения установочного уровня (SMPTE – минус 20 dBFS; EBU – минус 18 dBFS) рекомендуется при совместных международных трансляциях накладывать титр, поясняя, сигнал какого установочного уровня используется для сверки трактов.
Предпочтительно сигнал в аналоговые головные узлы подавать через распределительный канал из (резервного) центрального цифрового головного узла, где применяется нормализация громкости. В результате этот процесс может быть реализован очень эффективно при обслуживании обеих систем передачи. Аналоговые модуляторы могут быть установлены по умолчанию и не требовать дальнейшего обслуживания для контроля уровней звука, с которым они работают. Если аналоговый головной узел не может получать сигнал с цифровой платформы и должен использовать собственные потоки сбора, нормализация громкости должна применяться локально, по тем же принципам, что и нормализация громкости в цифровых средах распространения. Опционально можно использовать централизованно собранные данные громкости для дистанционного управления локальными системами через соединение данных.
4.7 Этап приема цифрового/аналогового сигнала абонентом
Многие цифровые телевизионные приемники, поддерживающие стандарты вещания DVB, имеют в своем составе декодеры звуковых форматов Dolby Digital Plus, Dolby Digital, HE AAC и MPEG-1 LII для стерео и многоканального звука.
Разные телевещательные компании для передачи звукового сопровождения телепрограммы могут использовать различные аудиокодеки. Поэтому при просмотре телевизионных программ телезритель, переключаясь с канала на канал, по факту также может переключаться между кодеками.
В связи с этим крайне важно обеспечить единый уровень громкости звуковой дорожки телепрограммы после декодирования любых из вышеназванных звуковых форматов на стороне телевизионного приемника.
Рекомендуется ознакомиться с полным описанием требований и рекомендаций, решающих данную задачу для различных типов телевизионных приемников и их звуковых выходов, изложенным в приложении Tech3344 к Рекомендации EBU R128 (разделы 6, 7, 8, 9 и 10), а также в открытом документе Dolby Technical Bulletin 11.
Многие цифровые телевизионные приемники могут принимать аналоговые телевизионные сигналы наравне с цифровыми. Предполагается, что громкость аналоговых звуковых сигналов схожа с громкостью MPEG-1 L2 аудиодорожки, поэтому для согласования уровней рекомендуется использовать ту же методику.