Главная/ Статьи/ 152 конгресс AES – научные результаты
152 конгресс AES – научные результаты

152 конгресс AES – научные результаты

Автор: Ирина Алдошина

С 7 по 8 мая в Гааге (Нидерланды) прошел 152-й конгресс AES – на этот раз, после двухлетнего перерыва, в обычном «очном» режиме: работали научная сессия, учебные и научные семинары, демонстрации оборудования различных фирм, представленных на выставке, студенческая ассамблея и конкурс студенческих звукозаписей. (С16 по 19 мая Конгресс прошел в онлайн-формате)

Вступительное слово было представлено Kees Tazelaar (профессор консерватории) и было посвящено истории электронной музыки. В 1958 году на Всемирной выставке в Брюсселе в специальном павильоне, построенном знаменитым архитектором Ле Корбюзье, исполнялась «Le poème électronique» – электронная композция, написанная Яннисом Ксенакисом и Эдгаром Варезом. С этого события, по мнению автора, начинается интенсивное развитие электронной музыки, которая в настоящее время является значительной частью музыкальной культуры.

Мемориальную «Хейзеровскую» лекцию прочитал известный профессор Diemer de Vries (рис.1) (Дельфтский Университет).

Профессор Diemer de Vries

Она была посвящена истории развития системы волнового синтеза звука (Wave Field Synthesis, WFS). Принцип построения системы был предложен в 1980 году профессором Дельфтского Университета Guus Berkhout и состоял в том, что с помощью распределенной системы громкоговорителей можно, управляя амплитудами и фазами сигналов, сформировать в помещении устойчивое распределение мнимых источников, не зависящих от перемещения слушателей. Система вызвала большой интерес, была включена в Европейский проект CARROUSO и нашла широкое применение в театрах. концертных залах и др.

На научной сессии работало 15 секций и было представлено 64 доклада. Описания некоторых из них приведены ниже.

Секция «Громкоговорители и телефоны»

В китайском докладе «Сравнение микрогромкоговорителей с одиночной и двойной диафрагмой» (пр. 10550) представлен сопоставительный анализ конструкций и параметров маленьких громкоговорителей для сотовых телефонов с обычной одиночной диафрагмой и с множественными диафрагмами (рис. 2), показано, что в новой конструкции удается получить существенно больший уровень звукового давления, правда, при этом она конструктивно сложнее и дороже.

Рис 2 Миниатюрный громкоговоритель с множественными диафрагмами

В докладе известного датского специалиста Søren Bech и др. «Анализ предпочтений слушателей в развитии новых технологий в стереотелефонах» (пр. 10556) приводятся интересные результаты субъективных тестов стереотелефонов на большом количестве слушателей. Цель работы было установить, насколько слушатели удовлетворены современным состоянием применения новых процессорных технологий в стереотелефонах, и в каком направлении они считают их нужно развивать. Большинство слушателей считают, что основными направлениями в развитии должны быть расширение возможностей стереотелефонов в воспроизведении пространственного (многоканального) звука и в подавления шумов.

В докладе «Влияние шайбы на температурные процессы в громкоговорителях» (пр. 10567) представлен метод расчета температурных процессов в громкоговорителях с учетом влияния шайбы на циркуляцию воздуха в магнитной цепи, что является очень актуальной проблемой, поскольку в низкочастотных громкоговорителях нагрев магнитной цепи при длительной работе может достигать 300 градусов и существенно менять параметры громкоговорителя.

Очень полезные результаты содержатся в докладе «Открытая база данных передаточных функция головы (HRTF) с учетом искажений, вносимых стереотелефонами» (пр. 10611). Для развития современных систем бинаурального синтеза чрезвычайно важным является точное измерение передаточных функций, в данной работе был выполнен большой комплекс измерений HRTF на искусственной голове от громкоговорителей и от 34 стереотелефонов различных типов (охватывающих, прижимных, вкладных и пр.) (рис. 3), позволивший установить какие искажения вносят различные телефоны в HRTF и предложить методы их компенсации. Полная база данных выложена в свободном доступе.

Рис 3 Измерения передаточных функций на громкоговорителях и телефонах

Доклад «Применение мультиобъектных оптимизационных структур при создании индивидуальных слушательских зон» (пр. 10613) рассматривает решение проблем создания индивидуальных слушательских зон в общем пространстве звукового поля, создаваемого системой распределенных громкоговорителей. С помощью современной процессорной обработки, например, методов Acoustic Contrast Control (ACC) и Pressure Matching (PM) можно создавать отдельные зоны, где можно прослушивать различный аудиоконтент, например, в салоне автомобиля или в большом банковском офисе и др. (рис.4). В докладе анализируются соответствующие алгоритмы и предлагается дальнейшее развитие этих методов.

Рис 4 Создание индивидуальных зон прослушивания в автомобиле

Секция «Акустика помещений»

Доклад фирмы L-Acoustics «Спектральное и пространственное восприятие гребенчатой фильтрации в системах звукоусиления» (пр. 10551) содержит результаты субъективных тестов по определению слышимости искажений, возникающих при интерференции сигналов от близко расположенных звуковых систем (что часто встречается в системах озвучивания, когда приходится, например, у сцены размещать главные системы и рядом дополнительные для озвучивания передних рядов или боковых зон). При работе таких систем возникает гребенчатая фильтрация, которая приводит к спектральным и пространственным искажениям. Слышимость этих искажений зависит от пространственного разделения систем, разницы их уровней и временных задержек между ними, например, даже при пространственном разделении АС на 10 градусов слышимость искажений существенно уменьшается.

Доклад австралийских ученых «Путь к созданию глобального стандарта для безопасного прослушивания в помещениях и на открытых пространствах» (пр. 10561) посвящен важнейшей проблеме – падению слуха у молодого поколения в цивилизованных странах. Уже на протяжении нескольких десятилетий Всемирная Организация здравоохранения фиксирует повышение порогов слуха, особенно у людей в возрасте от 14 до 35 лет, что обусловлено такими причинами, как длительное пребывание на концертах и фестивалях рок-музыки, в дискотеках и других мероприятиях с высокими уровнями звука, широкое применение ушных телефонов и общее повышение уровня шумов. Группы ученых из разных стран работали над изучением влияния различных факторов на степень падения слуха и в итоге в марте этого года ВОЗ был опубликован Глобальный Стандарт на условия безопасного прослушивания. Авторы доклада рассматривают условия для создания на его базе национальных стандартов и организации широкой образовательной работы среди молодежи по его применению.

В докладе D. Ponteggia «Определение порогов STI для различных распределенных акустических систем в помещении» (пр. 10566) предлагается учитывать при расчете систем звукоусиления, что при оценке требуемых порогов STI (индекс передачи речи), которые являются основными критериями при оценке разборчивости речи (IEC 60268-16) следует учитывать такие параметры как уровень шумов, степень заполненности зала и пр.

В докладе известного итальянского акустика профессора A. Farina «Акустический дизайн исторического зала AulaMagna в университете в Парме» (пр. 10569) приводятся результаты акустических измерений старинного актового зала Университета (рис.5), а также результаты компьютерного моделирования и новых методов акустического проектирования с целью существенного улучшения разборчивости в зале.

Рис 5 Внешний вид зала в Университете в Парме

В польском докладе «Малобюджетное акустическое проектирование комнат прослушивания» (пр. 10597) рассматриваются методы расчета на основе компьютерного моделирования и практический дизайн комнаты прослушивания с выбором различных вариантов размещения звукопоглотителей (рис.6), позволившие обеспечить время реверберации 0,45 секунды на низких частотах и практически плоскую частотную характеристику времени реверберации.

Рис 6 Варианты размещения звукопоглощающего материала в комнате прослушивания

В докладе «Интегрированный архитектурный и акустический дизайн студий звукозаписи» (пр. 10603) анализируются изменившиеся требования к студиям звукозаписи в связи с внедрением цифрового звука, пространственных звуковоспроизводящих систем, систем виртуальной реальности и пр. Это очень актуальная работа, которая приведет к появлению новых стандартов для проектирования студий звукозаписи.

Доклад специалистов из знаменитого Стэнфордского Университета «Создание электронной архитектуры для живых виртуальных акустических представлений (пр. 10606) посвящен очень актуальной в настоящее время проблеме электронного управления акустическими характеристиками помещения. Работы над этой проблемой ведутся уже много лет, широко известны такие системы, как AFC фирмы Yamaha и др. В данном докладе предлагается новая система, включающая распределение громкоговорителей в помещении и процессорное управление их параметрами (рис. 7), позволяющая изменять время реверберации, структуру ранних отражений и пр., а также представлена ее реализация в трех различных залах (Cappella Romana в Тиволи, Vredenburg Grote Zaal в Утрехте, Ritz Carlton Ballroom iв Сан-Франциско).

Рис 7 Распределенная система громкоговорителей в концертном зале

В докладе «Адаптивная коррекция аудиосигналов для различных параметров помещения» (пр. 10612) рассматривается метод адаптации параметров сигнала в зависимости от типа помещения, в котором они воспроизводятся, например, введение дополнительного затухания сигнала на резонансных частотах помещения, уменьшение обратной связи на определенных частотах и др. Пример предварительного изменения импульсной характеристики сигнала и соответствующего изменения импульсной характеристики помещения показан на рис.8. Субъективные оценки полученных результатов для различных помещений также представлены в докладе.

Рис 8 Изменение импульсной характеристики сигнала и соответствующей импульсной характеристики помещения до и после обработки

Секция «Пространственный звук»

На двух секциях по тематике «Пространственный звук»можно прежде всего выделить докладM. Williams «Микрофонные системы 3D-Аудио с учетом высотных микрофонов – практические конфигурации» (пр. 10555). M. Williams на протяжении нескольких лет занимается исследованием различных конфигураций микрофонов для записи стерео и пространственного звука (у него опубликованы две книги на эту тему). Последние годы им представлен целый ряд докладов, посвященных анализу различных конфигураций микрофонов для записи пространственного звука с использованием высотных микрофонов. В данном докладе описаны различные конфигурации с кардиоидными, гиперкардиоидными и суперкардиоидными микрофонами, представлены результаты измерения углов покрытия при разных расстояниях между микрофонами в горизонтальной и вертикальной плоскости и др., пример показан на рис.9.

Рис 9 Пример высотной системы микрофонов для пространственной звукозаписи

В японском докладе «Деградация точности в системах волнового синтеза из-за рассеяния звука на голове» (пр. 10610) оцениваются погрешности в локализации мнимого источника в системах волнового синтеза (WFS) из-за искажений звукового поля за счет дифракции на голове слушателя (рис. 10). Показано, что на низких частотах она незначительна, но на высоких частотах (когда длина волны соизмерима с размерами головы) искажения за счет дифракции становятся заметными и их надо учитывать при расчетах.

Рис 10 Дифракция сигнала на голове

В инженерной записке (е-671), представленной польскими специалистами из Гданьского Университета, «Обзор развития систем воспроизведения звуковых полей» представлен анализ существующих методов воспроизведения пространственного звукового поля во вторичном помещении, например, таких как Wave Field Synthesis (WFS) и Higher Order Ambisonics (HOA), показаны основные погрешности при воспроизведении и выполнены субъективные экспертизы по оценке значимости этих погрешностей.

Cекция «Студийные технологии»

Среди материалов этой секции можно выделить доклад «Искусство записи и инженерной подготовки высококачественных многоканальных сетевых музыкальных программ» (пр.10563). Эпоха пандемии подтолкнула интенсивное развитие сетевых музыкальных технологий для записи оркестров, ансамблей и др., проведения репетиций и создания альбомов. Доклад посвящен анализу технологий записи, микширования, дальнейшей обработки с использованием соответствующих программ (типа JackTrip, and Netty-McNetface) и открытых сетевых ресурсов, поиску оптимальных решений для музыкантов, звукорежиссеров, продюсеров и др.

Секция «Бинауральное аудио»

Здесь было представлено девять докладов, из них можно выделить следующие.

Доклад немецкого института Коммуникационной техники «Получение передаточных функций HRTF в ближнем поле с помощью искусственной головы КЕМАР» (пр. 10575) представил базу данных передаточных функций как в дальнем, так и в ближнем поле, предложив при этом новый метод адаптивной фильтрации для ускорения получения результатов, поскольку передаточные функции зависят как от углового расположения источника в горизонтальной и вертикальной плоскости, так и от расстояния до слушателя, а это требует очень большого объема измерений (рис. 11). Предложенный метод очень полезен для создания систем бинаурального синтеза, виртуальной реальности и др.

Рис 11 Система измерения передаточных функций на искусственной голове

Китайскими специалистами представлен очень серьезный теоретический доклад «Модель компьютерной бинауральной локализации звука» (пр. 10576), в котором излагается современная теория, построенная на использовании нейронных сетей WaveLoc_EC. Она позволяет извлекать из звукового сигнала локализационные признаки, которые использует слуховая система человека для определения положения источника звука в пространстве.

Еще один доклад «Представление персональных зон с общими и индивидуальными бинауральными передаточными функциями» (пр. 10579) был посвящен проблеме формирования персональных слушательских зон в общем помещении (рис. 12), видимо, эта проблема стала очень актуальной.

Рис 12 Формирование индивидуальных зон в помещении

Очень полезные результаты представлены в американском докладе «Виртуальный студийный инструмент для микширования в системах DolbyATMOS и многоканального звука» (Е-674). В настоящее время широко используются системы записи и воспроизведения для многоканальных систем типа Dolby ATMOS и др. Оснащение студии звукозаписи большим количеством громкоговорителей (рис. 13) для микширования и обработки звука представляется очень сложной и дорогостоящей проблемой. Поэтому предлагается создание виртуального продукта с использованием передаточных функций головы для каждого громкоговорителя и формирование из них бинауральных сигналов для телефонов, которые и можно использовать для микширования и обработки.

Рис 13 Cтудия для записи звука в формате Dolby ATMOS

Две секции были посвящены разделу «Психоакустика»

Одна секция называлась «Громкость и восприятие», другая «Качество звука и восприятие». Там можно выделить следующие доклады.

Доклад» «Микширование с вкладышами-мониторами: понимание работы микс-инженера» (пр. 10605) содержит результаты интервью с четырьмя опытными звукорежиссерами микширования, в которых обсуждалась специфика создания микса с вкладными In-Ear-телефонами и выбор безопасных уровней прослушивания.

Два доклада известного специалиста в области психоакустики S. Bech «Оценка качества звука динамически перемещающего в пространстве источника» (пр. 10601) и «Временная оценка качества звука с использованием TCATA» (пр. 10602).

В первом докладе приведен литературный обзор работ, посвященных оценке качества звука для источников, перемещающихся в пространстве. Субъективная методология оценки качества звучания пространственных систем звуковоспроизведения для стационарных источников достаточно хорошо отработана, установлены критерии для таких параметров, как оценка точности локализации мнимых источников, качества тембра и т.д. Однако современные пространственные системы используются в настоящее время в кино и системах виртуальной реальности и пр., где они должны передавать перемещение мнимых источников в пространстве (например, Dolby ATMOS и др.). В настоящее время ведутся интенсивные исследования по отработке методики слуховой оценки их качества, именно этой проблеме и посвящен данный доклад.

Во втором докладе предлагается использование метода Temporal-Check-All-That-Apply (TCATA) для оценки качества звука в случаях, когда источник звука и слушатель перемещаются относительно друг друга. В докладе приводятся результаты субъективных оценок точности перемещения источника, изменения его тембральных и других характеристик. Даются рекомендации для дальнейших экспериментов.

Из докладов на других секциях можно выделить следующие.

Японский доклад «Слуховая оптимизация методов регулирования ширины стереобазы при воспроизведении через стереотелефоны в сравнении с громкоговорителями» (пр. 10571) анализирует проблему, которая возникает при прослушивании стереозаписей через телефоны, при этом из-за отсутствия перекрестных сигналов ширина стереобазы существенно уменьшается в сравнении с прослушиванием через громкоговорители. Для решения этой проблемы предлагаются методы для введения в сигналы дополнительных перекрестных связей и анализируются результаты их сравнительных прослушиваний.

Доклад «Низко-комплексный метод для устойчивого преобразования моносигналов в стерео (Downmixing)» (пр. 10578) посвящен актуальной в настоящее время проблеме преобразования моносигналов в многоканальные (Up-mixing) и наоборот (Down-mixing). При этом возникают различные проблемы с появлением временных и спектральных искажений. В докладе предлагаются методы для уменьшения возникающих (в частности, за счет появления гребенчатой фильтрации) искажений.

Доклад представителей фирмы Bosch «Громкоговоритель как записывающее устройство» (пр. 10568) предлагает использовать динамический громкоговоритель в качестве динамического микрофона, т.к. принцип устройства у них одинаковый. Обычно громкоговорители не используются в режиме приема, так как имеют слишком низкую чувствительность и большой уровень искажений, особенно переходных. Однако применение современных средств процессорной обработки позволяет уменьшить искажения, что делает возможным использование громкоговорителей для речевых систем, например, в системах оповещения (рис 14).

Рис 14 Использование громкоговорителя в качестве микрофона

Достаточно много интересной информации было представлено на семинарах, но их материалы, к сожалению, не публикуются.

#Назад в Статьи