152 конгресс AES – научные результаты
Автор: Ирина Алдошина
С 7 по 8 мая в Гааге (Нидерланды) прошел 152-й конгресс AES – на этот раз, после двухлетнего перерыва, в обычном «очном» режиме: работали научная сессия, учебные и научные семинары, демонстрации оборудования различных фирм, представленных на выставке, студенческая ассамблея и конкурс студенческих звукозаписей. (С16 по 19 мая Конгресс прошел в онлайн-формате)
Вступительное слово было представлено Kees Tazelaar (профессор консерватории) и было посвящено истории электронной музыки. В 1958 году на Всемирной выставке в Брюсселе в специальном павильоне, построенном знаменитым архитектором Ле Корбюзье, исполнялась «Le poème électronique» – электронная композция, написанная Яннисом Ксенакисом и Эдгаром Варезом. С этого события, по мнению автора, начинается интенсивное развитие электронной музыки, которая в настоящее время является значительной частью музыкальной культуры.
Мемориальную «Хейзеровскую» лекцию прочитал известный профессор Diemer de Vries (рис.1) (Дельфтский Университет).
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-1-844x1024.jpg)
Она была посвящена истории развития системы волнового синтеза звука (Wave Field Synthesis, WFS). Принцип построения системы был предложен в 1980 году профессором Дельфтского Университета Guus Berkhout и состоял в том, что с помощью распределенной системы громкоговорителей можно, управляя амплитудами и фазами сигналов, сформировать в помещении устойчивое распределение мнимых источников, не зависящих от перемещения слушателей. Система вызвала большой интерес, была включена в Европейский проект CARROUSO и нашла широкое применение в театрах. концертных залах и др.
На научной сессии работало 15 секций и было представлено 64 доклада. Описания некоторых из них приведены ниже.
Секция «Громкоговорители и телефоны»
В китайском докладе «Сравнение микрогромкоговорителей с одиночной и двойной диафрагмой» (пр. 10550) представлен сопоставительный анализ конструкций и параметров маленьких громкоговорителей для сотовых телефонов с обычной одиночной диафрагмой и с множественными диафрагмами (рис. 2), показано, что в новой конструкции удается получить существенно больший уровень звукового давления, правда, при этом она конструктивно сложнее и дороже.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-2-1-1024x365.jpg)
В докладе известного датского специалиста Søren Bech и др. «Анализ предпочтений слушателей в развитии новых технологий в стереотелефонах» (пр. 10556) приводятся интересные результаты субъективных тестов стереотелефонов на большом количестве слушателей. Цель работы было установить, насколько слушатели удовлетворены современным состоянием применения новых процессорных технологий в стереотелефонах, и в каком направлении они считают их нужно развивать. Большинство слушателей считают, что основными направлениями в развитии должны быть расширение возможностей стереотелефонов в воспроизведении пространственного (многоканального) звука и в подавления шумов.
В докладе «Влияние шайбы на температурные процессы в громкоговорителях» (пр. 10567) представлен метод расчета температурных процессов в громкоговорителях с учетом влияния шайбы на циркуляцию воздуха в магнитной цепи, что является очень актуальной проблемой, поскольку в низкочастотных громкоговорителях нагрев магнитной цепи при длительной работе может достигать 300 градусов и существенно менять параметры громкоговорителя.
Очень полезные результаты содержатся в докладе «Открытая база данных передаточных функция головы (HRTF) с учетом искажений, вносимых стереотелефонами» (пр. 10611). Для развития современных систем бинаурального синтеза чрезвычайно важным является точное измерение передаточных функций, в данной работе был выполнен большой комплекс измерений HRTF на искусственной голове от громкоговорителей и от 34 стереотелефонов различных типов (охватывающих, прижимных, вкладных и пр.) (рис. 3), позволивший установить какие искажения вносят различные телефоны в HRTF и предложить методы их компенсации. Полная база данных выложена в свободном доступе.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-3-1024x1005.jpg)
Доклад «Применение мультиобъектных оптимизационных структур при создании индивидуальных слушательских зон» (пр. 10613) рассматривает решение проблем создания индивидуальных слушательских зон в общем пространстве звукового поля, создаваемого системой распределенных громкоговорителей. С помощью современной процессорной обработки, например, методов Acoustic Contrast Control (ACC) и Pressure Matching (PM) можно создавать отдельные зоны, где можно прослушивать различный аудиоконтент, например, в салоне автомобиля или в большом банковском офисе и др. (рис.4). В докладе анализируются соответствующие алгоритмы и предлагается дальнейшее развитие этих методов.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-4-1024x720.jpg)
Секция «Акустика помещений»
Доклад фирмы L-Acoustics «Спектральное и пространственное восприятие гребенчатой фильтрации в системах звукоусиления» (пр. 10551) содержит результаты субъективных тестов по определению слышимости искажений, возникающих при интерференции сигналов от близко расположенных звуковых систем (что часто встречается в системах озвучивания, когда приходится, например, у сцены размещать главные системы и рядом дополнительные для озвучивания передних рядов или боковых зон). При работе таких систем возникает гребенчатая фильтрация, которая приводит к спектральным и пространственным искажениям. Слышимость этих искажений зависит от пространственного разделения систем, разницы их уровней и временных задержек между ними, например, даже при пространственном разделении АС на 10 градусов слышимость искажений существенно уменьшается.
Доклад австралийских ученых «Путь к созданию глобального стандарта для безопасного прослушивания в помещениях и на открытых пространствах» (пр. 10561) посвящен важнейшей проблеме – падению слуха у молодого поколения в цивилизованных странах. Уже на протяжении нескольких десятилетий Всемирная Организация здравоохранения фиксирует повышение порогов слуха, особенно у людей в возрасте от 14 до 35 лет, что обусловлено такими причинами, как длительное пребывание на концертах и фестивалях рок-музыки, в дискотеках и других мероприятиях с высокими уровнями звука, широкое применение ушных телефонов и общее повышение уровня шумов. Группы ученых из разных стран работали над изучением влияния различных факторов на степень падения слуха и в итоге в марте этого года ВОЗ был опубликован Глобальный Стандарт на условия безопасного прослушивания. Авторы доклада рассматривают условия для создания на его базе национальных стандартов и организации широкой образовательной работы среди молодежи по его применению.
В докладе D. Ponteggia «Определение порогов STI для различных распределенных акустических систем в помещении» (пр. 10566) предлагается учитывать при расчете систем звукоусиления, что при оценке требуемых порогов STI (индекс передачи речи), которые являются основными критериями при оценке разборчивости речи (IEC 60268-16) следует учитывать такие параметры как уровень шумов, степень заполненности зала и пр.
В докладе известного итальянского акустика профессора A. Farina «Акустический дизайн исторического зала AulaMagna в университете в Парме» (пр. 10569) приводятся результаты акустических измерений старинного актового зала Университета (рис.5), а также результаты компьютерного моделирования и новых методов акустического проектирования с целью существенного улучшения разборчивости в зале.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-5-1024x823.jpg)
В польском докладе «Малобюджетное акустическое проектирование комнат прослушивания» (пр. 10597) рассматриваются методы расчета на основе компьютерного моделирования и практический дизайн комнаты прослушивания с выбором различных вариантов размещения звукопоглотителей (рис.6), позволившие обеспечить время реверберации 0,45 секунды на низких частотах и практически плоскую частотную характеристику времени реверберации.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-6-977x1024.jpg)
В докладе «Интегрированный архитектурный и акустический дизайн студий звукозаписи» (пр. 10603) анализируются изменившиеся требования к студиям звукозаписи в связи с внедрением цифрового звука, пространственных звуковоспроизводящих систем, систем виртуальной реальности и пр. Это очень актуальная работа, которая приведет к появлению новых стандартов для проектирования студий звукозаписи.
Доклад специалистов из знаменитого Стэнфордского Университета «Создание электронной архитектуры для живых виртуальных акустических представлений (пр. 10606) посвящен очень актуальной в настоящее время проблеме электронного управления акустическими характеристиками помещения. Работы над этой проблемой ведутся уже много лет, широко известны такие системы, как AFC фирмы Yamaha и др. В данном докладе предлагается новая система, включающая распределение громкоговорителей в помещении и процессорное управление их параметрами (рис. 7), позволяющая изменять время реверберации, структуру ранних отражений и пр., а также представлена ее реализация в трех различных залах (Cappella Romana в Тиволи, Vredenburg Grote Zaal в Утрехте, Ritz Carlton Ballroom iв Сан-Франциско).
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-7-1024x852.jpg)
В докладе «Адаптивная коррекция аудиосигналов для различных параметров помещения» (пр. 10612) рассматривается метод адаптации параметров сигнала в зависимости от типа помещения, в котором они воспроизводятся, например, введение дополнительного затухания сигнала на резонансных частотах помещения, уменьшение обратной связи на определенных частотах и др. Пример предварительного изменения импульсной характеристики сигнала и соответствующего изменения импульсной характеристики помещения показан на рис.8. Субъективные оценки полученных результатов для различных помещений также представлены в докладе.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-8-824x1024.jpg)
Секция «Пространственный звук»
На двух секциях по тематике «Пространственный звук»можно прежде всего выделить докладM. Williams «Микрофонные системы 3D-Аудио с учетом высотных микрофонов – практические конфигурации» (пр. 10555). M. Williams на протяжении нескольких лет занимается исследованием различных конфигураций микрофонов для записи стерео и пространственного звука (у него опубликованы две книги на эту тему). Последние годы им представлен целый ряд докладов, посвященных анализу различных конфигураций микрофонов для записи пространственного звука с использованием высотных микрофонов. В данном докладе описаны различные конфигурации с кардиоидными, гиперкардиоидными и суперкардиоидными микрофонами, представлены результаты измерения углов покрытия при разных расстояниях между микрофонами в горизонтальной и вертикальной плоскости и др., пример показан на рис.9.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-9-1024x543.jpg)
В японском докладе «Деградация точности в системах волнового синтеза из-за рассеяния звука на голове» (пр. 10610) оцениваются погрешности в локализации мнимого источника в системах волнового синтеза (WFS) из-за искажений звукового поля за счет дифракции на голове слушателя (рис. 10). Показано, что на низких частотах она незначительна, но на высоких частотах (когда длина волны соизмерима с размерами головы) искажения за счет дифракции становятся заметными и их надо учитывать при расчетах.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-10-1024x894.jpg)
В инженерной записке (е-671), представленной польскими специалистами из Гданьского Университета, «Обзор развития систем воспроизведения звуковых полей» представлен анализ существующих методов воспроизведения пространственного звукового поля во вторичном помещении, например, таких как Wave Field Synthesis (WFS) и Higher Order Ambisonics (HOA), показаны основные погрешности при воспроизведении и выполнены субъективные экспертизы по оценке значимости этих погрешностей.
Cекция «Студийные технологии»
Среди материалов этой секции можно выделить доклад «Искусство записи и инженерной подготовки высококачественных многоканальных сетевых музыкальных программ» (пр.10563). Эпоха пандемии подтолкнула интенсивное развитие сетевых музыкальных технологий для записи оркестров, ансамблей и др., проведения репетиций и создания альбомов. Доклад посвящен анализу технологий записи, микширования, дальнейшей обработки с использованием соответствующих программ (типа JackTrip, and Netty-McNetface) и открытых сетевых ресурсов, поиску оптимальных решений для музыкантов, звукорежиссеров, продюсеров и др.
Секция «Бинауральное аудио»
Здесь было представлено девять докладов, из них можно выделить следующие.
Доклад немецкого института Коммуникационной техники «Получение передаточных функций HRTF в ближнем поле с помощью искусственной головы КЕМАР» (пр. 10575) представил базу данных передаточных функций как в дальнем, так и в ближнем поле, предложив при этом новый метод адаптивной фильтрации для ускорения получения результатов, поскольку передаточные функции зависят как от углового расположения источника в горизонтальной и вертикальной плоскости, так и от расстояния до слушателя, а это требует очень большого объема измерений (рис. 11). Предложенный метод очень полезен для создания систем бинаурального синтеза, виртуальной реальности и др.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-11-1024x741.jpg)
Китайскими специалистами представлен очень серьезный теоретический доклад «Модель компьютерной бинауральной локализации звука» (пр. 10576), в котором излагается современная теория, построенная на использовании нейронных сетей WaveLoc_EC. Она позволяет извлекать из звукового сигнала локализационные признаки, которые использует слуховая система человека для определения положения источника звука в пространстве.
Еще один доклад «Представление персональных зон с общими и индивидуальными бинауральными передаточными функциями» (пр. 10579) был посвящен проблеме формирования персональных слушательских зон в общем помещении (рис. 12), видимо, эта проблема стала очень актуальной.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-12-1024x822.jpg)
Очень полезные результаты представлены в американском докладе «Виртуальный студийный инструмент для микширования в системах DolbyATMOS и многоканального звука» (Е-674). В настоящее время широко используются системы записи и воспроизведения для многоканальных систем типа Dolby ATMOS и др. Оснащение студии звукозаписи большим количеством громкоговорителей (рис. 13) для микширования и обработки звука представляется очень сложной и дорогостоящей проблемой. Поэтому предлагается создание виртуального продукта с использованием передаточных функций головы для каждого громкоговорителя и формирование из них бинауральных сигналов для телефонов, которые и можно использовать для микширования и обработки.
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-13-1024x703.jpg)
Две секции были посвящены разделу «Психоакустика»
Одна секция называлась «Громкость и восприятие», другая «Качество звука и восприятие». Там можно выделить следующие доклады.
Доклад» «Микширование с вкладышами-мониторами: понимание работы микс-инженера» (пр. 10605) содержит результаты интервью с четырьмя опытными звукорежиссерами микширования, в которых обсуждалась специфика создания микса с вкладными In-Ear-телефонами и выбор безопасных уровней прослушивания.
Два доклада известного специалиста в области психоакустики S. Bech «Оценка качества звука динамически перемещающего в пространстве источника» (пр. 10601) и «Временная оценка качества звука с использованием TCATA» (пр. 10602).
В первом докладе приведен литературный обзор работ, посвященных оценке качества звука для источников, перемещающихся в пространстве. Субъективная методология оценки качества звучания пространственных систем звуковоспроизведения для стационарных источников достаточно хорошо отработана, установлены критерии для таких параметров, как оценка точности локализации мнимых источников, качества тембра и т.д. Однако современные пространственные системы используются в настоящее время в кино и системах виртуальной реальности и пр., где они должны передавать перемещение мнимых источников в пространстве (например, Dolby ATMOS и др.). В настоящее время ведутся интенсивные исследования по отработке методики слуховой оценки их качества, именно этой проблеме и посвящен данный доклад.
Во втором докладе предлагается использование метода Temporal-Check-All-That-Apply (TCATA) для оценки качества звука в случаях, когда источник звука и слушатель перемещаются относительно друг друга. В докладе приводятся результаты субъективных оценок точности перемещения источника, изменения его тембральных и других характеристик. Даются рекомендации для дальнейших экспериментов.
Из докладов на других секциях можно выделить следующие.
Японский доклад «Слуховая оптимизация методов регулирования ширины стереобазы при воспроизведении через стереотелефоны в сравнении с громкоговорителями» (пр. 10571) анализирует проблему, которая возникает при прослушивании стереозаписей через телефоны, при этом из-за отсутствия перекрестных сигналов ширина стереобазы существенно уменьшается в сравнении с прослушиванием через громкоговорители. Для решения этой проблемы предлагаются методы для введения в сигналы дополнительных перекрестных связей и анализируются результаты их сравнительных прослушиваний.
Доклад «Низко-комплексный метод для устойчивого преобразования моносигналов в стерео (Down—mixing)» (пр. 10578) посвящен актуальной в настоящее время проблеме преобразования моносигналов в многоканальные (Up-mixing) и наоборот (Down-mixing). При этом возникают различные проблемы с появлением временных и спектральных искажений. В докладе предлагаются методы для уменьшения возникающих (в частности, за счет появления гребенчатой фильтрации) искажений.
Доклад представителей фирмы Bosch «Громкоговоритель как записывающее устройство» (пр. 10568) предлагает использовать динамический громкоговоритель в качестве динамического микрофона, т.к. принцип устройства у них одинаковый. Обычно громкоговорители не используются в режиме приема, так как имеют слишком низкую чувствительность и большой уровень искажений, особенно переходных. Однако применение современных средств процессорной обработки позволяет уменьшить искажения, что делает возможным использование громкоговорителей для речевых систем, например, в системах оповещения (рис 14).
![](https://audio-producer.ru/wp-content/uploads/2022/06/aes-152-14-1024x428.jpg)
Достаточно много интересной информации было представлено на семинарах, но их материалы, к сожалению, не публикуются.