159 конгресс AES – научные результаты
Автор: Ирина Алдошина
С 23 по 25 октября 2025г в Калифорнии (Long Beach) США прошел 159-й конгресс AES, на котором проходили традиционные мероприятия: научная сессия, учебные и научные семинары, выставка, студенческие мероприятия и др.
Традиционную речь, посвященную памяти ученого Хайзера, прочитал Шон Олив, старейший сотрудник фирмы Harman, который на протяжении многих лет занимался конструкцией громкоговорителей и наушников. Итоги этой работы и были рассмотрены в его речи.
На научной сессии можно выделить следующие доклады.
Доклад известного специалиста профессора М. Бози и др. «MPAI—CAE – по направлению к новому стандарту для перемещаемых пространственных систем» (пр. 386) представляет отчет о работе по подготовке нового стандарта, который может использоваться не только для систем с тремя степенями свободы (например, вращение головы), но и с шестью степенями свободы (перемещение системы). В порядке подготовки к стандарту проведен анализ принципов построения кодеров при пространственной записи с помощью Ambisonic-микрофонов высокого порядка и декодеров, позволяющих воспроизводить звук бинаурально или через систему Ambisonic. Кодер выполняет анализ системы звукозаписи и экстрактирует основные параметры, в том числе параметры звукового поля в помещении, декодер выделяет основные параметры, экстраполирует их относительно положения слушателя и системы воспроизведения, получает данные для воспроизведения. Предполагается, что полученные данные лягут в основу нового стандарта MPAI—CAE.
Вторая статья по стандартам фирмы Dolby и др. «MPEG—I пространственное аудио» –технология нового стандарта для виртуальной реальности» (пр. 0234) представляет детальный анализ основных позиций, положенных в основу стандарта, принятого в 2025 года. Стандарт предлагает эффективный контроль скорости потока, их высококачественное хранение и передачу виртуального окружения с шестью степенями свободы, включая пространственно-распределенные аудиоисточники с заданными характеристиками направленности (такой степени сложности, как у музыкальных инструментов) вместе с детальным описанием акустического окружения (стены, двери, отражения звука, дифракция и т.д.). При этом происходит сложное моделирование акустического окружения, включая дифракцию, эффект Допплера и изменение акустического окружения, вводимого пользователем. Данный доклад представляет обзор всех эффектов записи, передачи и пространственного воспроизведения в условиях виртуальной реальности.
Доклад Нью-Йоркского Университета «База данных для стерео и 3D-записей для исследований пространственного звука» (пр. 360) содержал результаты записей пространственного звука, выполненных в различных форматах – стерео, бинауральные, 5.1, 7.1, Dolby Atmos и др. 3апись выполнялась с помощью различных микрофонных систем: круговые, Dio Omni, Zylia (это 15 капсюлей на одной стойке) и Holo Hamasaki Array (рис.1). База данных включает также набор импульсных характеристик, выполненных для каждого типа записей и различных окружений. Авторы надеются, что представленная обширная база данных сможет послужить основой для образовательных и научных целей в развитии пространственного звука.

Рис 1 Различные микрофонные системы в студии звукозаписи
Prep. 360 A Diverse Database of Stereo and 3D Recordings for Immersive Sound Research
Autors Yujin Kim 1 and Parichat Songmuang 1 https://aes2.org/publications
Японский доклад «Выявление идентификаторов для сравнения бинауральной и многоканальной системы воспроизведения» (пр. 0238) был посвящен организации субъективной экспертизы для сравнительной оценки качества воспроизведения при бинауральном и многоканальном воспроизведении. Оценка производилась 11 тренированными экспертами по таким параметрам как пространственность, (окружение, реверберация, локализация), частотные характеристики (слишком много/мало низких частот, высоких частот и др.), тембр (яркий, четкий и др), интенсивность и др. Всего было использовано 93 описательных термина. Сравнения показали, что записи в свободном поле (заглушенной камере) показывают, что основное внимание слушателей концентрируется на частотных и интенсивностных терминах, при записях в реальных помещениях – на пространственных и тембральных. Предварительный анализ позволил найти связь этих описательных терминов с таким физическими параметрами, как вариации интенсивности, спектральный центроид, спектральная плотность и др.
Английский доклад «Исследование слушательского опыта в создании поисковых систем звуков, созданных с помощью Искусственного Интеллекта» (пр. 10233) представил методы применения ИИ в использовании и создании поисковых систем спецэффектов, широко применяемых в современных фильмах, телепрограммах и других видах мультимедиа-продукции. Поскольку имеющиеся базы данных, например, BBC Sound Effect Library, требуют больших затрат времени и опыта пользователей, ИИ значительно облегчает и убыстряет процессы поисков и обогащает имеющиеся базы данных.
Доклад «Использование больших языковых моделей с помощью Искусственного Интеллекта для позиционирования объектов в пространственном аудио (пр. 404) анализирует недостатки ручного позиционирования объектов в таких сложных пространственных системах, как Dolby Atmos и Eclipsa, и показывает, насколько применение искусственного интеллекта упрощает и убыстряет этот процесс, и создает основу для адаптивного взаимодействия между инженером и творческим работником.
Совместный англо-китайский доклад «Масштабируемая двухступенчатая система автоматического микширования, объединяющая машинное обучение и знания предметной области» (пр. 10232) предлагает двухступенчатую систему автоматического микширования с использованием нейронных сетей, которая предполагает комбинирование профессиональных знаний с машинным обучением, что позволяет микшировать более 100 треков и обеспечить устойчивое представление для различных музыкальных стилей.
Доклад фирмы Samsung «Применение нейронных эквалайзеров для адаптивной звуковой эквализации в беспроводных вкладных телефонах» (пр. 10247) посвящен проблемам частотной коррекции для вкладных телефонов, которые находят широкое применение в звукозаписи. На моделях различных слуховых каналов с ear-plugs были проанализированы АЧХ для различных типов слуховых каналов и рассчитан каскад из фильтров, рассчитанных на базе нейронных сетей. Полученный нейронный эквалайзер может оперировать более чем 5 млн параметров, обеспечивая оптимальное качество звучания.
Интересный доклад Бельмонтского университета (США) «Влияние цветового освещения на качество восприятия звука» (пр. 375) представил результаты экспериментов по оценке качества восприятия классической музыки при разных условия освещения комнаты прослушивания (рис. 2). Результаты показали, что изменения цвета освещения (особенно голубого и желтого) влияет на оценки таких параметров, как тембральный баланс, пространственная локализация и натуральность музыкальных отрывков по сравнению с нейтральным освещением, что можно использовать при организации концертов и пр.

Рис. 2 изменение цветового освещения
Prep. 375 Effects of Colored Lighting on Audio Quality Perception
Omar Urrutia 1, Arendil Plummer 1, Wesley Bulla 1, and Song Hui Chon
https://aes2.org/publications
Доклад «Измерения слухового качества звука с использованием открытой базы данных Audio Quality (пр. 366) предлагает результаты исследований по изменению слуховых оценок стереосигналов при введении различных искажений. Результаты показывают, что тембр является устойчивым слуховым критерием при введении простых искажений, но деградирует при вводе более сложных изменений сигнала. Ближайшая задача – создать модели, которые интегрируют слуховые и пространственные параметры звука, и оценить их устойчивость к различным искажениям.
Доклад Университета Нью-Йорка «Запись звуков города в 3D: создание бинауральной базы данных для анализа акустических сцен» (пр. 367) представил базу данных с пространственными записями городского шума (рис. 3), которую смогут использовать системы искусственного интеллекта для распознавания окружения, в котором находится объект. Она может использоваться также в системах виртуального окружения, робототехнических сервисов и др.

Рис. 3 Размещение микрофонов на острове Манхэттен в Нью-Йорке
Prep. 367 Capturing the City in 3D: A Binaural Urban Sound Dataset for Acoustic Scene Analysis
Yujin Kim, Parichat Songmuang, and Enoch Chen
https://aes2.org/publications
Доклад Краковского Университета «Изучение влияния бинауральных записей на активацию моторной части мозга» (пр. 397) представил результаты исследований по воздействию пространственного аудио, записанного в бинауральной технологии, на моторную часть мозга. Испытуемым были предъявлены записи звуков прогулки в реальных условиях, фрагмент молчания и отрезок классической музыки. Записывались осциллограммы мозга, при этом активность бета-ритмов (13…18 Гц) увеличивалась на 72,7%, а активность бета-ритмов-2 (18…30 Гц) – на 59,1% во время предъявления звуков прогулки по сравнению с молчанием и музыкой.
Японский доклад «Пространственное маскирование аудиосигналов на различных уровнях подъема в медиальной плоскости» (пр. 363) представил результаты оценки маскирования сигналов, находящихся на различных уровнях подъема в медиальной плоскости. Пороги маскирования сигналов в области 400 Гц остаются почти постоянными при разных уровнях подъема, в районе 1000 Гц пороги варьируются. Результаты показывают, что разница по времени между маскером и маскируемым сигналом, а также соответствующее различие в HRTF влияют на пороги маскирования.
Американский доклад «Создание инфраструктуры для пространственного звука в среде медиа, аудиопредставлений и для обучения» (пр. 395) дает представление о строительстве универсальной студии (рис. 4) (EIS – улучшенная студия пространственного звука) в Аризонском университете, дающей возможность широкого использования различных систем пространственного звука при производстве фильмов, мультимедиа-продукции и для обучения студентов. Оборудованная трехмерной системой громкоговорителей, системами процессоров и возможностями для создания виртуальных систем различного назначения, студия открывает широкие возможности для постановки научных и практических работ.

Рис. 4 Студия звукозаписи
Prep 395 Immersion by Design: Building a Spatial Audio Infrastructure
for Media, Performance, and Pedagogy
Rodrigo Meirelles 1, Steve Ellison 2, Jake Pinholster 3, Fred Vogler 4, Alex Harbaugh 2
1 Arizona State University, Herberger Institute for Design and the Arts, The Sidney Poitier New American Film School.Mesa AZ USA.
2 Meyer Sound, Berkeley CA, USA.
3 University of Illinois Urbana-Champaign, Dean of the College of Fine and Applied Arts, Champaign IL, USA. Founding Director of the ASU MIX Center.
4 Sonitus Consulting, Los Angeles CA, USA
https://aes2.org/publications
Доклад «Обзор интерполяционных методов при измерении передаточных функций головы (HRTF)» (пр. 389) представил сравнительный анализ методов интерполяции дискретных измерений передаточных функций, таких как линейные, билинейные, с помощью сферических функций, а также современные методы с помощью нейронных сетей GANs, и сферических CNNs, что позволяет получить пространственные HRTF и регулировать антропометрию. Устойчивая интерполяция обеспечивает стабильное пространственное воспроизведение через аудиосистемы.
Доклад фирмы L-Acoustics «Улучшенный рабочий процесс для моделирования акустических систем, используемых во внешнем окружении с помощью приложения System Design Exchange» (пр. 10248) предлагает дополнить существующие программы для расчета акустических систем модулем System Design Exchange, позволяющим рассчитывать шумы за счет флюктуаций ветра и др.
Доклад «Оценка слуховой сложности сцен при предъявлении одновременно нескольких звуков» (пр. 372) посвящен важной проблеме для передачи речи, музыкальных телерадиопередач и др., а именно – какое количество источников может слуховая система воспринять и идентифицировать при восприятии музыки и речи. Эксперименты проводились с моно- и стереовоспроизведением, и было установлено, что при стереовоспроизведении количество одновременно идентифицируемых источников больше, чем при моно. Кроме того, было выполнено последовательное предъявление звуков с небольшой временной задержкой (менее 100 мс). Результаты показали, что введение временных различий существенно увеличивает различимость звуков, когда их количество увеличивается более двух.
Доклад Калифорнийского Университета «Восприятие расстояния при определении HRTF, основанных на бинауральном воспроизведении: эффект поворотов головы и реверберации» (пр. 10246) показал, что изучение оценки расстояния в заглушенной камере и реверберационном окружении показывают устойчивое улучшение оценки (и следовательно локализации) при поворотах головы. Эти результаты имеют существенное значение при создании виртуального окружения.
Еще один польский доклад из Краковского Университета «Сравнение численного и экспериментального анализа звукового поля в маленьких комнатах ниже первой модальной частоты» (пр. 396) был посвящен анализу распределения звукового давления в маленьком помещении ниже первой модальной частоты (расчету которых посвящено достаточно много работ), для анализа использовались численные методы МКЭ и экспериментальные (измерения значения давления). Отмечено появление мимолетных нестабильных мод, которые оказывают существенное влияние на общую картину установления звукового поля.
Доклад «Дифференциация ощущений звукового окружения в пространственном звуковом синтезе» (пр. 10251) представил результаты исследований слуховой оценки звукового окружения при создании различных методов звукового синтеза, в частности создании декорреляции звука. Анализ различных способов декорреляции, основанный на слуховой оценке 18 слушателей, показал существенную связь ощущения окружения звуком с различными методами пространственного звукового синтеза.
Японский доклад «Новое оптическое приближение для одновременной 3D-визуализации звукового поля и объекта» (пр. 10236) предлагает новый метод измерения и визуализации звукового поля с помощью оптического интерферометра и последующей цифровой обработки трехмерного звукового поля и объекта. Пример визуализации звукового поля от громкоговорителя на разных частотах показан на рис. 5.

Рис. 5 Визуализация звукового поля и излучателя
Prep. 10236 See Your Audio 3D: A Novel Optical Approach for
Simultaneous Visualization of Sound Fields and 3D Objects
Kenji Ishikawa
https://aes2.org/publications
В совместном итало-американском докладе «Влияние характеристик микрофонов на автоматическое распознавание речи в автомобилях» (пр. 383) представлены результаты анализа различных типов микрофонов на качество автоматического распознавания речи в условиях специфических шумов в автомобильных салонах. Даются рекомендации по подбору АЧХ микрофонов.
Американский доклад «Обогащение реализма для исполнителей на цифровом фортепиано: сравнение 3D— и 6D-степеней свободы при оценке бинаурального аудио с контролем движения головы» (пр. 10243) рассматривает, как достигается и субъективно оценивается движение головы в трехмерном (где учитывается только вращение головы в горизонтальной плоскости) и шестимерном пространстве (где учитываются и перемещения в других плоскостях – вперед, назад, боковые перемещения и др.) (рис. 6). Субъективный анализ показал, что учет 6D-степеней свободы улучшает динамический пространственный реализм, пространственную ясность, окружение и общее предпочтение.

Рис. 6 Движение исполнителя при игре на фортепиано
Prep. 10243 Extending Realism for Digital Piano Players: A Perceptual
Comparison of 3DoF and 6DoF Head-Tracked Binaural Audio
Pingkang Chen 1 and Braxton Boren 2
1 Media Arts and Technology Program, University of California, Santa Barbara, CA, USA
2 Audio Technology Program, American University, Washington, DC, USA
https://aes2.org/publications
Финский доклад фирмы Nokia Technologies «Синтез амплитудно-частотной характеристики смартфонов с использованием метода измерений IMPro» (пр. 10242) представляет собой продолжение работы, представленной на предыдущем конгрессе, где был анализирован метод измерений IMPro для АЧХ микрофонов, встроенных в смартфон, с помощью пробного микрофона. В данном докладе предлагается гибридный метод с помощью этого метода и численного моделирования (метод МГЭ). Результаты показывают, что синтезируемая таким образом АЧХ достаточно хорошо совпадает с АЧХ, измеренной в свободном поле, и предлагаемый гибридный метод может быть использован для оценки АЧХ встроенных микрофонов.
Совместный доклад института технологии из Таиланда и Шведского Королевского технологического института «Как сделать закрытые телефоны прозрачными для собственного голоса вокалистов» (пр. 371) был посвящен проблеме использования виртуального акустического окружения с добавочным применением многополосного эквалайзера для подачи в наушники собственного голоса в различном виртуальном архитектурном окружении (рис. 7).

Рис. 7 Добавление собственного голоса при прослушивании в наушниках
Prep. 371 How to make closed-back headphones transparent for a vocalist’s own direct sound
Munhum Park 1, Sorratorn Ontakhrai 1, Kajornsak Kittimathaveenan 2, Jakob Alfredsson 2, and Sten Ternström 2
1 Institute of Music, Science and Engineering, King Mongkut’s Institute of Technology Ladkrabang, Bangkok, Thailand
2 Division of Speech, Music and Hearing, KTH Royal Institute of Technology, Stockholm, Sweden
https://aes2.org/publications
Доклад Шона Олива «Предпочтительная АЧХ для телефонов при использовании измерительных устройств B&K 5128 и GRAS 45CA-10» (пр. 394) рассматривает новые устройства для измерения наушников (типа «искусственное ухо») (рис. 8) и соответственно предлагает некоторую коррекцию типовых АЧХ, установленных для наушников с учетом импеданса предлагаемых устройств.

Рис. 8 Различные устройства для измерения телефонов
Prep. 394 A Preferred Headphone Target Curve Defined for the B&K 5128 and GRAS 45CA-10 Test Fixtures
Sean E. Olive 1 and Dan Clark 2
1 Sean Olive Audio Consulting, Oak Park, CA, USA
2 Dan Clark Audio, San Diego, CA, USA
https://aes2.org/publications
Доклад Нью-Йоркского Университета «Влияние управляемых высотных микрофонов на опыт пространственного прослушивания» (пр. 10254) содержал результаты прослушиваний с целью оценить высоту расположения верхних микрофонов при записи рояля и системы барабанов (рис. 9). Слушатели оценивали такие параметры как реализм, ширину источника, размер источника, и др. Результаты анализа показали, что изменение высоты микрофонов не оказывает существенного влияния на восприятие реализма восприятия инструментов.

Рис. 9 Расположение высотных микрофонов
Prep. 10254 Impact of Steered Height Microphones of Large Sources on One’s Immersive Listening Experience
Jessica S. Luo and Paul Geluso
https://aes2.org/publications
Японский доклад «Улучшение локализации при бинауральном воспроизведении через передающую систему с временными задержками» (пр. 354) был посвящен проблеме бинаурального воспроизведения сигнала через беспроводные телефоны при контроле движения головы. При перерасчете импульсных характеристик (HRIRs) при движении головы возникают задержки в тракте передачи, что ухудшает качество воспроизведения. В работе предложен метод, при котором несколько сигналов, соответствующих разному положению головы, группируются в 5-8 каналов и панорамируются, затем передаются на канал воспроизведения. В наушниках при повороте головы используется готовая комбинация сигналов, что значительно уменьшает задержку при передаче сигналов и улучшает качество звука.
Доклад «Улучшение разборчивости речи для систем озвучивания в аэропорту» (пр. 403) предлагает систему, рассчитанную с помощью современных программ (типа EASE и др.), которая в условия повышенного уровня шума, большой реверберации и др. позволяет существенно улучшить разборчивость речи, что оценивается с помощью индекса (STIPA). Рекомендовано оптимальное размещение громкоговорителей и звукопоглощающих материалов на стенах, а также использование процессорной обработки.
Доклад Birmingham City University (Англия) «Исследования влияния выбора микрофона на фразовые и вокальные предпочтения при записи мужского Hip—Hop вокала» (пр. 10240) приводит результаты слуховых оценок при записи четырех вокалистов с помощью микрофонов AKG C414, Shure SM7B, Neumann TLM103 и Neumann U87 (рис. 10). Оценки показали, что SM7B показывает большую вариабельность между фразами и вокалистами, C414 и U87 не показывают больших различий между вокалистами, но дают значительную разницу в оценках между фразами, что подтверждает необходимость тщательного подбора микрофонов при Hip-Hop записи.

Рис. 10 Запись мужского голоса
Prep. 10240 Investigating Phrase and Vocalist Dependent Microphone
Preferences for Male Hip-Hop Vocal Recording
Matthew Cheshire and Owen Douglas-Brooks
https://aes2.org/publications
Доклад Stefan Feistel фирма AFMG Technologies GmbH (Германия) «Моделирование и проверка низкочастотных звуковых систем с применением шума» (пр. 373) рассматривает численное моделирование сложных источников сценических акустических устройств, работающих на открытом пространстве в условиях шумов. Предлагается обобщенная модель низкочастотного громкоговорителя с фиксированной характеристикой направленности, которая позволяет вычислить звуковое давление в дальнем и ближнем поле в условиях моделированных или измеренных шумов.
Доклад «Модульные перемещаемые конструкции для управления акустическими параметрами студии» (пр. 393) содержит результаты управления параметрами студии с помощью перемещаемых конструкций: экранов, низкочастотных ловушек, диффузоров и др. Результаты показаны на примере студии (рис. 11) лаурета премии Grammy Адама Айяна.

Рис. 11 Студия с перемещаемыми звукопоглощающими конструкциями
Prep. 393 Modular, Shippable Acoustic Treatments for High-End Mastering Rooms: A Case Study with Adam Ayan
James Lindenschmidt, Vice President- Acoustic Design
https://aes2.org/publications
Китайский доклад «Применение многоканального преобразования Гильберта для музыкальных тонов» (пр. 10250) предлагает метод для создания электронного синтезатора смычковых инструментов. Создание таких синтезаторов встречает многочисленные трудности из-за разнообразных методов игры и сложных музыкальных характеристик. Предлагается новый метод анализа и синтеза музыкальных звуков, включающих многоканальное преобразование Гильберта (MDHT) для музыкальных тонов. Метод предлагает представление входных музыкальных тонов в виде набора параметров, подлежащих обработке и последующему синтезу, что позволяет воспроизводить различные тембры. Демонстрируется готовый синтезатор для струнных инструментов.
Доклад «Оптимизация панорамирования громкоговорителей для адаптивной коррекции звукового поля и нестационарного расположения слушателей» (пр. 385) предлагает новый метод адаптивного панорамирования для многослойных пространственных систем громкоговорителей. позволяющих с помощью цифровых фильтров адаптировать коэффициенты панорамирования к изменению их положения при нестационарном расположении слушателей.
Доклад А.Г. Войшвилло и др. (фирма Harman, США) «Фазовый вкладыш компрессионного драйвера для рупорных громкоговорителей с улучшенной характеристикой направленности на высоких частотах» (пр. 384) посвящен проблеме конструирования драйвера с новым оптимизированным фазовым вкладышем (тело Венте). Как показали расчеты методом конечных элементов и эксперименты, конструкция фазового вкладыша оказывает существенное влияние на форму характеристик направленности на высоких частотах рупорного громкоговорителя. В работе предложены оптимизированная конструкция фазового вкладыша в драйвере с неравной длиной каналов (рис. 12), позволяющая существенно улучшить форму характеристики направленности на высоких частотах.

Рис. 12 Вкладыш в драйвере рупорного громкоговорителя с оптимизированной длиной каналов
Prep. 384 Phasing plug of compression driver with an improved directivity at high frequencies.
Alexander Voishvillo 1, Sebastien Thony 1, and Tommaso Nizzoli 2
1 Harman, JBL Professional, 8500 Balboa Blvd., Northridge, CA 91329, USA
2 FEA consultant, Reggio Emilia, Italy
https://aes2.org/publications
Доклад Бирмингемского Университета «Эволюция восприятия оценки микрофонов для записи ударной установки с пост-процессорной обработкой и без нее» (пр. 10239) был посвящен оценке качества записи ударных барабанов с помощью 11 типов микрофонных систем. Записи прослушивались без обработки и с обработкой, выполненной тремя опытными звукорежиссерами. В прослушивании участвовало 25 участников. Прослушивание показало, что после обработки качество оценок изменилось практически для всех микрофонов, оценки для двух микрофонов остались практически неизменными. Из этого следует, что профессиональная постпроцессорная обработка ведет к улучшению качества звучания микрофонных систем.
В докладе «Перцептуальная оценка собственного голоса в социальной виртуальной реальности, при использовании стандарта MPEG—I «Пространственный звук» (пр. 376) была рассмотрена двухклиентная виртуальная система, включающая визуальное и звуковое представление с помощью аватаров, которая использует предложенную систему воспроизведения в соответствии с новым стандартом MPEG—I «Пространственный звук». При этом производилась слуховая оценка таких параметров, как тембр, задержки звука и общая приемлемость. Производилось процессорная обработка звука: автоматический контроль уровней, динамическая компрессия, уменьшение шума и др. Различные варианты препроцессорной обработки голоса оценивались слушателями. Интересно отметить, что слушатели отмечали качество собственного голоса в необработанном варианте предпочтительнее, чем обработанного.
Итальянский доклад «Синтез импульсной характеристики в моделировании простых моделей» (пр. 399) представил способ улучшения импульсной характеристики в последний временной период ее создания, где из рассчитанной эхограммы (конусным методом, предложенным проф. Farina) воссоздается импульсная характеристика методом взвешенного шума или специального импульсного сигнала. Из-за недостаточной плотности рассчитанных отраженных сигналов в воспроизведенной импульсной характеристике образуются пробелы, которые предлагается заполнить специальными шумовыми импульсами («White grain»). Как показали слуховые эксперименты, это улучшает качество аурализации.
Еще один доклад Краковского университета «Техника измерений на уменьшенных моделях помещений и акустический дизайн для маленьких помещений» (пр. 388) предложил использование измерений и проектирование дизайна маленьких комнат с помощью уменьшенных моделей (рис.13), показавших хорошее совпадение с результатами в реальных помещениях.

Рис. 13 Уменьшенная модель помещения
Prep. 388 Scaled Model Techniques for Measurement and Acoustic Treatment Design in Small Rooms
Bartlomiej Chojnacki
https://aes2.org/publications
Американский доклад «Системы озвучивания для многоцелевых пространств» (пр. 370) содержал анализ общего состояния развития систем озвучивания, включая прогресс в развитии аппаратуры (громкоговорителей, микрофонов, цифровых процессоров и др), а также соответствующего программного обеспечения для целей создания систем, обеспечивающих работу в помещениях многоцелевого назначения, включая системы по коррекции параметров помещения.
Доклад «Пространственная запись с помощью модернизированных систем ORTF-3D и Quad MS» (пр.356) предложил для пространственной записи использовать модернизированные системы ORTF-3D, состоящие из шести кардиоидных микрофонов – два направлены вперед, два под углом 145 градусов и два под углом 55 градусов, установленных вертикально. Кроме того, предложено еще две системы Quad MS and Penta MS с дополнительными боковыми микрофонами. Совместно с процессорной обработкой применение простых и компактных систем обеспечивает пространственную запись, не уступающую по качеству сложным разнесенным микрофонным системам.
Турецкий доклад «Пространственная локализация музыкальных инструментов в 3D акустическом окружении» (пр. 358) представил результаты экспериментов по локализации таких инструментов, как гитара, фортепиано, скрипка и вокал в системе Dolby Atmos. Точность локализации определялась во фронтальной плоскости, боковой, сверху и сзади. Точность была выше для фронтальной и боковой плоскости по сравнению с задней и верхней. Наибольшая точность оказалась для вокала, остальные инструменты локализовались хуже, особенно в задней плоскости.
Японский доклад «Пространственное маскирование аудиосигналов на различных уровнях подъема в медиальной плоскости» (пр. 363) представил результаты по оценке маскирования сигналов, находящихся на различных уровнях подъема в медиальной плоскости. Пороги маскирования сигналов в области 400 Гц остаются почти постоянными при разных уровнях подъема, в районе 1000 Гц пороги варьируются. Результаты показывают, что разница по времени между маскером и маскируемом сигналом, а также соответствующее различие в HRTF влияют на пороги маскирования.
Шведско-таиландский доклад «Виртуальная акустика для хоровых певцов: исследование влияния расположения хора на восприятие певцов» (пр. 392) использовал виртуальное воспроизведение хора в соответствующем помещении на восприятие отдельного «живого» певца при различном положении хора: тесном, боковом и окружном. Певец слушал хор через бинауральное воспроизведение на закрытых телефонах. При этом он оценивал по ряду параметров себя и восприятие хора. Результаты показали, что более распределенная расстановка хора (боковая и окружная) значительно улучшают оценки собственного голоса и восприятие пения хора. Это совпадает с предпочтением большинства певцов при концертном исполнении к более широкой расстановке хора.
Доклад из Бельмонтского университета (США) «Два лучше чем один – влияние временного и интенсивностного панорамирования на пространственное восприятие и слушательские предпочтения» (пр.390) представил результаты анализа, как временное и интенсивностное панорамирование и их комбинация влияет на восприятие таких параметров у слушателя, как экстернализация (вынос слухового образа из головы), окружение, глубина и ширина источников. Результаты показали, что при прослушивании через наушники ощущение глубины было значительно лучше при комбинированном панорамировании. При воспроизведении через громкоговорители преимущества комбинированного метода были еще существеннее.
Американский доклад «Определение акустической мощности по измерениям в ближнем поле для автоматической эквализации помещения» (пр. 10252) предлагает эффективный метод измерения акустической мощности в помещении. Обычно для определения акустической мощности производятся измерения звукового давления в разных точках помещения, для чего требуется не менее 36 микрофонов. Предлагаемый метод использует измерение давления в ближнем поле со значительно меньшим количеством микрофонов. Измерения предполагают анализ АЧХ каждого громкоговорителя в ближнем поле и их корректное суммирование с последующим пересчетом в акустическую мощность. Результаты показали, что в диапазоне 40…200 Гц ошибка составляет 2,7 дБ.
Доклад Нью-Йоркского университета «Влияние движения головы на бинауральную экстернализацию среди различных демографических групп слушателей» (пр. 10253) представил результаты исследований по субъективной оценке экстернализации при движении головы. Исследование проводилось среди 23 субъектов, различающихся по возрасту, музыкальному опыту и опыту бинаурального прослушиваниия. Результаты показали, что значительных различий в экстернализации среди различных групп слушателей нет, но есть значительные различия в оценке «окрашивания» звука.