151 конгресс AES: научные результаты
Автор: Ирина Алдошина
С 11 по 31 октября 2021 года в режиме онлайн прошел очередной 151 конгресс AES. Все основные мероприятия, которые обычно проводятся на этих конгрессах, были представлены и здесь: научная сессия, семинары, студенческие мероприятия, заседания технических комитетов и пр.
Традиционную мемориальную «Хайзеровскую» лекцию, прочитал на этом конгрессе композитор и специалист по электронной музыке профессор Джон Чоунинг (рис. 1), темой была «Частотная модуляция в звуковом синтезе».
Джон Чоунинг
Эта лекция была продолжением его лекции на предыдущем конгрессе и входит составной частью в общую теорию композиции электронной музыки, которой он занимается многие десятилетия.
На научной сессии работало одиннадцать секций, на которых было представлено 67 докладов. Наиболее интересные из них рассмотрены ниже.
На секции «Преобразователи» обратили на себя внимание следующие доклады:
— доклад Ф. Кохендорфера (компания Samsung) «Дизайн громкоговорителя для тонких телевизоров» (пр. 10519) содержит анализ существующих конструкций громкоговорителей для очень тонких телевизоров и других устройств, специфика которых состоит в том, что нужно обеспечить очень маленькую толщину преобразователя и при этом сохранить достаточную амплитуду смещения диафрагмы для обеспечения нужного уровня звукового давления. В работе предлагается новая конструкция громкоговорителя (рис. 2) толщиной 6,5 мм с центральным расположением магнитной цепи, и с применением магнитной жидкости в зазоре. Общая площадь диафрагмы 17 см2. Громкоговоритель обеспечивает частотный диапазон 100 Гц…15 кГц и давление порядка 80 дБ.
Рис 2 Конструкция тонкого громкоговорителя для ТВ
— финский доклад «Влияние положения руки пользователя на акустические характеристики мобильных телефонов» (пр. 10522) содержит результаты сравнительного анализа положения руки пользователя сотового телефона на распределение звукового давления вокруг него (рис. 3).
Рис 3 Распределение звукового давления вокруг телефона
Показано, что в зависимости от формы и положения ладони амплитудно-частотная характеристика может изменяться (с появлением пиков до 10 дБ). Результаты были проверены на компьютерных моделях. Они показывают, что надо разрабатывать новые методы измерения АЧХ сотовых телефонов с учетом формы и положения руки.
— испанский доклад «Кластеризация амплитудно-частотных характеристик для построения в 3Dпространственных характеристик направленности громкоговорителей» (пр. 10527) рассматривает проблемы построения пространственных характеристик направленности громкоговорителей. Для построения таких характеристик с разрешением 5 град необходимо записать 2664 амплитудно- и фазочастотные характеристики под соответствующими углами расположения микрофона относительно громкоговорителей в широком диапазоне частот (рис. 4).
Рис 4 Формирование характеристик направленности из записанных под разными углами АЧХ
Поэтому обычно ограничиваются записью характеристик направленности в двух плоскостях – горизонтальной и вертикальной. В докладе предложен алгоритм кластеризации (объединения) похожих АЧХ и ФЧХ с целью сокращения времени измерений примерно в 10 раз.
— в докладе Р. Сёренсена и Ф. Агерквиста «Модели громкоговорителя с учетом фрикционных элементов» (пр. 10530) предлагается дополнить широко используемые схемы электромеханических аналогий для расчета электродинамических громкоговорителей дополнительными элементами, учитывающими гистерезисные потери в подвесе и звуковой катушке. Это позволяет рассчитать нелинейные процессы в громкоговорителях с учетом ограничений, появляющихся при замене громкоговорителя системой с сосредоточенными параметрами.
— компания Samsung Research America представила доклад «Применение систем искусственного интеллекта (AI) для нелинейного управления громкоговорителями» (пр. 10535), в нем предлагается система контроля нелинейных искажений в громкоговорителях с использованием нейронных систем (NN) (рис.5). Предлагаемая система позволяет управлять смещением диафрагмы и регулировать величину подводимого напряжения при подаче реального сигнала для сохранения нелинейных искажений на определенном уровне.
Рис 5 Схема управления смещением диафрагмы громкоговорителя с применением нейронных сетей (NN)
— в докладе А. Войшвилло (компания JBL) «Акустика ненаправленных громкоговорителей» (пр.10543) анализируется история развития конструкций ненаправленных громкоговорителей и предлагается аналитический и численный анализ двух конструкций ненаправленных рупорных громкоговорителей: высокочастотного, использующего кольцевую диафрагму со специальным вкладышем (фазосдвигателем), и низкочастотного, использующего вертикально ориентированную диафрагму, излучающую в цилиндрическую полость, сопряженную с горизонтально ориентированным рупором (цифровая модель показана на рис.6).
Рис 6 Цифровая модель низкочастотного рупора
На этой же секции было представлено несколько инженерных записок: из них можно отметить две: «Автоматическая классификация типов корпусов громкоговорителей» (e-Brief 650), где предлагается с помощью нейронных сетей определять тип оформления из записанной частотной характеристики импеданса;
«Измерение температуры звуковой катушки с помощью ультразвукового пилот-тона» (e-Brief 658), в нем предлагается использовать ультразвук для модуляции основного сигнала, и по изменению импеданса, измеренного на этом ультразвуковом пилот-тоне, определять изменение температуры звуковой катушки.
На секции «Архитектурная акустика» можно выделить несколько докладов. — в докладе «Влияние акустики зала на исполнение певцов» (Таиланд) (пр. 10531) представлены результаты эксперимента, в котором записывалось пение певцов (рис. 7) в залах с различным временем реверберации: 0,3 с, 1,8 с, 3,4 с.
Рис 7 Запись певцов в ближнем поле
При этом анализировалось, как меняются параметры голоса (динамический диапазон, средний уровень звукового давления и др.). Установлены коэффициенты корреляции с временем реверберации.
— Два доклада были посвящены актуальной проблеме улучшения характеристик громкоговорителей в помещении «Деконволюция импульсной характеристики зала при возбуждении несколькими громкоговорителями» (пр. 10509) и «Автоматическая эквализация помещения с помощью моделей искусственного интеллекта» (пр. 10520) (Samsung Research America). Записанный в любой точке помещения сигнал может быть представлен как свертка (конволюция) импульсной характеристики помещения и сигнала источника. Акустические характеристики помещения существенно искажают сигнал источника, на его АЧХ появляются дополнительные пики-провалы (рис. 8).
Рис 8 Импульсная характеристика и АЧХ громкоговорителя в помещении
Для выравнивания АЧХ используется техника деконволюции, выделяется импульсная характеристика помещения, производится ее процессорная обработка и снова выполняется свертка с сигналом источника, полученный при этом сигнал значительно лучше воспринимается слушателем. В представленных докладах предлагается новая методика, учитывающая несколько источников сразу и использующая автоматизированные системы искусственного интеллекта для выполнения этих операций.
Интересен ряд докладов на секции «Психоакустика».
— в японском коротком докладе «Эволюция оценок микшированных акустических сигналов с различными пространственными характеристиками» (Е-653) представлены результаты эксперимента, в котором разные инструменты (гитара, барабан и др.) записывались в помещениях с разным временем реверберации, создавались миксы из инструментов, записанных в этих помещениях и проводились прослушивания, результаты показали ,что наилучшее впечатления производят записи, где все инструменты записаны в одинаковых условиях.
— в инженерной записке «Бинауральное микширование популярной музыки» (Е-665, Англия) изучался вопрос, дает ли преимущество бинауральное микширование (с учетом передаточных функций головы) при записи типичной электронной танцевальной музыки. Прослушивание проводилось с 21 экспертами, которые оценивали пространственность, тембр и другие качества записей. Результаты показали, что не для всех жанров и инструментов бинауральное микширование дает преимущества, в частности для барабанов стереопанорамирование оценивалось выше, а при записи гитар бинауральное микширование оценивалось лучше по ощущению пространства.
На секции «Процессорная обработка аудиосигналов» также был ряд интересных докладов.
— в немецком докладе «Формирование характеристик направленности для линейки микрофонов с помощью нейронных сетей» (пр. 10508) предложен новый алгоритм формирования объемной управляемой характеристики направленности распределенных в пространстве систем микрофонов, позволяющий разделять речевые сигналы и выделять их на фоне шумовых помех и реверберации.
— доклад «Визуализация аудиоисточников для громкоговорителей с плоскими панелями» (пр. 10510) представляет способ анализа колебаний плоских излучателей при различном распределении вибровозбудителей на обратной стороне излучающей панели (рис. 9).
Рис 9 Распределение смещения на поверхности плоских громкоговорителей
Панели таких громкоговорителей в настоящее время пытаются совмещать с дисплеями в телевизорах и смартфонах, поэтому методы их анализа и модернизации являются актуальными.
Секция «Применение аудио»:
— в докладе «Объектно-ориентированный метод для сравнения различных представлений характеристики направленности» (пр. 10521) анализируются различные программные методы представления объемных характеристик направленности различных источников звука. Поскольку применяемые методы существенно различаются, то чрезвычайно трудно сравнивать результаты и использовать их для проектирования и расчетов. В работе предлагается унифицированный инструмент, основанный на расчете сферических и гиперсферических гармоник, который позволяет сравнивать и унифицировать результаты (рис. 10).
Рис 10 Объемная характеристика направленности
— в короткой инженерной записке «Поворотное устройство для измерения электро-акустических преобразователей» (Е-646) предлагается новый вид управляемых компьютером поворотных устройств для громкоговорителей и микрофонов, являющихся необходимым элементом измерения их характеристик направленности (рис. 11)
Рис 11 Новая конструкция поворотного устройства
— «Интегрирование вибрато в устройства искусственной реверберации» (Е-654) предлагается в алгоритмы цифровых ревербераторов, которые разрабатываются уже давно, ввести новый эффект – вибрато за счет введения в матрицу обратных связей частотной модуляции, что, по мнению авторов, создает дополнительные слуховые эффекты.
На секции «Пространственный звук» было представлено наибольшее количество докладов, из них можно отметить следующие.
— в немецком докладе «Слуховая оценка различных алгоритмов панорамирования пространственных систем» (пр. 10513) на основе выполненных экспериментов показано, что наилучшие результаты по тембральным и пространственным оценкам для системы 7.1 (рис.12) получил способ панорамирования по системе VBAP (векторное амплитудное панорамирование), разработанной профессором Пулкки.
Рис 12 Зона размещения мнимых источников
— доклад из Цюрихского Университета «Сравнение техник звукозаписи с использованием различных микрофонных систем для бинаурального воспроизведения» (пр. 10517) представляет собой анализ субъективных экспертиз записей, сделанных с различными системами микрофонов (рис. 13) для пространственного бинаурального воспроизведения, которое находит все более широкое применение при воспроизведении на сотовых телефонах.
Рис 13 Запись с различными системами микрофонов
Для сравнения были выбраны записи с помощью таких микрофонных систем, как ORTF-3D, 2L-Cubeinspired, Decca Tree с высотными микрофонами, ESMA-3D, разнесенная в пространстве система кардиоидных микрофонов, и «Искусственная голова». Сравнение производилось по качеству воспроизведения тембра, пространственности и точности локализации. Общее предпочтение получила система АВ (как главные микрофоны) совместно с системой «Искусственная голова».
— в докладе «Применение и оценка пространственной системы Амбисоник высокого порядка в многоцелевых условиях» (пр. 10518), анализируется дальнейшее развитие систем пространственного звука типа Амбисоник, рассматриваются новые программные средства и соответствующая аппаратура для систем третьего порядка. Это значительно расширяет возможности ее применения, в частности в системах виртуальной реальности.
— японский доклад «Пространственное слуховое маскирование между реальными звуковыми сигналами и виртуальными звуковыми образами» (пр. 10524) посвящен проблеме, возникающей при воспроизведении звука с помощью распределенных пространственных систем, где наряду с реальными звуковыми сигналами возникают виртуальные мнимые источники. Авторы изучили степень маскировки этих виртуальных источников реальными сигналами при их одновременном восприятии и установили, что степень маскировки практически такая же, как и при одновременном восприятии реальных звуковых сигналов.
— в докладе профессора В. Вошчикa (университет McGill – Канада) «Слушательские тесты для оценки взаимодействия помещения с источником при использовании экспериментальных поканальных пространственных импульсных характеристик помещения» (пр. 10523) рассматривается новый метод создания искусственной реверберации с помощью свертки многоканальных записей источника (рис. 14) с поканальными импульсными характеристиками помещения. Результаты слушательских тестов показали значительное увеличение заметности пространственных эффектов в помещении.
Рис 14 Многоканальная запись инструмента
В докладе «Синтез реверберационных импульсных характеристик из аудиосигналов: автореверберация и интерактивное окружение» (пр. 10539) предлагается алгоритм выделения импульсной характеристики помещения из записанного в данном помещении аудиосигнала. Это открывает большие возможности для коррекции параметров помещения с последующей конволюцией эквализованной импульсной характеристики с аудиосигналом, применения кросс-корреляции (выделение импульсной характеристики из одного сигнала и применение ее к другому) и др.
Две инженерные записки (Е-652 и E-660) были посвящены вопросам выбора микрофонных систем для записи звука по системе Амбисоник, в частности рассматривались различные варианты записей с помощью специальных тетраидальных микрофонов (Soundfield) в сочетании с точечными микрофонами по системе АВ и распределенными системами микрофонов. Субъективные оценки показали преимущество записей с первым вариантом размещения микрофонов.