Бинауральная стереофония принадлежит к группе технологий для записи, воспроизведения и синтеза пространственного звука. Идея бинауральной звукозаписи не нова, первые записи были выполнены по этой технологии в 30е года прошлого века, однако в настоящее время можно говорить о новом этапе развития и актуализации бинауральной стереофонии. Об этом свидетельствует интерес научного сообщества и обширные области применения бинауральных технологий. Бинауральная стереофония используется для музыкальных записей, как в концертной, так и в студийной практиках, для записи радиопостановок. Бинауральные технологии находят практическое применение в акустических экспериментах и слушательских тестах, применяются в архитектурной акустике для создания аурализационных моделей. Крупнейшая радиовещательная компания BBC с 2011 года регулярно передает бинауральные записи на канале Radio1 (Англия). Французская компания RadioFrance также имеет несколько программ, в том числе и записи концертов, в бинауральном формате. Всё это свидетельствует об актуальности данного исследования.
|
|
Бинауральная пространственная локализация
Бинауральная пространственная локализация реализуется за счет наличия двух приемников слуха, что обеспечивает способность локализовать сигналы, как от одиночных, так и от множественных источников. При этом в слуховой системе определяется азимутальное направление на источник звука в горизонтальной плоскости, его вертикальное возвышение над горизонтальной плоскостью и расстояние до источника (глубина), формируя, таким образом, пространственный звуковой образ.
Механизмы локализации в горизонтальной, вертикальной плоскостях и по глубине имеют существенные отличия. Горизонтальная (азимутальная) локализация обусловлена тремя физическими факторами: ITD (interaural time difference) разницей по времени моментов прихода одинаковых фаз звуковой волны; ILD (interaural level difference) разницей по интенсивности; спектральными различиями. Локализация в вертикальной плоскости связана с дифракцией на ушных раковинах и торсе. Локализация по глубине зависит от изменения уровня звукового давления и соотношения прямого и отраженного звука в помещении. Подробнее механизмы пространственного слуха описаны в работе Блауэрта [7]. Принципы бинауральной пространственной локализации являются основополагающими для создания систем пространственной звукозаписи и звуковоспроизведения, к которым относится система бинауральной звукозаписи.
Краткая история бинауральной звукозаписи
История бинауральной звукозаписи началась задолго до появления теоретических знаний о механизмах работы слуховой системы. Идея заключалась в том, чтобы на вход слуховой системы поступали два звуковых сигнала, записывалось значение их звуковых давлений в слуховом канале, затем эти данные передавались по двум каналам и воспроизводились через стереотелефоны, при этом у слушателя должно было возникать ощущение первичного пространственного звукового поля.
|
|
Первым шагом к реализации бинауральной стереофонии была запись французского изобретателя Клемента Адера. В 1881 году он установил несколько микрофонов на сцене Парижской оперы, а записываемые сигналы подавал на головные телефоны. Слушатели впервые могли услышать пространственный звук. Дальнейшие исследования проводились в лабораториях Белла (Bell laboratories), где в период с 1931г по 1932г были выполнены экспериментальные записи симфонического оркестра. Тогда впервые была продемонстрирована первая микрофонная система «искусственная голова», которая получила название «Oscar». Система представляла собой модель человеческой головы с двумя микрофонами, размещенными в полостях, соответствующих положениям ушных раковин.
Следующий важнейший этап развития бинауральной звукозаписи приходится на 70е годы XX века, в это время фирмы Neumann и Sennheiser выпускают бинауральные микрофонные системы «искусственная голова» для коммерческого использования. На сегодняшний день в научно-практических целях используются системы таких фирм как Neumann (KU-100), Brüel & Kjær (HATS 4128/5930), Knowles Electronics (Kemar X). Все они представляют собой достаточно точные модели головы с ушными раковинами и миниатюрными микрофонами в слуховых каналах. Их использование позволяет записывать и анализировать первичные сигналы.
Варианты воспроизведения бинауральных записей
Воспроизведение бинауральных сигналов производится, прежде всего, через стереотелефоны, т.к. они обеспечивают разделение каналов воспроизведения, акустическую изоляцию от вторичного поля и располагаются наиболее близко к барабанным перепонкам.
Воспроизведение через головные телефоны имеет целый ряд преимуществ:
-обеспечивает слушателя вынесенным за пределы головы пространственным звуковым образом (это явление называется экстернализацией) с четкой локализацией виртуальных звуковых источников в пределах всей горизонтальной плоскости, в то время как, при прослушивании обычных стереофонических сигналов через головные телефоны возникает явление латерализации, т.е. локализации виртуальных источников внутри головы слушателя.
-обеспечивает значительно более реалистичную передачу акустических свойств первичного помещения за счет более точного восстановления структуры первичного реверберационного процесса и передачи реалистичных тембральных характеристик звукового сигнала.
Однако при прослушивании бинауральных сигналов были выявлены определенные проблемы: недостаточно точная локализация расстояния до источника; ошибки типа «фронт-тыл», погрешности, возникающие из-за индивидуальных особенностей морфологического строения ушных раковин.
Причиной их возникновения являются искажения, вносимые акустическим трактом, состоящим из микрофонов, линий связи и излучателей головных телефонов. Потерями полезного сигнала на линиях связи можно пренебречь; современные микрофоны имеют почти ровную амплитудно-частотную характеристику, следовательно, погрешности возникают в основном в преобразователях внутри телефонов, в связи с чем необходима предварительная обработка бинауральных сигналов и калибровка головных телефонов.
Исследования, выполненные в работе H. Moller, D. Hammershoi [16] показали, что большинство головных телефонов не обладают ровной частотной характеристикой необходимой для точного воспроизведения бинауральных сигналов, а некоторые модели имеют сложную структуру АЧХ, особенно в области высоких частот (на частотах выше 7kHz). Калибровка применяется для компенсации искажений, вносимых неравномерностью частотной характеристики телефонов, с учетом их передаточных функций HpTFs (headphone transfer functions), которые описывают процесс распространения звуковой волны от излучателей телефонов до барабанных перепонок слушателя.
|
|
При выборе головных телефонов важным аспектом является соотношение давлений PDR (pressure division ratio), характеризующее отношение импеданса на входе в слуховой канал при прослушивании в свободном поле, к импедансу при нагрузке его на головные телефоны. Если это отношение стремится к единице, то головные телефоны определяются как «открытые» (Free-air coupling equivalent) и дополнительной компенсации не требуют. Если это условие не выполняется, то калибровка телефонов должна быть выполнена с учетом PDR.
Сложность калибровки телефонов обусловлена тем, что передаточные функции телефонов (hptfs) зависят не только от индивидуальной морфологии, но и от расположения телефонов на голове слушателя. Для решения этой проблемы в настоящее время используют компьютерное моделирование передаточных функций головы и головных телефонов. Однако для точного воспроизведения бинауральных сигналов рекомендуется применять индивидуальную калибровку, т.е. с измерениями с учетом индивидуальных HpTFs, как было показано в работе H. Moller [17].
В связи с развитием мобильных устройств активное распространение получили «вкладные» головные телефоны (earphones, insert heapdhones). Они полностью блокируют слуховой канал, отличаются качественной передачей низкочастотных составляющих и позволяют производить воспроизведение на сравнительно низких уровнях вследствие значительного ослабления уровня фоновых шумов. В работе [11] представлены возможности воспроизведения бинауральных сигналов на таких телефонах.
В настоящее время разработаны специальные цифровые процессоры для стереотелефонов, производящие частотную фильтрацию сигналов и обработку с учетом передаточных функций головы, ушных раковин и их индивидуальных морфологических особенностей[9]. Их использование позволяет обеспечить более точную локализацию пространственного образа, избежать ошибок «фронт-тыл», и существенно увеличить естественность звучания. Так же разработаны и продолжают развиваться технологии отслеживания движения головы (head-tracking), позволяющие производить оценку локализации бинаурального источника при изменении положения головы, примером может служить система Headzone Beyerdynamic [6]
|
|
Воспроизведение через громкоговорители. Со времени первых экспериментов по звукозаписи бинауральных сигналов предпринимались попытки их воспроизведения через громкоговорители, поскольку при этом восприятие звука происходит более естественно, что приводит к меньшей утомляемости слушателя. Однако, при подаче сигналов, записанных в ушах слушателя или на искусственной голове, на два громкоговорителя возникают перекрестные связи, которые приводят к сжатию виртуального источника во фронтальной плоскости с потерей пространственного образа. Правильная передача пространственной информации через громкоговорители возможна практически для одной точки (sweet spot), при условии подавления перекрестных связей. При этом даже незначительное (7-10см) смещение центра головы слушателя приводит к значительному ухудшению восприятия пространственного образа. Кроме того, влияние реверберации во вторичном поле затрудняет оценку азимутальной локализации источника, особенно в тыловой области. Данные ошибки проявляются, когда время стандартной реверберации в помещении прослушивания превышает 0.3 секунды.
Первые системы, реализующие подавление перекрестных связей при бинауральном воспроизведении назывались TRADIS (true reproduction of all direction stereophony). Они основаны на технологии, разработанной в лабораториях Белла B.Atal и M.Schroeder [3]. Идея заключается в добавке задержанного по времени и инвертированного по фазе сигнала одного громкоговорителя в канал второго и наоборот. Подробный анализ проблемы возникновения перекрестных связей и технологии их компенсации приведен в работе [8].
Для подавления перекрестных связей в настоящее время разработаны бифонические процессоры, которые за счет корректирующей частотной и фазовой фильтрации, а также временной задержки, обеспечивают компенсацию перекрестных сигналов при заданном положении громкоговорителей и фиксированных координатах слушателей.
Особое внимание в современных исследованиях уделяется влиянию структуры помещения прослушивания на воспроизведение бинауральных сигналов через громкоговорители. В результаты ряда исследований показали, что добавление искусственной реверберации, а именно ранних отражений, значительно повышает качество экстернализации виртуальных источников [4].
При воспроизведении бинауральных записей через стереофонические системы возникают проблемы, связанные с неравномерностью АЧХ на высоких частотах, что приводит к искажению тембральных характеристик источников. Причина возникновения пиков и провалов АЧХ заключается в том, что при записи на искусственной голове сигналы проходят обработку на ушных раковинах, выполняющих роль дифракционных фильтров. Для точной звукопередачи тембров и совместимости со стереофонией применяется эквализация (по свободному или по диффузному полю). Эквализация по диффузному полю менее зависима от индивидуальных особенностей, чем эквализация по свободному полю, т.к. использует пространственное усреднение. [18].
Одним из перспективных направлений современных исследований является разработка алгоритмов кодирования форматов многоканального аудио в бинауральный формат и наоборот, что позволит значительно расширить возможности воспроизведения бинауральных записей. Такие исследования на протяжении последних лет проводятся в университете Аалто, в Финляндии (Aalto University). Теоретические основы кодирования пространственной звуковой информации изложены в работе Ville Pulkki [19].
Возможности применения бинауральной стереофонии
- Бинауральная стереофония реализует одну из современных концепций звукозаписи, позволяя слушателю, где бы он ни находился, ощутить себя в первичном поле (концертном зале), т.е. реализует «эффект присутствия». Таким образом, бинауральная звукозапись является одной из перспективных технологии звукозаписи концертов.
- Современные технологии звукорежиссуры позволяют микшировать бинауральные сигналы с сигналами, записанными другими микрофонными системами, создавая реалистичные трехмерные звуковые образы с четкой передачей акустических характеристик звуковых источников и помещения, в котором производилась запись.
- Широкое применение бинауральные технологии получили в связи с развитием бинаурального синтеза. Как известно, бинауральные сигналы должны быть записаны в ушных каналах слушателя или на искусственной голове. Однако с развитием компьютерных технологий появился ещё один вариант получения бинауральных сигналов, они могут быть синтезированы на компьютере путем «свертки» монофонического сигнала источника с парой бинауральных фильтров, которые содержат информацию о передаточных характеристиках и описывают пути распространения звуковой волны от источника до барабанных перепонок слушателя. Бинауральный синтез используется для построения аурализационных моделей в системах моделирования помещений [13]. Данные системы используются в архитектурной акустике для расчета физических параметров проектируемых концертных и зрительных залов, театров, сцен и т.д. Благодаря бинауральному синтезу и технологиям аурализации стало возможным прослушивать музыкальные записи в различных помещениях в процессе их проектирования [15].
- Одним из самых перспективных направлений в использовании бинауральных технологий является создание систем «виртуальной реальности». В системах виртуальной реальности [5,14] целью является моделирование несуществующей окружающей среды. Для этого необходимым условием является использование бинауральных передаточных функций, записанных или рассчитанных в помещениях, которые подлежат моделированию, с последующей сверткой их с музыкальным сигналом.
- С помощью бинауральной технологии, как было предложено финскими учеными из исследовательского центра компании Nokia [12], возможно создание трехмерного звукового пространства, состоящего из натуральных и синтезированных звуков. Практическая реализация данной модели позволяет расширить горизонты естественного восприятия слушателя, поместить его в совмещенную реальную и виртуальную звуковую среду.