История кодирования пространственного звука

Для того чтобы понять закономерности в развитии пространственных систем звукопередачи и способах их кодирования, имеет смысл посмотреть на историю их развития.

Важность восприятия звукового пространства была понятна задолго до появления средств записи звука. На протяжении веков создавались помещения (храмы, театры, концертные залы и др.), где обеспечивалось «погружение» слушателя в звуковое пространство.

Цель современных средств кодирования звука состоит в передаче некоторых признаков сигнала, позволяющих слушателю ощутить пространственное окружение. При этом можно выделить две тенденции: передача некоторых физических параметров первичного звукового поля и передача некоторых психоакустических характеристик, вызывающих у слушателя ощущение нахождения в первичном пространстве.

Для всех систем пространственной передачи звука характерны некоторые общие элементы: средства для записи звука (например, различные типы микрофонных систем); средства для кодирования исходных сигналов в некоторую новую систему комбинированных сигналов; средства для декодирования на принимающей стороне; средства для воспроизведения звуковых сигналов (через акустические системы или стереотелефоны). Принципиальная трудность состоит в том, что в любой системе трехмерное звуковое поле необходимо записать и воспроизвести с помощью точечных источников, таких, как микрофоны и громкоговорители. Правда, слуховая система человека обладает способностью воспроизвести трехмерное звуковое пространство с помощью двух точечных приемников (двух ушей) за счет специальных методов фильтрации и последующей обработки.

Кроме того, создаваемая техническая система пространственной передачи звука должна быть экономически эффективной, практически реализуемой и устойчивой к изменению положения слушателя относительно системы.

Первый период - начало развития. Теоретические основы пространственных аудиосистем были заложены еще до 1800 года в трудах великих ученых Фарадея, Генри, Ома, Гельмгольца и др. В 1876 году великий изобретатель Александр Бел продемонстрировал публике свое изобретение - телефон. Практически в это же время аналогичную заявку подал другой изобретатель Элайджа Грей. Ценность этих изобретений состояла прежде всего в том, что были открыты принципы электроакустического преобразования в обоих направлениях, которые составили основу для последующего развития микрофонов, телефонов, громкоговорителей и другой аппаратуры.

Уже через год в 1877 году Томас Эдисон демонстрировал устройство для записи и воспроизведения звука (фонограф). В 1889 году он показал первые движущиеся картины, используя новую систему записи на 35-миллиметровую пленку (в первом фильме был снят ассистент Эдисона - Фред Отт). Эдисон собирался соединить изображение со звуком.

В 1894 году Гульельмо Маркони продемонстрировал беспроводную передачу звука, т. е. радиосвязь (у нас-то все знают, что первым это сделал А.С. Попов, но в Америке об этом практически неизвестно).

В 1898 году Вальдемар Паульсен получил первый патент на устройство магнитной записи звука, используя стальную проволоку как носитель. Л. Гамонт уже в 1901 г начал эксперименты по оптической записи звука на пленку. После изобретения в 1906 году вакуумной лампы-триода Ли де Форестом начались работы по использованию электрического усиления для передачи звука и к 1930-м годам техническая база для записи и передачи моноурального звука была уже сформирована.

Первые попытки передачи пространственного звука можно отнести к 1881 году, когда Клемент Адер установил серию микрофонов на сцене Парижской Оперы и сигналы от них подал по проводам к головным телефонам в некоторые комнаты ближайшего отеля. Слушатели впервые могли слышать пространственный звук - это был первый шаг к бинауральной стереофонии. Эти эксперименты не вызвали большого интереса, и только в 1915 году появился патент Е. Амета, в котором предлагалась система пространственного звуковоспроизведения через несколько громкоговорителей, расположенных на сцене и в зале (для кино). Запись была монофоническая, но предлагался некоторый способ панорамирования звука через эти громкоговорители. К 1930-м годам, когда была окончательно сформирована техническая инфраструктура моносистем передачи звука, в лаборатории Bell Labs (США) начались интенсивные работы по совершенствованию систем пространственной передачи, материально и морально поддержанные знаменитым дирижером Леопольдом Стоковским.

В этот же период произошло экстраординарное событие: 14 декабря 1931 года английский изобретатель Алан Блюмлайн получил патент №394325, который содержал более 70 пунктов практически на все элементы стереофонической системы передачи звука.

В нем было указано:

• требуемая микрофонная техника, в частности, использование для записи двух микрофонов с характеристиками направленности в виде восьмерки, расположенных в одном месте, т. е. разновидность современной системы ХУ, которая сейчас называется системой Блюмлайна;

• система записи стереозвука на разные стороны одной дорожки на диске, расположенные под углами 45 град, (стереотехника 45/45). Этот способ записи еще несколько раз потом изобретался, пока ни стал широко применяться в промышленном производстве;

• система стереорадиовещания, в частности использование AM и ЧМ с одной несущей для передачи двух звуковых каналов;

• суммарно-разностное матрицирование для совместимости с моносистемой;

• дополнительное матрицирование звука в левый-правый, передний-задний канал.

Кроме этих в патенте содержались и многие другие технические решения, которые примерно на 20 лет опережали время и не были восприняты современниками. В 1935 году Блюмлайн создал первый фильм с оптической стереозаписью звука. В "награду" за это кампания EMI, где он работал, перепрофилировала его аудиогруппу в подразделение по разработке радаров. Во время испытаний радарной системы на самолете он погиб в авиакатастрофе.

Работы Блюмлайна долгое время оставались неизвестными (только недавно появилась книга о нем, а вот работы, проводившиеся в Bell Labs, активно развивались и широко демонстрировались.

В 1933 году Флетчер и другие сотрудники лаборатории Bell Labs, пытаясь расширить зону стереоэффекта, добавили третий громкоговоритель в центре. Они продемонстрировали запись и проводную передачу звука по такой системе из Национальной академии наук в зал Конституции в Вашингтоне. В этом же году были выполнены и продемонстрированы в Чикагском выставочном центре первые бинауральные записи на "искусственной голове".

Интересно, что А. Келлер из лаборатории Bell Labs в 1936 году заново открыл систему стереозаписи на диске 45/45, однако и тогда руководство лаборатории не увидело в открытии практического применения. Только в 1950-е годы фирма Westrex Corporation в третий раз запатентовала принцип стереозаписи на диске 45/45.

В 1936 году была предложена Philips-Miller система для записи двухканального звука на специальной дорожке кинопленки, причем система была способна записывать стереозвук достаточно высокого качества.

Решающим для пространственного звука стал 1940 год, когда Флетчер и знаменитый дирижер Стоковский продемонстрировали в концертном зале Карнеги-холла новую трехканальную систему записи. Звук записывался оптическим способом на три трэка пленки, четвертый трэк использовался для записи контрольных сигналов. В системе был применен широкополосный компандер, что позволяло передавать широкий динамический диапазон.

В этом же году на экраны вышел фильм "Fantasia" (музыкальное сопровождение записал оркестр под руководством Стоковского), в котором была использована система пространственного звука, получившая название Fantasound. В системе звук записывался оптически на четыре трэка, из них контрольный трэк позволял панорамировать звук на любой из десяти громкоговорителей в зале: левый, центральный, правый, боковые и задние. Однако система Fantasound не вызвала интереса.

Во время войны в 1942 году на германском радио в Берлине впервые была продемонстрирована только что созданная система магнитной стереозаписи.

В 1948 году произошли три события, имевшие большое значение для будущего развития пространственного звука: введен новый формат для бытовой звукозаписи на 331 /3 оборота, создано общество Аудиоинженеров (AES) и изобретен транзистор.

Второй период - расцвет стереозвука. В 1950-е годы стереозвук окончательно пришел в аудиотехнику. Передовым звеном использования пространственного звука стало кино. В 1952 году была впервые продемонстрирована новая система "Синерама", использующая семь звуковых трэков, из них один контрольный. В системе применены пять экранных громкоговорителей и большая группа громкоговорителей, распределенных в зале, на которые могли подаваться различные комбинации сигналов из разных каналов. Система создавала различные пространственные звуковые эффекты при демонстрации кинофильмов, но в силу своей дороговизны была вытеснена более дешевой системой Cinemascope, которая использовала четыре звуковых трэка для левого, правого, центрального громкоговорителей плюс один моноканал. Эта система использовалась в нескольких фильмах, в основном, правда, для создания отдельных эффектов, например, пролета самолетов и др. Понадобилось еще два десятилетия, чтобы в кино пришел полноценный пространственный звук.

В этот же период стереозвук начал активно внедряться в бытовую технику: в 1961 году началось стереорадиовещание, впервые продемонстрированное фирмой WEFM в Чикаго. В 1963 году фирма Philips выпустила первую компакт-кассету. Применение с 1969 года системы шумоподавления фирмы Dolby (В-тип) позволило значительно улучшить качество записи.

Исследования в области улучшения локализации и панорамирования стереобраза привели уже в конце 1960-х годов к ряду новых результатов. Например, Гольдмарк и Голливуд из CBS Labs доказали, что использование низкочастотных блоков и небольших средне-высокочастотных акустических систем позволяет создать звуковой образ практически такой же, как и у двух полнодиапазонных больших систем. Эта идея нашла широчайшее применение в наше время (в саббвуферах и саттелитах). Для расширения зоны стереоэффекта в это же время было предложено использование добавочного центрального громкоговорителя. В 1963 году Шредер и Атал предложили схемы для подавления перекрестных акустических связей, что нашло применение при последующем развитии бинауральной стереофонии и в современных системах виртуальной реальности.

На 1970-е годы пришелся взлет, а затем падение квадростереофонии. Все началось с опытов Р. Берковица, работавшего в фирме Acoustic Research Corporation, который экспериментировал с расстановкой передних и тыловых пар громкоговорителей. Но вскоре его идеи нашли коммерческую поддержку, поскольку позволяли добавить к переднему стереообразу определенное ощущение акустического окружения. Перед инженерами встала проблема, как передать через каналы радиовещания и звукозаписи информацию о четырех каналах. Одной из первых была матричная квадрофоническая система, предложенная Р. Шайбером, который установил принципы построения таких систем. На основе его идей были созданы такие матричные системы, как CBS SQ и Sansui QS, а также система Д. Хафлера фирмы Electro-Voice, которые использовали четыре громкоговорителя - два передних и два тыловых. Исключение составляла система Окамото и Купера, где использовалась другая конфигурация: центральный, левый, правый громкоговорители и один моноканал для заднего громкоговорителя (позднее она была использована в Dolby МР-матричной системе).

Каждая из этих систем использовала кодер, чтобы "упаковать" четыре канала в два. Обычно это был пассивный микшер, использующий суммарно-разностное взвешенное сочетание сигналов, иногда с некоторым фазовым сдвигом. Эта система имела определенные ограничения, связанные с плохой разделимостью каналов, в связи с чем были добавлены некоторые активные логические подсистемы с целью лучшего выделения основных сигналов. Кроме того, системы были очень чувствительны к фазовым и амплитудным сдвигам между каналами. Однако, несмотря на это, были созданы декодеры, отработана технология квадрозаписи на диски (система RCA/JVC CD-4-hbc), был предложен формат квадрозаписи на кассеты и т. д. и в продаже появились коммерческие квадрофонические записи.

Особое место в это время заняла система пространственного звука Ambisonics, изобретенная М. Герценом, которая пыталась воспроизвести пространственное звуковое поле методами, получившими впоследствии название "волновой синтез". Однако с малым числом громкоговорителей она имела очень ограниченную зону пространственного эффекта. Попытки использовать большое количество громкоговорителей были предложены в системе Накаямы в 1971 году четыре фронтальных плюс два боковых плюс два тыловых. Все эти эксперименты подготовили базу для последующего создания наиболее оптимальной конфигурации громкоговорителей, например, системы 5.1.

В то время как в бытовой аппаратуре делались попытки, не всегда успешные, приспособить стереоканалы для передачи квадроинформации, в профессиональной технике для кино был достигнут значительный прогресс. В 1976 году лаборатория Dolby разработала специальную аппаратуру кодирования и декодирования для четырехканальной матричной системы для кино, при этом на тыловые громкоговорителе подавался один моносигнал. Система была усовершенствована в 1978 году К. "Роддомом из этой же лаборатории за счет введения дополнительных фазовых сдвигов для тыловых каналов. В 1983 году Д. Манделл из лаборатории Dolby предложил новый алгоритм Pro-Logic, использующий динамическую систему матрицирования. Успешная демонстрация систем пространственного звука при создании ряда кинофильмов подтолкнула развитие домашних систем.

В 1975 году с введением Sony Betamax VCR произошла видеореволюция. Позднее был введен VHS формат VCR, первоначально с линейным аналоговым монофоническим звуковым трэком, затем, после 1980 года, с аналоговым стереотрэком и наконец в 1983 году с отдельно компандированным FM стереотрэком VHS HI-FI, что обеспечило возможность передачи двухканального звукового сигнала с достаточно хорошим качеством и послужило базой для внедрения системы Dolby Pro-Logic в бытовую технику. В 1980 году был принят формат для лазерных дисков.

Как обычно, успехи в звукозаписи подтолкнули внедрение матричной стереофонии в радиовещание, различные системы суммарно-разностного матрицирования (например, BTSC стереосистема) начали использоваться в коммерческом радиовещании в Америке и Европе.

Третий период - цифровой звук и системы Surround Sound. Появление цифрового звука, которое было, по существу, революцией в аудиотехнике, началось в 1970-годы спокойно в отличие от большого шума в это же время, связанного с квадрофонией. Появление этой технологии было подготовлено развитием транзисторной техники. Использование большого числа транзисторов оказалось недостаточным для решения многих логических задач, что привело к созданию цифровых интегральных схем с аналого-цифровыми и цифро-аналоговыми преобразователями и средствами для записи и хранения цифрового звука. Аудиоинженеры начали осваивать эту технику, пытаясь сначала перенести операции, которые они делали с аналоговым звуком на транзисторах, и только потом поняли, какие огромные возможности открывает им эта техника. Впервые на конгрессе AES в 1976 году в Нью-Йорке Т. Стокман продемонстрировал первые цифровые записи на рекордере фирмы Hewlett-Packard. В 1970 году была создана первая цифровая линия задержки Lexicon Delta - T 101. В 1975 году фирма ЕМТ разработала первый цифровой ревербератор, а в 1981 году появился лазерный компакт-диск. Появление CD позволило решить традиционные проблемы в технике звукозаписи: уменьшить шумы, треск, флаттера, искажения и др.

Дальнейшим шагом вперед по отношению к используемой в то время четырехканальной матричной системе фирмы Dolby была предложенная Т. Хольманом из Lucasfilm пространственная система 5.1 с двумя дополнительными тыловыми громкоговорителями и одним низкочастотным блоком (саббвуфером). Эта система в 1991 году была внесена в стандарт ITU-R Rec. BS 775-1.

В 1978 году в фильме"Супермен"впервые были использованы звуковые трэки с 5.1 каналами на 70-миллиметровой пленке с использованием Dolby шестиканального магнитного формата, созданного Ш. Алленом, в котором комбинировались два тыловых канала с двумя фронтальными каналами. В дальнейшем пространственные системы для кино и для дома стали развиваться отдельно. Система для кино получила название ТНХ, в ней обычно использовались рупорные системы, новые типы разделительных фильтров Линквитца-Рили четвертого порядка и специальные программы для согласования системы с разными условиями помещения. Для домашних систем использовалась модифицированная система EQ со специальным декоррелятором для тыловых систем, чтобы улучшить пространственное восприятие звука.

Использование Dolby матричных систем для передачи пространственного звука продолжалось до начала 1990-х, пока не появилась цифровая запись звука на 35-миллиметровой пленке. Заслуга внедрения цифровой записи звука принадлежит, прежде всего, фирме Kodak и корпорации “Optical Radiation”, которые в 1990 году ввели систему CDS (Cinema digital soundtrack). Эта система использовала 5.1 каналы с 12 бит АЦП, цифровые данные записывались оптически на пленке в том месте, где обычно был записан аналоговый стереотрэк. К сожалению, не всегда можно было воспроизводить цифровой звук в кинотеатрах и приходилось выпускать фильмы в двух модификациях - аналоговом и цифровом. В 1992 году фирма Dolby ввела новую SR-D цифровую систему пространственной звукозаписи, которая впервые была использована в фильме "Бэтмен возвращается". Система оставляла аналоговые звуковые трэки на пленке (с использованием Dolby SR-шумоподавления) и размещала цифровую информацию на необычном месте между боковыми отверстиями на краю пленки. Чтобы преодолеть ограниченность площади размещения, в системе применялся специальный многоканальный кодер, который обрабатывал все каналы как ансамбль, а не каждый отдельно.

Позднее была предпринята попытка, например, в фильме "Парк юрского периода", записывать цифровые аудиоданные на отдельный CD-ROM и синхронизировать его с видео.

В 1993 году фирма Sony ввела новую 7.1-канальную систему SDDS, где два дополнительных канала использовались для пяти экранных громкоговорителей. В этой системе аудиоданные записывались на двух внешних краях пленки (за пределами боковых отверстий). Система работала со специальным Sony ATRAC кодером. Все эти системы используются и поныне.

Стремление к увеличению числа передаваемых каналов привело к созданию в 1990-е годы нового поколения многоканальных кодеров: Dolby Digital (AC-3), Musicam Surround, AAC, WMA, MLP и МРАС. Некоторые кодеры использовали отдельные блоки для общей обработки всех каналов, в частности, для решения таких проблем, как межканальное маскирование, межканальное предсказание и др.

В 1993 году система 5.1 -канального пространственного звука была выбрана для телевидения, где начал использоваться кодер ATSC Dolby Digital (AC-3) для передачи звука в системе HDTV. Этот кодер был выбран также в 1997 году для обеспечения звука на DVD-Video (с DTS-кодером как альтернатива). В 1999 году был введен формат DVD-Audio с очень высоким качеством пространственного звука (24-бит).

За последние годы происходит быстрое развитие систем передачи звука по Интернету с широким использованием формата МРЗ для компрессированного стереозвука и введением различных форматов для передачи звука по сетям Real Networks, Microsoft, Apple и др.

В настоящее время 5.1-формат принят для пространственных звуковых систем в DVD, HDTV, кино и Интернете. Однако уже появляются предложения о введении SDDS 7.1-формата, о различных системах с тремя или четырьмя тыловыми громкоговорителями, IMAX-канальной конфигурации и новой системе Е. Хольмана с 10.2-каналами. Были сделаны попытки создания систем с использованием дополнительных каналов для вертикальных потолочных громкоговорителей, увеличенного числа боковых и экранных громкоговорителей и т. д.

Однако обычный стереоформат продолжает еще активно использоваться в аудио-CD, МРЗ, аудиокассетах и радиовещании. Попытки извлечь пространственную эстетическую информацию из стереозвука с помощью специальных пространственных синтезаторов были предприняты в ряде систем: Dolby Pro-Logic II, DTS Neo6, Lexicon Logic 7 и др. Фактически эти системы являются своего рода мостом между стереосистемами и 5.1 дискретными системами.

Таким образом, к настоящему времени для передачи пространственного ощущения звука используется много различных способов: бинауральная стереофония, 4:2:4 и 5:2:5 матричные пространственные системы; цифровые пространственные системы в формате 5.1 с низкобитовыми кодерами и др.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: