Тема 3.1 Понятие мультимедиа. Аппаратные и программные средства обработки мультимедиаинформации
Гипертекстовые способы хранения и представления информации
Само слово мультимедиа образовано из латинских: «мульти» — много и «медиа» — среда, носитель, средства сообщения — и его можно перевести как «многообразная среда». В мультимедиа-продукте объединяются двухмерные и трехмерные изображения, звуковое сопровождение, музыка, анимация, видео-, текстовая и числовая информация и т.д. Все эти виды информации должны образовывать единое целое. Хорошим примером является мультимедийный компакт-диск с альбомом записей какой-либо музыкальной группы. Такой дисксодержит, конечно, в первую очередь записи песен, однако они могут сопровождаться видеозаписями с концертов, текстами песен, информацией об исполнителях и т.д. Кроме того, такой ж обязательно содержит управляющую оболочку, позволяющую осуществлять поиск нужной информации, переключение режимов ее представления (видео, текстовый, цветомузыка, стоп-кадр и т.д.) и настройку всей системы. Другим примером являются мультимедийные интернет-сайты, получившие распространение с появлением скоростных каналов доступа в Интернет.
|
|
Средства воспроизведения мультимедиа, так и технология изготовления мультимедиа-продуктов, являются весьма сложными и дорогостоящими. Поэтому мультимедиа-технологии применяются либо в тех областях, где высокая стоимость продукта не является препятствием, либо там, где ожидается его массовое производство. К таким областям можно отнести:
· информационную и рекламную деятельности;
· шоу-бизнес;
· создание персональных фоно- и видеотек;
· компьютерные тренажеры;
· компьютерные игры;
· обучающие программы;
· энциклопедии.
Все эти области требуют комплексной формы представления выдаваемой информации, а, следовательно, мультимедиа — их естественная технология.
Пределом развития мультимедиа является виртуальная реальность — создание с помощью компьютера и специальных устройств (шлемов, очков, перчаток и даже костюмов) виртуального (кажущегося) мира, в который «помещается» человек и живет is этом мире по его законам. Яркой иллюстрацией этой идеи является нашумевший в свое время фильм «Матрица». Надо, однако, заметить, что до реализма «Матрицы» современным системам виртуальной реальности еще очень и очень далеко. К тому же, как с функциональной, так и с экономической точки зрения, их применение оправдано крайне редко.
2 Аудио- и видеоинформация и ее особенности
Особенностью, отличающей мультимедиа-технологии от других компьютерных технологий, является обработка аудио- и видеоинформации в реальном режиме времени. В узком смысле под мультимедиа в компьютерных технологиях понимают именно работу с потоковой аудио- и видеоинформацией, т.е. такой формой получения, обработки и передачи информации, когда она поступает непрерывно, и мы не можем охватить ее целиком. Эта информация носит, как правило, изначально аналоговый характер, и для компьютерной обработки должна быть переведена в цифровую форму (оцифрована). С другой стороны для воспроизведения она должна быть обратно переведена в аналоговую форму.
|
|
Для преобразования аналогового звукового сигнала в цифровую форму с определенной частотой (частотой дискретизации)производятся измерения (отсчеты) амплитуды звукового сигнала. Затем непрерывные значения амплитуды тоже переводятся в дискретную форму путем разбивки интервала возможных значений амплитуды на конечное число промежутков и заменой текущего значения амплитуды на ближайшее граничное значение какого-либо интервала. Количество битов, необходимых для представления получаемых таким образом дискретных значений, называется разрядностью отсчета.
Для обеспечения достаточно хорошего качества преобразования необходимо, чтобы частота дискретизации по меньшей мере вдвое превышала наивысшую частоту сигнала. Поскольку человеческое ухо слышит звук частотой до 20 кГц, то в свое время для компакт-дисков была выбрана частота дискретизации 44,1 кГц и разрядность отсчета 16 бит (65 536 фиксированных уровней амплитуды). В студийной работе чаще используется та же разрядность отсчета при частоте дискретизации 48 кГц. Иногда используются и более высокие значения этих величин. Устройство, переводящее аналоговый звуковой сигнал в цифровую форму, называется аналогово-цифровым преобразователем (АЦП), а обратно — цифро-аналоговым преобразователем (ЦАП).
Сочетание частоты дискретизации, разрядности отсчета и количества используемых каналов называют форматом цифрового звука. Очевидно, что произведение этих величин и даст величину цифрового потока, необходимую для представления этого формата. Например, для частоты дискретизации 44,1 кГц, разрядности 16 бит и стереофонического звука (2 канала) величина цифрового потока составит немногим более 170 Кбайт/с, что заметно ниже, чем пропускная способность основных каналов передачи данных компьютера. Поэтому обработка звука в реальном времени на современных компьютерах вполне осуществима, хотя в последнее время наметилась тенденция к увеличению значений всех составляющих формата цифрового звука (в частности, система Dolby Digital использует 6 каналов, а ее модификации — до 8).
Несмотря на то, что компьютер «справляется» с обработкой звука в реальном времени, существует несколько причин для сжатия цифровых данных. Во-первых, если мы запишем на диск «сырой» (несжатый) звук, то нетрудно подсчитать, что минута записи однако чаще всего они используются как промежуточные. Вторая причина связана с передачей звуковых данных:
если канал связи обеспечивает, например, 33,6 Кбит/с (-3,28 Кбайт/с), то 170 Кбайт/с передать по нему невозможно, и звук просто обязан быть сжат. Наконец, есть еще одна причина, носящая экономико-психологический характер. Прохождение звука по компьютерным цепям и его оцифровка вносят в него искажения, и может оказаться так, что искажения за счет сжатия звука окажутся меньше остальных, а выигрыш в объеме данных окажется значительным. Психологической же эта причина названа потому, что оценка искажений в большой степени носит субъективный характер, и искажения, которые один человек может не слышать, другому могут казаться неприемлемыми. Методы сжатия звуковых потоков учитывают эту особенность, и все соответствующие алгоритмы в целом основаны на свойствах восприятия звуковых сигналов слуховым аппаратом человека, называемых «психоакустической моделью». При этом из звукового сигнала удаляется информация, малозаметная для слуха, в результате чего слуховое восприятие звука практически не меняется. Такое кодирование относится к методам сжатия с потерями, когда из сжатого сигнала уже невозможно точно восстановить исходную волновую форму, однако степень сжатия гораздо выше. Сжатие звукового сигнала и его обратная распаковка осуществляются специальными программными модулями, называемыми кодеками (кодерами-декодерами). Каждый из них характеризуется используемыми алгоритмами сжатия и используемыми форматами сжатых файлов.
|
|
Для описания степени сжатия звукового сигнала используется битрейт (bitrate) — скорость битового потока с которой сжатая информация должна поступать в декодер при восстановлении звукового сигнала. Битрейт измеряется в килобитах в секунду (Кбит/ с) и если, например, он равен 128 Кбит/с, то это означает, что одна секунда звука будет занимать 128 Кбит, или 16 Кбайт. Чем выше битрейт, тем выше качество звука, получаемого при обратной распаковке и, соответственно, больше размер сжатого звука. Широко распространенный формат сжатия mpЗ позволяет кодировать звук с битрейтом от 8 до 320 Кбит/с. Наиболее часто в mpЗ используется битрейт 128 Кбит/с, на котором достигается сжатие в 10—12 раз.
Говоря о сжатии звука, нельзя обойти вниманием специальную форму передачи сжатого звука, называемую потоковым вещанием. Применяется она только в компьютерных сетях (в том числе в сети Интернет) и использует систему «клиент-сервер»: звуковые файлы потокового формата хранятся на сервере и со- этом никакие промежуточные файлы на клиентском компьютере не создаются. Характерной особенностью потокового вещания является высокая степень сжатия, которая должна обеспечить прохождение сжатого звука через низкоскоростные каналы связи, Наиболее распространенным среди потоковых систем является' формат RealAudio.
|
|
Преобразование аналогового видеосигнала в цифровую форму (оцифровка, или видеозахват) происходит почти по тем же принципам, что и при работе с аудиосигналами. Однако в отличие от оцифровки звука, отсчеты делаются редко (25 раз в секунду), но результатом отсчета является целый кадр. Наиболее часто применяется используемый в стандарте VideoCD размер кадра в 352x288 точек (телевизионный кадр, прореженный вдвое по вертикали и по горизонтали), при 24 бит цвета на каждую точку. Нетрудно подсчитать, что это даст цифровой поток около 60 Мбит/с (примерно 7,5 Мбайт/с), что значительно превышает величину аудиопотоков.
Поэтому сжатие данных, причем с потерями (для обеспечения высокой степени сжатия вплоть до 100: 1), здесь просто необходимо. Существует большое количество алгоритмов сжатия (MPEG 1, MPEG 2, MPEG 4 и др.), служащих различным целям и имеющим совершенно различные характеристики, но все они в той или иной степени нацелены на наиболее эффективное сжатие данных с минимальными потерями качества. В частности, битрейт сжатого видео на VideoCD (алгоритм MPEG 1), имеющего названные размер и частоту кадров, равен 1,1 Мбит/с.