Представление изображений

В компьютерных системах кроме текстовой и числовой информации хранится графическая, звуковая и видеоинформация. Способы представления этих данных находятся только в начале своего развития и, следовательно, не настолько стандартизированы.

Все изображения делят на две категории: растровые (bitmap techniques) и векторные (vector techniques).

Растровое изображение представляет собой набор точек, элементов изображения, которые называются пикселами (pixel). Самое простое представление имеет вид длинной последовательности битов, каждый из которых равен 0 или 1 в зависимости от того, белого или черного цвета пиксел. Цветные изображения отображать немного сложнее, так как необходимо каждый пиксел представлять комбинацией битов, обозначающей его цвет.

Многие внешние устройства компьютера (факсы, видеокамеры и сканеры) конвертируют изображения в растровый формат. Эти устройства кодируют цвет пиксела в виде комбинации трех составляющих: красной, зеленой и синей, соответствующих трем основным цветам. Для представления интенсивности каждого цвета используется один байт, в то время как для представления целого пиксела изображения требуется три байта. Этот подход с использованием трех составляющих цвета используется также в мониторе компьютера, который отображает миллиарды пикселов, каждый из которых состоит из трех компонентов: красного, зеленого и синего, что можно заметить, рассмотрев экран поближе (через увеличительное стекло).

Таким образом, для изображения, состоящего из 1024 рядов, содержащих 1024 пиксела каждый, потребуется такой объём памяти, который превысит емкость обычного гибкого диска.

Изображение в растровом формате имеет один недостаток: размер изображения нельзя произвольно увеличить. Так как, единственный способ увеличения изображения — увеличить размер пикселов. Но это приводит к зернистому изображению — явлению, которое часто наблюдается в цифровых фотоаппаратах.

Векторный формат представления изображений преодолевает эту проблему. Векторное изображение - это набор линий и дуг. Такое описание заставляет само устройство рисовать изображение, а не воспроизводить комбинацию пикселов.

Различные шрифты, в современных принтерах и мониторах, часто кодируются именно таким способом, для того чтобы размер символа сделать более гибким.

Такие шрифты называют масштабируемыми шрифтами. Например, шрифт TrueType (разработанный компаниями Microsoft и Apple Computer) представляет собой описание того, как следует рисовать символы в тексте. Или шрифт PostScript (разработанный корпорацией Adobe Systems), который предоставляет средства для описания символов как графических данных.

Векторный формат распространен в автоматизированном проектировании. Он позволяет создавать трехмерные объекты и управлять их отображением на мониторе.

Однако, векторный формат не обеспечивает высокого фотографического качества изображений, которое доступно в растровом формате. Именно поэтому растровый формат используется в современных цифровых камерах.

Представление звука

Способ кодирования звуковой информации состоит в том, что измеряется амплитуда сигнала через равные промежутки времени и записываются полученные значения. Например, последовательность 0, 1.5, 2.0, 1.8, 2.1, 2.5, 4.0, 3.0, 0 описывает волну звука, амплитуда которой сначала увеличивается, затем немного уменьшается, затем снова повышается и, наконец, падает до 0.

Звуковая волна

0 1.5 2.0 1.8 2.1 2.5 4.0 3.0 0

Амплитуда

Рис. 1.7. Звуковая волна

Такой способ кодирования, в котором частота дискретизации составляет 8000 отсчетов в секунду, используется уже давно в дальней телефонной связи. Голос на одном конце канала кодируется в виде числовых значений, отражающих амплитуду звукового сигнала, восемь тысяч раз в секунду. Эти значения затем передаются по каналам связи и используются для воспроизведения звука на приемном конце канала связи.

Может показаться, что 8000 отсчетов в секунду — это большая частота дискретизации, но для высокой точности воспроизведения музыки эта частота недостаточна. Для получения качественного звучания на современных музыкальных компакт-дисках используется частота дискретизации, равная 44 100 отсчетов в секунду.

Для данных, получаемых при каждом отсчете, отводится 16 битов памяти (или 32 бита для стереозаписей). Таким образом, для хранения одной секунды звучания требуется более миллиона битов.

Для кодирования звуков в музыкальных синтезаторах, компьютерных играх и звуках сопровождающих веб-страницы используется более экономная система кодирования, которая называется цифровым интерфейсом музыкальных инструментов (MIDI — Musical Instrument Digital Interface).

При использовании стандарта MIDI не требуется столько места в памяти, как при дискретизации звукового сигнала, так как эта система кодирует указания, как следует порождать музыку, а не сам звуковой сигнал. Точнее, MIDI кодирует информацию о том, какой инструмент должен играть, какую ноту и какова продолжительность звучания этой ноты. Это означает, что для кларнета, играющего ноту ре в течение двух секунд, потребуются три байта, а не более двух миллионов битов, как в случае дискретизации сигнала с частотой 44 100 отсчетов.

Из вышесказанного видно, что стандарт MIDI более похож на нотную запись, которую читает исполнитель, чем на само исполнение. Недостатком метода является то, что музыкальная запись в стандарте MIDI может звучать по-разному в исполнении различных музыкальных синтезаторов.