Пример 1.6 1.3.6 Кодирование изображений

0.1111·2100: 0.101·211 = (0.1111: 0.101) · 2(100–11) = 1.1·21 = 0.11·210.

1.3.5 Представление в компьютере текста

Текстовая информация в компьютере обычно представляется с помощью кода, в котором каждому символу (букве, знаку и т.д.) присваивается уникальная комбинация двоичных разрядов. В ранний период развития компьютерных технологий разработано много подобных кодов. В настоящее время наиболее распространены следующие кодировки:

1) ASCII (эс-кии) – American Standart Code for Information Interchange (Американский стандартный код для обмена информацией), принятый Американским национальным институтом стандартов (ANSI – American National Standart Institute). Включает 256 двоичных кодов: 128 для набора в латинской раскладке и 128 – в символике используемого национального языка (например, русского). Пример кодирования текста в ASCII на рисунке 1.17.

H e l l o .
           

Рисунок 1.17 – Пример кодирования текста в ASCII

Таким образом, под хранение информации о коде каждого символа отводится 8 бит (1 байт).

2) КОИ-8 – код обмена информацией, восьмизначный (восьмибитный). Разработан в странах бывшего СЭВ (Совет Экономической Взаимопомощи) государств Восточной Европы, использующих в качестве письменности кириллицу. Русский алфавит описывается в кодировке KOI8-R, украинский – в KOI8-U и т.д.

3) ISO 8859 – семейство ASCII-совместимых восьмибитных кодировок, разработанных Международной организацией по стандартизации ISO (International Organisation for Standartisation). Для русского языка принят вариант ISO 8859-5, утвержденный в России на уровне государственного стандарта, однако редко используемый на практике.

4) Windows-1251. Разработана компанией Microsoft. Является стандартной 8-битной кодировкой для всех русских версий MS Windows.

5) Unicode (Юникод) – универсальная система кодирования. Эта кодировка разработана объединенными усилиями нескольких ведущих фирм – производителей программного и аппаратного обеспечения. Стандарт Юникода содержит семейство кодировок (форм представления или UTF, Unicode Transformation Format): UTF-8, UTF-16, UTF-32 и некоторые другие, которые отличаются между собой способом хранения данных (количество байт на символ). Позволяет представить знаки практически всех письменных языков. Считается, что представление Юникода UTF-8 обеспечивает наилучшую совместимость с системами, использовавшими 8-битные символы. Так, текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII.

6) UCS (англ. Universal Multiple-Octet Coded Character Set) – универсальный многооктетный (многобайтовый) кодированный набор символов. Представлен в новой серии международных стандартов ISO/IEC 10646, разрабатываемых рабочей группой ISO в тесном сотрудничестве с консорциумом Юникода.

Между стандартом Юникода и ISO/IEC 10646 установлена синхронизация. Аналогично форматам UTF-16 и UTF-32 в стандарте Юникода, стандарт ISO/IEC 10646 также имеет две основные формы кодирования символов: UCS-2 (2 байта на символ, аналогично UTF-16) и UCS-4 (4 байта на символ, аналогично UTF-32). UCS-2 можно считать подмножеством UTF-16, а UCS-4 является синонимом для UTF-32.

1.3.6 Кодирование изображений

Графическая информация также хранятся в памяти компьютера в виде двоичных кодов. Наиболее распространенные методы представления изображений можно разделить на две большие категории: растровые и векторные (рисунок 1.18). Основным элементом растрового изображения является точка, векторного – линия.

Рисунок 1.18 – Растровая и векторная графика

Растровая графика. Изображение, состоящее из отдельных точек, каждая из которых имеет свой цвет, называется растровым изображением. Минимальный элемент такого изображения в полиграфии называется растр, а при отображении графики на мониторе – пиксель (pixel).

Если пиксель изображения может быть раскрашен только в один из двух цветов, допустим, либо в черный (0), либо в белый (1), то для хранения информации о цвете пикселя достаточно 1 бита памяти (). Соответственно, объем, занимаемый в памяти компьютера всем изображением, будет равен числу пикселей в этом изображении (рисунок 1.19а). Если под хранение информации о цвете пикселя выделить 2 бита, то число цветов, допустимых для раскраски каждого пикселя, увеличится до 4-х, а объем файла изображения в битах будет вдвое больше (), чем количество составляющих его пикселей (рисунок 1.19б).

  а)   б)
Рисунок 1.19 – Кодирование растрового изображения: а –1 бит на пиксель – 2 цвета; б – 2 бита на пиксель – 4 цвета

При печати на черно-белом принтере обычно допускает 256 градаций серого цвета (от черного (00000000) до белого (11111111)) для раскраски каждой точки изображения. Под хранение информации о цвете точки в этом случае отводится 1 байт, т.е. 8 бит ().

Таким образом, изображение кодируется в виде длинных строк битов, которые представляют ряды пикселей в картинке. Полученную комбинацию битов часто называют битовой картой (bit map), подчеркивая, что данная комбинация битов представляет собой карту (схему) изображения. Формат файлов *.bmp.

Для описания в виде числового кода цветных изображений используется несколько цветовых моделей.

Модель RGB используется в телевизорах, мониторах, проекторах, сканерах, цифровых фотоаппаратах и других излучающих свет объектах. Эта модель является аддитивной (суммарной), что означает, что цвета в этой модели добавляются к черному (blacK) цвету.

Основные цвета в этой модели: красный (Red), зеленый (Green), синий (Blue). Их парное сочетание в равных долях дает дополнительные цвета: желтый (Yellow), голубой (Cyan) и пурпурный (Magenta).

R+G=Y; G+B=C; B+R=M.

Сумма всех трех основных цветов в равных долях дает белый (White) цвет: R+G+B=W.

Если кодировать цвет одной точки изображения тремя битами, каждый из которых будет являться признаком присутствия (1) или отсутствия (0) соответствующей компоненты системы RGB, то мы получим все восемь различных цветов описанных выше моделей (таблица 1.5).

Таблица 1.5 – Кодирование цвета в модели RGB

R G B Цвет
      W (white /белый)
      Y (yellow / желтый)
      M (magenta / пурпурный)
      R (red / красный)
      C (cyan / голубой)
      G (green / зеленый)
      B (blue /синий)
      K (black / черный)

На практике, для сохранения информации о цвете каждой точки цветного изображения в модели RGB обычно отводится 3 байта (т.е. 24 бита) – по 1 байту (т.е. по 8 бит) под значение цвета каждой составляющей. Таким образом, каждая RGB-составляющая может принимать значение в диапазоне от 0 до 255 (всего значений), а каждая точка изображения, при такой системе кодирования может быть окрашена в один из цветов. Такой набор цветов принято называть True Color («правдивые» цвета).

Изменяющиеся в диапазоне от 0 до 255 координаты RGB образуют цветовой куб. Любой цвет расположен внутри этого куба и описывается своим набором координат, показывающем в каких долях смешаны в нем красная, зеленая и синяя составляющие (рисунок 1.20).

Рисунок 1.20 – Цветовой куб RGB

Цветовая модель CMYK используется в полиграфии при формировании изображений, предназначенных для печати на бумаге (цветное отражающее изображение). Основными цветами в ней являются те, которые являются дополнительными в модели RGB, т.к. они получаются вычитанием цветов RGB из белого цвета. Поэтому модель CMYK называется субтрактивной:

C=W-R; M=W-G; Y=W-B.

В свою очередь парное сочетание в равных долях цветов модели CMY дает цвета модели RGB: Y+C=G, C+M=B и M+Y=R.

В теории, сумма C+M+Y=K, т.е. дает черный (blacK) цвет, но поскольку реальные типографские краски имеют примеси, их цвет не совпадает в точности с теоретически рассчитанным. Особенно трудно получить из этих красок черный цвет. Поэтому в модели CMYK к триаде CMY добавляют черный цвет K. От слова blacK для обозначения черного цвета взята последняя буква, и т.к. буква B уже используется в модели RGB для обозначения синего цвета.

При использовании 1 байта памяти на каждую из четырех составляющих модели CMYK теоретически может быть получено до различных цветов

В модели HSB (Hue, Saturation, Brightness), она же HSL (Hue, Saturation, Lightness), основана на цветах модели RGB, но имеет другую систему координат. Любой цвет в модели HSB определяется своим цветовым тоном (собственно цветом), насыщенностью (т.е. процентом добавленной к цвету белой краски) и яркостью (процентом добавленной черной краски).

Параметр тона Hue (читается «хью») – это спектральный цвет (один из чистых цветов солнечного спектра); представлен как замкнутый круг, положение конкретного оттенка на котором определяется величиной угла в диапазоне от 0 до 360 градусов. Насыщенность цвета (параметр Saturation) изменяется по радиусу круга от 0 (в центре) до 100% (на краях). При значении насыщенности 0% любой цвет становится белым.

Яркость (Brightness) – параметр, определяющий освещенность или затемненность. Все цвета цветового круга имеют максимальную яркость (100%) вне зависимости от тона. Уменьшение яркости цвета означает его затемнение.

Таким образом в модели HSB любой цвет получается из спектрального добавлением определенного процента белой и черной красок (фактически серой краски).

В попытке совместить цветовой охват моделей RGB и CMYK была создана модель Lab, не привязанная к среде вывода. Параметр модели L показывает общую яркость пикселов, параметром a передаются цвета от темно-зеленого до ярко-розового с разными вариациями насыщенности и яркости, а параметром b – от светло-синего до ярко-желтого.

В отличие от цветовых пространств RGB или CMYK, которые являются, по сути, набором аппаратных данных для воспроизведения цвета на бумаге или на экране монитора (цвет может зависеть от типа печатной машины, марки красок, влажности воздуха в цеху или производителя монитора и его настроек), Lab однозначно определяет цвет. Поэтому Lab нашел широкое применение в программном обеспечении для обработки изображений в качестве промежуточного цветового пространства, через которое происходит конвертирование данных между другими цветовыми пространствами (например, из RGB сканера в CMYK печатного процесса). При этом особые свойства Lab сделали редактирование в этом пространстве мощным инструментом цветокоррекции.

Векторная графика. Первая проблема работы с растровыми изображениями состоит в том, что формат «три байта на пиксель» означает, что, например, для хранения рисунка, в котором 1280 рядов по 1024 пикселя (фотография стандартного размера) потребуется несколько мегабайт памяти.

Вторая проблема заключается в трудности пропорционального изменения размеров графических объектов до произвольно выбранного значения. В частности при увеличении изображения приходится увеличивать сами пиксели, что приводит к появлению зернистости.

Эти недостатки отсутствуют при работе с векторной графикой, основным логическим элементом которой является не пиксель, а сам геометрический объект. Элементарные объекты векторного изображения (прямоугольник, окружность, эллипс, линия) называют графическими примитивами. Устройствам вывода передается подробное математическое описание формы и положения примитивов, образующих изображение (рисунок 1.21).

Рисунок 1.21 – Графические примитивы

С помощью векторной технологии реализованы различные шрифты, поддерживаемые современными принтерами и мониторами. Они позволяют изменять размер символов в широких пределах. Примерами являются технология True Type, разработанная компаниями Microsoft и Apple Computer, технология Post Script, разработанная компанией Adobe Systems. Программы векторной графики имеют развитые средства интеграции изображений и текста, единый подход к ним. Поэтому программы векторной графики незаменимы, для чертежно-графических.

Векторные методы также широко применяются в области дизайна, технического рисования и оформительских работ (графические редакторы Corel Draw, Adobe Illucstrator), а также в системах CAD (Computer Aided Design), которые используются для автоматизированного черчения, автоматизированного проектирования, геометрического моделирования сложных трехмерных объектов.

Преимущества векторной графики:

1) Она экономна в плане дискового пространства, необходимого для хранения изображений: это связано с тем, что сохраняется не само изображение, а только необходимые данные, используя которые, программа всякий раз воссоздает изображение заново.

2) Объекты векторной графики легко трансформируются и масштабируются, практически без потери качества изображения. Масштабирование, поворот, искривление сводятся к элементарным преобразованиям геометрических фигур.

Наиболее популярные форматы описания документов, хранящих векторные изображения *.wmf (Windows MetaFile), *.eps (Encapsulated PostScript), *.pdf (Portable Docoment Format).

Недостаток векторных изображений в том, что они пока не позволяют достичь фотографического качества изображений. В этой связи перспективной является технология получения изображений, основанная на методах фрактальной геометрии. Фрактал – это геометрический объект, задаваемый математической формулой и остающийся самоподобным при любых приближениях.

1.3.7 Кодирование звуковой информации

Для человека звуком является смесь многих гармонических колебаний среды (обычно воздушной) определенной формы, с определенным набором частот и амплитуд.

Для записи звука на какой-нибудь носитель его, как правило, нужно преобразовать в электрический сигнал. Это делается с помощью микрофона, в котором имеется специальная мембрана, колеблющаяся под воздействием звуковых волн. К мембране присоединена катушка, перемещающаяся синхронно с мембраной в магнитном поле. В катушке возникает переменный электрический ток. Изменения напряжения тока точно отражают звуковые волны. Переменный электрический ток, который появляется на выходе микрофона, является аналоговым сигналом, т.е. непрерывен по времени и амплитуде. Известны способы аналогового хранения звуковой информации: виниловая пластинка, магнитофонная лента. Серьезным недостатком аналоговых записей является достаточно быстрое старение (истирание) и, следовательно, потеря качества носителя.

При цифровой записи исходный аналоговый сигнал проходит через звуковой тракт и попадает в аналого-цифровой преобразователь (АЦП) – устройство, которое переводит сигнал в цифровую форму.

В упрощенном виде принцип работы АЦП заключается в следующем: он измеряет через определенные промежутки времени амплитуду сигнала и передает дальше, уже по цифровому тракту, последовательность числовых кодов, несущих информацию об изменениях амплитуды.

Последовательность цифровых данных, полученных путем аналого-цифрового преобразования, называют семплом, а сам процесс преобразования называют – семплированием или дискредитацией.

Вывод цифрового звука происходит при помощи цифро-аналогового преобразователя (ЦАП), который на основании поступающих цифровых данных в соответствующие моменты времени генерирует электрический сигнал необходимой амплитуды.

Важными параметрами семплирования являются частота и разрядность. Частота - количество измерений амплитуды аналогового сигнала в секунду. Так, в формате компакт-дисков Audio DVD за одну секунду сигнал измеряется 96 000 раз, т.е. применяют частоту семплирования 96 кГц. Разрядность указывает, с какой точностью происходят измерения амплитуды аналогового сигнала. Именно от разрядности зависит достоверность восстановления формы звуковой волны. Например, формат Audio DVD использует разрядность 24 бита.


2. ТЕХНИЧЕСКИЕ СРЕДСТВА РЕАЛИЗАЦИИ
ИНФОРМАЦИОННЫХ ПРОЦЕССОВ


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: