Методы представления графической информации

Традиционно используются два метода представления графической информации - растровый и векторный.

При представлении графической информации в растровом виде используется технология хранения информации о каждом пикселе (pixel - picture element); пиксел является неделимой единицей - точкой изображения, данные обычно хранятся последовательно в формате одномерного массива, а ширина и высота изображения в пикселах описываются в заголовке файла), сохраняются данные о цвете (в единицах 21=2 цвет а, 28=256 цвет о в и т.д.; также сохраняется информация о палитре - текущей таблице соответствий представляемого цвета и его кода). При моделировании объемных (трехмерных) объектов используется воксел (voxel - volume picture element), см. раздел 6.

Историческим ан а логом данного метода явилась, вероятно, давно отработанная технология передачи и приема телевизионных изображений (такая же технология применяется при сканировании изображений). Типичным представителем этой методики является входящий в штатное cистемное ПО фирмы MS пакет Microsoft Paint; в настоящее время практически все графические редакторы поддерживают растровую графику. Практически все современные системы сохранения движущихся изображений (movie) используют растровый способ представления графической информации.

Вторым методом представления графических изображений является векторный способ. При этом неделимой единицей является вектор - определяемая начальной и конечной координатами прямая линия; аттрибутами являтся цвет (включая палитру), толщина, тип (сплошная, штрих-пунктирная и т.д.) линии. Вырождением линии (вектора) является точка (фактически растровый способ представления графической информации). На основе векторов строятся и более сложные графические примитивы - дуги, овалы, гладкие линии произвольной формы и т.д.

Данный метод является естественным для представления информации в виде чертежей, типичным представителем является пакет создания чертежной документации AutoCAD (соответствующие файлы формата DXF являются текстовыми и содержат описания графических примитивов в векторном виде); другим представителем пакетов векторной графики является CorelDraw (www.corel.com). Размеры файлов при векторном способе обычно значительно меньше, скорость же отрисовки изображений на устройствах вывода практически не отличается. Это объясняется почти 100% применением растровых дисплеев (применение векторных дисплеев в настоящее время ограничено), при этом изображение любых векторных примитивов сводится к (программной) конвертации в растровый формат; используется линейная или круговая интерполяция путем `засвечивания' ближайших к вектору точек растра по методу Брезенхама (Bresenham, [1]). Заметим, что векторные графопостроители в настоящее время широко распространены и хорошо согласуются (по форматам передаваемых данных) с технологией векторной графики.

Конвертация между двумя указанными видами представления графической информации тривиальна лишь при переходе от векторной к растровой графике (метод Брезенхама), обратный переход требует значительных ухищрений (известны, например, конверторы сканированных растровых изображений в векторный формат AutoCAD 'а; при этом особенная сложность заключается в распознавании участков растра в районе `стыковки' векторов, что обычно требует вмешательства оператора).

Существенно различаются для векторной и растровой графики процедуры линейного масштабирования. Если объекты векторной графики масштабируются элементарно, масштабирование растровой графики существенно сложнее (примитивное масштабирование в этом случае приводит лишь к превращению пикселов в прямоугольные образования) - применяются специальные алгоритмы заполнения и сглаживания [1]. Однако эти и более сложные (нелинейные преобразования) легко реализуются вычислительными возможностямиерррре ПЭВМ. Более сложные функции класса повышения резкости, оконтуривания, выделения градиентов и областей с заданными свойствами и др. определены лишь для растровой графики; большой набор предопределенных фильтров для подобных преобразований дост у пен в пакете AdobePhotoshop (www.adobe.com), задаваемые пользователем фильтры удобноприменимы в пакете PaintShopPro (фирма Jasc, Inc., www.jasc.com).

Одна из простых операций такого рода - локальная цифровая фильтрация, осуществляемая путем взвешенного суммирования яркостей пикселов, находящихся в некоторой окрестности текущего пиксела [1].

1.1 Текстовые данные в мультимедиа

Текстовые данные (независимо от типа письма - иероглифического, алфавитного, смешанного) фактически являются частью представления информации в виде статических изображений (графики) и в целом описываются, обрабатываются и представляются теми же методами. Особенностью текста является его вторичность (по отношению к первичности речи, кодовым выражением которой текст формально и является), вследствие чего появляются дополнительные функции ММС: распознавания речи и обратная - речевого воспроизведения текста; эти функции становятся штатными даже для ОС. К сходным проблемам относится и вопрос распознавания символов (технология OCR - Optical Character Recognition). Фирма MS на сайте www.microsoft.com/downloads предлагает специализированную библиотеку разработчика систем распознавания речи Microsoft Speech API, системы распознавания и преобразования текста в речь Microsoft Speech Recognition и Microsoft Text-to-Speech; функциями речевого управления должен обладать пакет MSOffice10.

Символы внутримашинно представлены численным кодом (обычно 8-ю двоичными разрядами, перспективная кодировка UNICODE использует 16 бит и позволяет единообразно представить символы 216= 65536 языков мира).

Наиболее распространенным в сред е Windows текстовым (с элементами графики) редактором (текстовым процессором) является MS Word (www.microsoft.com/rus), из популярных настольных издательских систем следует упомянуть Adobe PageMaker (www.adobe.com), Xerox VenturaPublisher (www.xerox.com) и QuarkXPress (Quark, Inc., www.quark.com).

Действие OCR-систем заключается в сопоставлении печатным символам (обычно представляемым в виде сканированного изображения) кодовому набору алфавита, понимаемому конкретным ПО обработки текстов (изображению символа ставится в соответствие его числовой код). Одной из распространенных OCR-систем является FineReade r фирмы ABBYY Software (www.abbyy.ru). Последние версии продуктов этой фирмы (ABBYY FineReader Рукопись) позволяют распознавать формы (технология Document Capture - захват документа), например, бланки налоговых деклараций (с занесением информации из определенных полей бланка в поля базы данных).

Комплекс CognitiveForms принадлежит к классу OCR/ICR/OMR (Optical Character Recognition/Intelligent Character Recognition/Optical Mark Recognition - оптическое распознавание печатных символов/распознание рукописных символов/оптическое распознание меток) и реализует трехуровневую технологию распознания.

Для представления текстовой информации в приятной человеку форме используются шрифты. Шрифт (гарнитура) - набор символов, схожих по графическим особенностям. Начертание описывает характерные особенности шрифта (bold - жирный, italic - курсивный, normal - прямой). Кегль, или размер шрифта (size) определяется высотой прописной буквы, измеренной в пунктах (points); один пункт равен 1/72 дюйма (0,353 мм), в шрифте размером 12 пунктов прописные буквы имеют высоту 1/6 дюйма. Эффекты предоставляют возможность применить к выбранному шрифту различные способы оформления - подчеркивание, зачеркивание, оконтуривание, капитель, закрашивание в различные цвет а и т.п.

Растровые шрифты имеют фиксированные форму и размеры (например, шрифт MS Sans Serif), причем при масштабировании (только целочисленном) форма символов искажается (возникает ступенька). Векторные (масштабируемые, контурные) шрифты (например, Modern) строятся точка за точкой при помощи специального штатного для OC Windows ПО (GDI - Graphic Device Interface) и допускают масштабирование в любое число раз без искажений, однако для их отрисовки требуются значительные ресурсы. Именуемая TrueType разновидность векторных шрифтов (например, Arial) приг о дна для вывода как на экран так и на принтер и допускает масштабирование на размер от 1 до 999 пунктов. Близкими к TrueType являются шрифты в формате PostScript (предложенный Adobe и ставший всеобщим стандартом язык описания макета страницы, PostScript обеспечивает высококачественный вывод изображений, графики и текста, поддерживая при этом повороты, увеличение и уменьшение символов, для вывода изображений используется интерпретатор PostScript в принтере или в ПЭВМ); для принтеров Hewlett-Packard LaserJet, DeskJet возможно использование технологии PCL (Printer Control Language), позволяющей осуществлять форматирование распечатываемой страницы в самом принтере.

Шрифты типа TrueType при отрисовке строятся на основе р е перных точек, соединенных плавными кривыми (используются квадратичные B- сплайны); ОС Windows имеет штатный набор функций для работы с этими кривыми. Современное ПО создания новых шрифтов (Fontographer фирмы Macromedia,Inc., www.macromedia.com; FontLab фирмы Adobe, www.adobe.com и др.) позволяет разрабатывать формы символов в графическом диалоге с пользователем, задавая базовые точки и соединяя их кривыми. Деятельность разработчиков шрифт о в координирует ежегодная конференция ATypI (Association TypographiqueInternationale, www.atypi.org).

Чисто технической сложностью является работа пользователя с текстовыми данными на фоне (растровой или векторной графики). В примитивных графических редакторах класса MS Paint после ввода текста его редактирование невозможно, так как он преобразуется в растр. В более мощных редакторах текст сохраняется как отдельный объект (с указанием аттрибутов - фонта, размера, цвета и др.) и при этом отображается в растровом или векторном виде; редактирование объекта позволяет легко изменять текст (и его аттрибуты).

К настоящему времени число форматов (в случае Window формат обычно определяется расширением имени файла) представления изображений определяется десятками и практически не растет далее (чего нельзя сказать о методах компрессии данных). Формат в большинстве случае определяется расширением имени файла (для MS Windows), однако в некоторых случаях информация в файле с одним и тем же расширением может оказаться сжатой различными методами.

Наипростейшим случаем сохранения растрового изображения является последовательное кодирование триад цвета в каждой точке изображения; при этом объем файла изображения будет не менее XY3N байт (X,Y - ширина и высота изображения в точках, N - число байт кодирования интенсивности каждого цвета). При размерах изображения 640480 и `глубине' цвета в 2 байта (216=65536 градаций) размер файла не менее 640480322 Mбайт! Учитывая, что в настоящее время обычно применяется глубина цвета в 3 или 4 байта (224=16'777'216 или 232=4'294'967'296 градаций интенсивности цвета) и значительно б о льшие размеры изображения, хранение полноцветных изображения без компрессии практически невозможно (о методах компрессии см. подраздел 2.3).

Одним из (исторически) первых форматов сохранения изображений явился точечный рисунок Windows (расширение имени файла.BMP,.RLE или.DIB; именно с BMP-форматом работает Windows-штатный графический редактор MS Paint. Бл и зким к BMP является формат ICO, до сих пор применяемый для сохранения изображений в виде маленьких `иконок'.

Файлы формата PCX (PC Paintbrush) использовались в основном в MS DOS и Windows'3x, поддерживается сжатие (компрессия) по методу ZSoft.

Графические файлы формата TIF (Tagged File Format) поддерживают все глубины цветности и используют сжатие.

Формат GIF (Graphics Interchange Format) поддерживает только 256-цветные изображения и (в современных версиях GIF87/GIF89) последовательность изображений (анимация); для использования на страницах HTML (HiperText Markup Language) важно свойство `прозрачности' (transparent) GIF-файлов. Для создания и редактирования анимированных GIF-файлов имеется большое количество ПО (например, Ulead GIFAnimator, www.ulead.com).

JPG -файлы (JPEG File Interchange Format) являются сильно компрессованными (возможно выбирать уровень компрессии в ущерб качеству изображения) и практически монополизировали InterNet (кроме небольших анимированных `ярлычков', где применяется GIF).

Формат DXF активно применяется фирмой AutoDESC (www.autodesc.com) в пакете AutoCAD и является стандартом обмена векторной графикой; DXF-файл является текстовым, поддерживает определения сложных объектов, вложенность блоков и др. Текстовый формат этих файлов способствовал их широкому распространению, т.к. (относительно) несложно разрабатывать пользовательские программы для считывания, анализа и создания DXF-файлов. Специально для применения в сети InterNet фирма AutoDESC разработала формат DWF (Drawing WEB File).

Продвигаемый MS формат WMF (Windows Metafiles Format) поддерживает векторную графику (и поэтому изображения легко масштабируются) и позиционируется как средство поддержания объектов галлереи кадров (Microsoft Clip Gallery).

Проблема авторизации изображений решен путем внедрения в файл изображения т.н. цифровой метки (компания DigimarcCorp., www.digimarc.com). Эффективность методики настолько высока, что единожды внедренная метка обнаруживается даже после сложных манипуляций с изображением и сканирования картинки, технология принята штатной в продуктах фирм Adobe (www.adobe.com) и Corel (www.corel.com).

Формат PDF (Portable Document Format) той же фирмы является форматов электронных документов и может включать текст, графику (как растровую, так и векторную) и иные данные.

Большое количество других форматов изображений используется не столь часто и здесь не рассматривается; некоторые из вышерассмотренных форматов изображений используются и при создании видеофильмов (см. ниже). Практически все форматы изображений приг о дны для использования в качестве объектов для предложенной MS технологии внедрения или связывания объектов (OLE); причем `внутри' конкретного приложения изображения сохраняются (в случае внедрения) в специфичном формате, для перекодирования применяются (автоматически применяемые) т.н. `графические фильтры'.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: