Форматы представления графической информации в ПК

Существуют два формата представления графической информации:

□ растровый;

□ векторный.

В растровом формате изображение запоминается в файле в виде мозаичного на­бора множества точек, соответствующих пикселам отображения этого изображе­ния на экране дисплея. Файл, создаваемый сканером, в памяти компьютера име­ет растровый формат (так называемая битовая карта — bitmap). Редактировать этот файл средствами стандартных текстовых и графических редакторов не представляется возможным, ибо они не работают с мозаичным представлением информации.

В векторном формате информация идентифицируется характеристиками шриф­тов, кодами символов, абзацев и т. п. Стандартные текстовые процессоры щ ч-назначены для работы именно с таким представлением информации.

Фундаментальное отличие векторных форматов от растровых можно показать на таком примере: в векторном формате окружность идентифицируется радиу­сом, координатами своего центра, толщиной и типом линии; в растровом форма­те хранятся просто последовательные ряды точек, геометрически формирующих окружность.

Следует также иметь в виду, что битовая карта требует очень большогб объема памяти для своего хранения. Так, битовая карта с одного листа документа формата А4 (204x297 мм) с разрешением 10 точек/мм и без передачи полутонов (штрихо­вое изображение) занимает около 1 Мбайт памяти, она же при воспроизведении 16 оттенков серого — 4 Мбайт, при воспроизведении цветного качественного изображения (стандарт High Color — 65 536 цветов) — 16 Мбайт. Иными словами, при использовании стандарта TrueColor и разрешающей способности 50 точек/мм для хранения даже одной битовой карты может не хватить емкости НМД.



Глава 7. Внешние устройства ПК


Для сокращения объема памяти, необходимой для хранения битовых карт, ис­пользуются различные способы сжатия информации. Наиболее распространен­ный алгоритм растрового уплотнения CCITT Group 4 дает коэффициент сжатия информации до 40:1 (в зависимости от содержимого данных). Другие используе­мые форматы сжатия: Group 3, CTIFF (Compressed Tagged Image File Format), MPEG, CALS, RLE, GIF и т. д. (файлы имеют соответствующие указанным аб­бревиатурам расширения).

Форматы без сжатия: Uncompressed TIFF, BMP и др.

Сканер используется обычно совместно с программами распознавания образов — OCR (Optical Character Recognition). Система OCR распознает считанные ска­нером с документа битовые (мозаичные) контуры символов и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов формат.

Некоторые системы OCR предварительно нужно обучить — ввести в память ска­нера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при различении букв, совпадающих по начертанию в разных алфавитах (например, в латинском ^английском) и в русском — кирил­лица) и разных гарнитур шрифтрв. Но большинство систем не требуют обуче­ния: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR — FineReader 6.0 — распознает тексты на десятках языков (в том числе языках программирования Basic, C++ и т. д), использует большое число электронных словарей, при распознавании проверяет орфографию, готовит тек­сты к публикации в Интернете и т. д.

В последние годы появились интеллектуальные программы распознавания обра­зов типа Omnifont, которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распо^ знавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.

Файлы в растровом формате разумно хранить только в том случае, если:

□ документы и соответствующие им файлы не должны редактироваться в про­цессе их использования;

□ документ должен храниться в виде факсимильных копий оригинала (фото­графии, рисунки, документы с резолюциями и т. п.);

□ имеются технические возможности для хранения и просмотра большого чис­ла огромных (по 1-20 Мбайт) файлов.

Основные факторы, учитываемые при выборе сканера:

□ размер, цветность и форма (листовые, сброшюрованные и т. д.) документов, подлежащих сканированию, должны соответствовать возможностям сканера;

□ разрешающая способность сканера должна обеспечивать воспроизведение высококачественных твердых копий документов по их электронным образам;

□ производительность сканера должна быть достаточно высокой при приемле­мом качестве получаемого изображения;

□ должна обеспечиваться минимальная погрешность в размерах получаемого электронного изображения по отношению к оригиналу в случае, если разме-


Дигитайзеры



ры изображения с электронного документа служат основанием для производ­ства расчетов;

□ необходимо наличие программных средств сжатия растровых файлов при хранении их в памяти компьютера;

□ необходимо наличие программных средств распознавания образов (OCR) при хранении векторных файлов в памяти компьютера;

□ необходимо наличие программно-аппаратных средств для улучшения качест­ва изображения в растровых файлах (повышения контрастности и яркости изображения, удаления фонового «шума»);

□ качество и тип бумаги носителя в известных пределах не должны сильно вли­ять на качество получаемого электронного изображения;

□ работа на сканере должна быть удобной и простой и исключать ошибки при сканировании при неверной заправке носителя;

□ учитывается стоимость сканера.

Сканер может подключаться к ПК через параллельный (LPT) или последова­тельный (через интерфейс USB) порт. Для работы со сканером ПК должен иметь специальный драйвер, желательно, драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программа­ми, например, распространенными графическими редакторами CorelDraw, Adobe Photpshop, MaxMate, Picture Publisher, Photo Finish и т. д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: