double arrow

Лабораторная работа № 3. «Сканирование изображений и документов»


«Сканирование изображений и документов»

Учебная цель:ознакомиться с основными принципами работы в программе Fine Reader и научиться распознавать текст и изображение.

Образовательные результаты, заявленные во ФГОС третьего поколения:

Студент должен

уметь:

- работать с мультимедийным оборудованием

знать:

- основные понятия и терминологию предметной области мультимедийных технологий;

- практические приемы работы по использованию мультимедийных технологий.

Краткие теоретические и учебно-методические материалы по теме
лабораторной работы

Сканирование изображений и документов осуществляется аппаратно (сканер) и программно (программы оптического распознавания символов).

Сканер – это устройство, которое, анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта.

FineReader — система оптического распознавания символов, которая позволяет извлекать текстовые данные из цифровых изображений (фотографий, результатов сканирования, PDF-файлов).

Процесс обработки FineReader осуществляется в несколько этапов:

1. Сканирование.

2. Выделение блоков на изображении.




3. Распознавание.

4. Сохранение.

Параметры сканирования:

Яркость: для светлых документов необходимо уменьшить яркость (сделать их темнее), для темных — увеличить (сделать их светлее).

Разрешение: 100 dpi – для текста, набранного крупным шрифтом, 300 dpi — для большинства документов, для небольших изображений; 400—600 dpi — для документов, набранных мелким шрифтом, больших детализированных изображений.

Выделение блоков на отсканированном изображении.

Для наиболее лучшего распознавания материала, необходимо выделить блоки отсканированной информации, такие как: текст, картинка, таблица.

Распознавание отсканированной информации производится либо автоматически, либо выбрав команду Распознать. При этом информация разбивается на блоки, и распознаются соответствующие им символы. Далее выполняется проверка символов на наличие ошибок, которые выделяются цветом.

Если сканирование было произведено при низком разрешении, то некоторые части блоков не распознаются и сохраняются либо в виде графического элемента, либо в виде набора непонятных символов.

При распознавании текста на том или ином языке выберите нужный язык из списка на панели Распознавание.







Сейчас читают про: