«Сканирование изображений и документов»
Учебная цель: ознакомиться с основными принципами работы в программе Fine Reader и научиться распознавать текст и изображение.
Образовательные результаты, заявленные во ФГОС третьего поколения:
Студент должен
уметь:
- работать с мультимедийным оборудованием
знать:
- основные понятия и терминологию предметной области мультимедийных технологий;
- практические приемы работы по использованию мультимедийных технологий.
Краткие теоретические и учебно-методические материалы по теме
лабораторной работы
Сканирование изображений и документов осуществляется аппаратно (сканер) и программно (программы оптического распознавания символов).
Сканер – это устройство, которое, анализируя какой-либо объект (обычно изображение, текст), создаёт цифровую копию изображения объекта.
FineReader — система оптического распознавания символов, которая позволяет извлекать текстовые данные из цифровых изображений (фотографий, результатов сканирования, PDF-файлов).
|
|
Процесс обработки FineReader осуществляется в несколько этапов:
1. Сканирование.
2. Выделение блоков на изображении.
3. Распознавание.
4. Сохранение.
Параметры сканирования:
Яркость: для светлых документов необходимо уменьшить яркость (сделать их темнее), для темных — увеличить (сделать их светлее).
Разрешение: 100 dpi – для текста, набранного крупным шрифтом, 300 dpi — для большинства документов, для небольших изображений; 400—600 dpi — для документов, набранных мелким шрифтом, больших детализированных изображений.
Выделение блоков на отсканированном изображении.
Для наиболее лучшего распознавания материала, необходимо выделить блоки отсканированной информации, такие как: текст, картинка, таблица.
Распознавание отсканированной информации производится либо автоматически, либо выбрав команду Распознать. При этом информация разбивается на блоки, и распознаются соответствующие им символы. Далее выполняется проверка символов на наличие ошибок, которые выделяются цветом.
Если сканирование было произведено при низком разрешении, то некоторые части блоков не распознаются и сохраняются либо в виде графического элемента, либо в виде набора непонятных символов.
При распознавании текста на том или ином языке выберите нужный язык из списка на панели Распознавание.