Розпізнання документів в програмі Fine Reader

Програма Fine Reader призначена для розпізнання текстів на російському, англійському, німецькому, українському, французькому і багатьох інших мовах, а також для розпізнання змішаних двох мовних текстів. Вона дозволяє редагувати текст і провіряти його орфографію. FineReader працює з різними моделями сканерів. Програма дотримується стандарту TWAIN. Ми розглянемо програму на прикладі версії 4.0 одну із основних версій. Після того, як зображення відскановано, його необхідно розпізнати. Розпізнавання слід розпочати із встановлення мови скориставшись інструментом панелі інструментів Мова. Якість розпізнавання багато в чому залежить від того, наскільки гарне зображення отримане при скануванні. Якість зображення регулюється установкою основних параметрів сканування: типу зображення, дозволу {яскравості).

Розпізнаване зображення може бути сильно “засмічене”, тобто містити багато зайвих крапок, що виникли в результаті сканування. Для вилучення “сміття” використовується команда:

Изображение\Очистить изображение от мусора.

В меню Изображение присутні і інші команди щодо положення зображення у вікні.

Щоб інвертувати зображення:

Изображение\Инвертировать.

Розпізнавання інформації можна виконувати окремими ділянками документа, але попередньо потрібно виділити ділянку стандартним для Windows способом і вибрати інструмент для роботи командою:

Изображение\Тип блока (текст, таблица, картинка, штрих-код).

Поділ інформації на ділянки за типами (текст, таблиця, малюнок) є бажаним для якісного вигляду сканованої інформації після її збереження.

Для стирання “сміття” або іншого можна скористатись інструментом Ластик:

Изображение\Выбрать инструмент\Ластик.

При розпізнаванні зображення текст повинний читатися зверху вниз і рядки повинні бути горизонтальними. Щоб повернути зображення у меню Зображення необхідно вибрати відповідні пункти:

· на 90 градусів вправо – натиснути кнопку на панелі інструментів чи вибрати пункт Rotate Clockwize (повернути за годинниковою стрілкою);

· на 90 градусів вліво – натиснути кнопку панелі інструментів чи вибрати пункт Rotate Counter-Clockwize (повернути проти годинникової стрілки);

· на 180 градусів – вибрати пункт Rotate Upside Down (повернути на 180 градусів).

Для дзеркально відображення зображення у меню Зображення необхідно вибрати відповідні пункти:

ü відносно горизонтальної прямої – пункт Flip Horizontal (дзеркальне відображення щодо горизонталі);

ü вертикальної прямої – пункт Flip Vertical (дзеркальне відображення щодо вертикалі).

Якщо потрібно виключити якусь ділянку тексту з розпізнавання чи на зображенні великі ділянки сміття, то для цього потрібно вибрати інструмент W на панелі у вікні Image (Зображення) і, натиснувши на ліву кнопку миші, виділити ділянку зображення, яку потрібно вилучити. Після відпускання кнопки, виділена частина зображення буде вилучена.

Для збільшення/зменшення масштабу зображення можна на панелі Image Tools (Зображення) (у вікні Image (Зображення)) вибрати інструмент і натиснути мишею на зображенні, або натиснути правою кнопкою миші на зображенні і у контекстному меню вибрати пункт Zoom (Масштаб) і потрібний масштаб.

Для скасування останньої дії на панелі Standard (Стандартна) потрібно натиснути кнопку [Undo (Скасувати)].

Четвертий етап процесу введення документа в комп'ютер полягає у тому, що розпізнаний об’єкт(інформацію) необхідно зберегти у поточному каталозі, попередньо виділивши потрібну сторінку у вікні Пакет:

натиснути стрілку праворуч від кнопки [Save (Зберегти)],

або у власній папці на диску персонального комп’ютера послідовністю дій:

Файл\Зберегти зображення як\У діалоговому вікні вибрати диск, папку для розміщення файлу, що зберігається, формат, надати ім'я файлу\36epeгти.

FineReader може зберігати результати розпізнавання в форматах усіх пакетів програм MS OFFICE.

Відскановане і розпізнане зображення необхідно перевірити і відкорегувати.

FineReader може відкривати файли наступних форматів: BMP, PCX, DCX, JPEG, TIFF, PNG.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: