Після завершення розпізнавання результат з'являється у новому вікні, яке має можливості редагувати безпосередньо в ньому. Ви можете перевірити результати розпізнавання використовуючи панель інструментів Перевірка.
ПОРЯДОК ВИКОНАННЯ РОБОТИ
- Відкрийте документи, запропоновані викладачем для розпізнавання. Ці файли сканувалися з різною роздільною здатністю. (100, 150, 200, 300, 400, 600 dpi). Таким чином, у нас буде можливість визначити мінімальну достатню роздільну здатність для сканування документів, надрукованих різними кеглями шрифтів для подальшого розпізнавання.
- Вивчіть структуру файлу, визначте (за значеннями узятим в дужках в кінці кожного абзацу) висоту символів в кожній ділянці тексту, яка використовувалася при виведенні на друк.
- Розпізнайте текст в кожному з файлів (див. теоретичні відомості).
- Зробіть висновок про середню кількість помилок при розпізнанні кожного з шрифтових блоків у файлах з різною роздільною здатністю. Заповніть таблицю:
№ з/п | Роздільна здатність зображення, dpi | Розміри шрифту при кількості помилок → 0 | Розміри шрифту при кількості помилок → ∞ |
Зміст звіту
|
|
- Параметри, які необхідно вказувати під час розпізнавання тексту.
- Заповнена таблиця з пункту 4.
- Висновок про достатню та недостатню роздільну здатність сканування для різних кеглів шрифтів.
Контрольні питання
- 1. Яка роздільна здатність сканування достатня для розпізнавання тексту надрукованого десятий кеглем?
- 2. Чи обов'язково в CuneiForm встановлювати мову розпізнавання або вона може вибиратися автоматично?
- 3. У чому полягає омніфонтовість OCR?
- 4. Перерахуйте основні елементи вікна програми CuneiForm?
- 5. Призначення і сфера застосування програм OCR.