Этапы работы FineReader

Cunei Form

FineReader

PCR система - это компьютерная программа, позволяющая преобразовать текст бумажного носителя в электронный текстовый файл.

Для быстрого ввода текстовой информации в ПК широко используется сканер, который работает по принципу фотоаппарата. Для того, чтобы преобразовать графическое изображение в цифровой вид используются системы автоматического чтения текста или OCR (Optical Character Recognition)

Система автоматического чтения текста.

Пользователю интернет 2 есть доступ в интернет 2, а наоборот - нет.

Интернет-телефония. Программа Skype.

Ресурс - это телевещание.

Видиоконференции - это различные телемосты.

Аудиоконференции.

Интернет пейджинг - это система, позволяющая зарегистрироваться в своей системе серверов и получить уникальный пейджинговый номер. При каждом подключении к интернет программа ICQ определяет текущий IP адрес вашего ПК и отправляет его на центральный сервер и вы можете вызвать человека

IRC (chat) - обмен в реальном времени текстовыми сообщениями.

Тенденции развития глобальной сети интернет:

· Упрощения процедуры подключения сети (доступ через сотовые телефоны)

· Постоянное повышение скорости доступа в сети.

· Увеличение количества IP адресов.

Введена шестая версия протокола IP? Которая поддерживает не четырехбайтовый, а шестнадцатибайтовый IP адрес

· Предоставление пользователям все более широких возможностей (интернет-телефония, интернет магазины, веб-вещание…)

· Создание сети интернет 2 - это компьютерная сеть нового поколения. Сеть строится на базе протокола IP 6 (шестнадцатибайтовый OP адрес) и позволяет беспрепятственно передавать потоковую видеоинформацию.

· К концу столетия территориальные компьютерные сети должны стать основной информационной средой, а интернет станет основным средством связи.

· Современные информационные технологии в обработке текстов.

Принципы работы системы PCR:

· Целостность - объект описывается как целое с помощью значимых элементов и отношений между ними

· Целенаправленность - распознавание стоится как целенаправленное выдвижение как процесс выдвижения и целенаправленной проверки гипотез

· Адаптивность - это способность системы к самообучению.

Примеры:

· Этап - сканирование. Получение графическое образа документа

· Распознавание. а) анализ графического макета страницы. (выделение областей для распознавания и выделение в тексте строк и отдельных символов. б) распознавание каждого символа на основе различных алгоритмов распознавания

· Проверка ошибок

· Сохранение

Алгоритмы распознавания (классификаторы)

· Шаблонные (шрифтозависимые) - растровое изображение накладывается на шаблон, содержащийся в базе данных, наиболее подходящим является тот шаблон у которого наименьшее количество точек отличается.

· Шрифтонезависимые.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: