Системы распознавания текстов

OCR-системы оптического распознавания символов. Первая такая система появилась в 1959г и могла распознавать тексты набранные только одним шрифтом(OCR-A, OCR-B). В 70-х гг 20в появилась OCR система, кот распознавала любой шрифт, но требовала предварительного обучения. В 1986г появилась система, кот могла распознавать шрифты без предварительного обучения. Сегодня OCR-система базируется на технологии целостного, целенаправленного, адаптивного распознавания. Целостность – объект воспринимается как единое целое с помощью значимых элементов и отношений между ними. Целенаправленность – распознавание строится как процесс выдвижения и целенаправленных проверок гипотез. адаптивность – способность системы к самообучению. Наиболее известной OCR-системой является Fine Reader. Этот продукт полностью совместим с последними версиями системы Windows. Его версия 6.0. поддерживает 177 языков мира, а также комбинацию рус-анг и др. процесс распознавания происходит без вмешательства человека, человек включается в окончательное редактирование полученного образа. Среди других систем этого класса – CuneiForm. Российская разработка конкурирующая с Fine Reader, о ее достоинствах говорит то, что ряд фирм включила ее в свои офисные пакеты.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: