Синтез устной речи

Система распознавания устной речи

Система порождения письменных текстов

Система понимания письменных текстов

Машинный перевод текста

Система автоматического реферирования, аннотирования текста

Автоматическое чтение текста

Для полной идентификации (адресации) каждого ресурса интернет используется универсальный указатель ресурсов URL адрес (Uniform Resource Locator)

протокол //дом. адрес сервера. адрес файла

http//www.mslu.by

Internet как средство обмена информации:

- электронная почта (e-mail) – средство обмена инфой, подготовленной в электронном виде между людьми, имеющими доступ к компьютерной сети

- списки рассылки – услуга, которая позволяет определенному количеству пользователей сразу всем поставлять рекламную инфу, периодические издания

- use NET – глобальная распределительная система для дискуссий, включающая множество групп новостей, хранящихся на серверах по всему миру

- chat – IRC – обмен в реальном времени текстовыми сообщениями

- internet пейджер – система, позволяющая зарегиться в своей системе серверов и получить уникальный пейджинговый номер. При каждом подключении к интернет icq определяет текущий IP адрес ПК и отправляет его на центральный сервер, можно вызвать человека, имеющего пейджинговый номер и подключенного в данный момент.

- аудио-, видеоконференции

- радиотелевещание через инет

- интернет телефония

- Skype

Современные информационные системы в обработке текстов

Система автоматического чтения текста. Для быстрого и качественного вода текстовой инфы ПК широко используется сканер – работает по принципу фотоаппарата, позволяя ПК «увидеть» текст. Для того, чтобы преобразовать графическое изображение в текстовую форму необходимы системы автоматического чтения текста или система оптического распознавания символов (OCR – Optical Character Recognition)

Система автоматического чтения текста – компьютерная программа, позволяющая преобразовать текст бумажного носителя в электронный текстовый файл.

Система OCR - это частная задача машинного зрения. К этому классу задач также относятся и задачи распознавания образов, объектов (распознавание фальшивых денег, идентификация человека)

Принципы работы OCR системы:

1. целостность – объект описывается как целое с помощью значимых элементов и отношений между ними.

2. целенаправленность – распознавание строится как процесс выдвижения и целенаправленной проверки гипотез

3. адаптивность – способность компьютерной системы к самообучению

Этапы работы Fine Reader:

1. сканирование – получение графического образа документа

2. распознавание – а) анализ графического макета страницы (выделение областей для распознавания: таблиц, картинок, текстов)

б) распознавание каждого символа на основе различных форм распознавания


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: