Электронные словари и переводчики. Программы распознавания текста. Программы обнаружения плагиата

Электронный словарь — словарь в компьютере или другом электронном устройстве. Позволяет быстро найти нужное слово, часто с учётом морфологии и возможностью поиска словосочетаний (примеров употребления), а также с возможностью изменения направления перевода (например, англо-русский или русско-английский).Внутренне устроен как база данных со словарными статьями. Электронные словари не стоит путать с компьютерными словарями, предназначенными не для пользователей, а для компьютерных программ, работающих с текстами на естественных языках

Google Переводчик (англ. Google Translate) — веб-сервис компании Google, предназначенный для автоматического перевода части текста или веб-страницы на другой язык. Для некоторых языков пользователям предлагаются варианты переводов, например, для технических терминов, которые должны быть в будущем включены в обновления системы перевода. В отличие от других сервисов перевода, таких, как Babel Fish и AOL, которые используют технологию SYSTRAN (английский), Google, как и Translate.ru, использует собственное программное обеспечение. Видимо, используется самообучаемый алгоритм машинного перевода. Сервис включает в себя также перевод всей веб-страницы и даже одновременный поиск информации с переводом на другой язык.

Оптическое распознавание символов — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные — последовательность кодов, использующихся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

В настоящее время существует достаточно большое количество сервисов и программ, позволяющих каким-либо образом выявить заимствования:

Система «Антиплагиат» разработана компанией «Форексис».[20]

Система осуществляет онлайн поиск по большому количеству документов, хранящихся в собственной базе. Обладает рядом недостатков, таких как: отсутствие осуществления поиска по документам, доступным в сети Интернет; ограничение проверяемого текста 3000 символами и 5000 символами после регистрации и ограничение возможностью проверки только по базе имеющихся работ.

Программа Advego Plagiatus осуществляет онлайн проверку с использованием поисковых систем.В отличие от аналогичных систем, Advego Plagiatus не использует Яндекс.XML. Программа выдаёт процент совпадения текста и выводит найденные источники. Программа не преобразует буквы, то есть нет преобразования регистра, нет обработки и изменения латинских букв в русских словах на аналогичные буквы русского алфавита для текстов на русском языке. Также отсутствует поддержка поиска по собственной базе

Сервис www.istio.com осуществляет проверку текста на наличие заимствованного контента с использованием поисковых систем Яндекс.XML и Yahoo.com..

Возможности сервиса несколько слабее по сравнению с Miratools. По результатам проверки выдаётся сообщение о том, является ли текст уникальным или нет, и выдаётся список подобных страниц сайтов. Сервис предоставляет дополнительные средства для анализа текстов, например, проверку орфографии, анализ наиболее частотных слов и т. д. У системы отсутствует преобразование букв и поиск по собственной базе.

Система Plagiatinform проверяет документы на наличие заимствований как в локальной базе, так и в сети Интернет.

Система умеет находить плагиат в виде документов, скомпонованных из «перемешанных» кусков текста нескольких источников. Проверка может осуществляться с использованием быстрого или углублённого поиска. Результаты проверки выдаются в виде наглядного отчёта. Недостатком является отсутствие преобразования букв. Также авторы не предоставляют возможности свободного использования или тестирования системы, и оценить качество её работы невозможно.


3. Практическое задание.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: