double arrow

Программное обеспечение для слабовидящих и незрячих людей

Несмотря на то, что современные интерфейсы информационных систем достаточно сложные и в целом ориентированы на пользователя, существует еще много препятствий для работы с ПК либо ноутбуком людей с ограниченной зрительной функцией. Среди наиболее распространенных решений выделяют так называемые «программы-чтецы» либо «экранные дикторы» - программы, озвучивающие всё происходящее на экране, рассказывающие о том, как с помощью клавиатуры выполнить то или иное действие. Прежде всего, произносится название типа объекта — кнопка, текстовое поле, флажок и т. д. Затем читается, каково его состояние. Некоторые программы содержат дополнительные подсказки пользователю с напоминанием о возможных операциях с текущим объектом. Информация прочитывается каждый раз, когда объект изменяет свое состояние или фокус переходит к другому объекту. Это позволяет использовать компьютер без визуального контакта с экраном [9].

Однако, изучая отзывы о работе «экранного диктора» часто встречаются замечания, что он должен реагировать быстрее, считывать больше элементов управления и поддерживать больше языков. Например, для русской локализации Windows 7 нет встроенного русскоговорящего синтезатора речи. После чего сразу же возникает вопрос его необходимости, если он не выполняет своих функций, а только считывает найденные им английские слова, при этом пропуская русские, либо заменяя их (русские слова) на набор не распознаваемых звуков. Зачастую, эти речевые синтезаторы платные, а те, что распространяются на бесплатной основе, не обладают быстрой реакцией, высокой разборчивостью речи и интонационным разделением фрагмента речи.

Программы для синтеза речи состоят из нескольких независимых компонентов. И чтобы компьютер начал читать текст, необходимо установить несколько независимых компонентов: Движок программы (Text to Speech/TTS), Синтезатор речи (Для TTS голосовую речь в виде диктора) и оболочку программы - через которую управлять этим.

Более того, эти компоненты находятся в открытом коде, и можно править их самостоятельно, доводя речь диктора до совершенства, и создавая словари для синтезатора.

Российские разработчики этим не занимаются, а занимаются лишь крупные иностранные компании. Поэтому русскоязычных программ для превращения текста в речь не много.

Среди найденных мною, наилучшими оказались разработки 3-х компаний:

- Nuance.com (Речевой синтезатор «Катерина» СканСофт);

- Acapela-group.com (Речевые синтезаторы «Алёна» и «Николай»);

- Loquendo.com (голос «Дмитрий» и «Ольга»).

Самым качественным из них оказался речевой синтезатор «Алёна». Это самый последний синтезатор искусственной речи, который я смог найти в интернете. Дата создания: конец 2008г. Частота звука у синтезатора "Алёна" 22Khz. На сайте компании есть он-лайн синтезатор, где можно протестировать его [10].

Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности. Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Для относительно быстрой и уверенной работы за компьютером человека с ограниченными возможностями ему необходимо, прежде всего, знать раскладку клавиатуры. Причем, следует отметить, что на сегодняшний день не все клавиатуры имеют стандартный вид. Кроме того, что они делятся на обычные, эргономичные и компактные (без цифрового блока по правой стороне), они также могут содержать дополнительные кнопки (например, “Fn” для ноутбуков) либо отличатся от обычных клавиатур по причине, например, приспособленности под операционные системы Apple.

Все это говорит о том, что незрячему человеку нужна помощь, которая может быть представлена одним из следующих способов:

- «Помощь друга»

- Специальные учебные курсы для незрячих людей

- Учебный аудио курс для начинающих незрячих пользователей (такие аудио курсы можно найти, например, на сайте www.tiflocomp.ru)

- Специальные программы, помогающие быстрее освоить клавиатуру (например, «СОЛО на клавиатуре»)

Для того чтобы пользователь с ограниченными возможностями мог приступить к работе, необходимо предварительно настроить его ПК/ ноутбук, что опять же не возможно без помощи зрячего человека. Например, настроить включение «экранного диктора» или «экранной лупы» сразу же при запуске системы.

Современные компьютерные тифлоинформационные средства, которые могут быть использованы для людей с тяжелым нарушением зрения, позволяют ввод и вывод информации при помощи матрицы, которая образует рельефно-точечный шрифт Брайля.

Как известно, для слепых и слабовидящих людей умение читать и писать по Брайлю является одним из самых распространенных способов успешной адаптации и независимости. Брайлевский текст представляет собой последовательность знаков, состоящих из шести или восьми точек (Рис.2.8). Каждая из точек имеет два состояния: плоское и выпуклое. Таким образом, согласно правилам комбинаторики, число всех возможных конфигураций шеститочия составляет 26 = 64, а восьмиточия - 28 = 256. Отсюда следует, что всего двумястами пятьюдесятью шестью символами можно написать абсолютно любой брайлевский текст, на любом языке и с любыми дополнительными знаками.

Рисунок 2.8 – Нумерация точек шрифта Брайля при чтении

Две дополнительные точки появились позднее, поэтому их нумерация несколько выбивается из общего ряда: 7 - дополнительная точка под точкой 3, 8 - дополнительная точка под точкой 6.

Особо следует отметить тот факт, что глифы брайлевских знаков сортируются согласно бинарному инкременту, а не алфавитному порядку, так как знаки могут принимать разное значение в зависимости от конкретного языка, да и могут иметь вообще неалфавитный смысл, например, цифровой знак или знак курсивного начертания. В этом заключается очень важный момент понимания принципов построения кодов брайлевских символов, так как надо отказаться от привычных компьютерных категорий "буква = код", а рассуждать так, как бы мы это делали, выкалывая точки на приборе.

Как отмечалось ранее, любая из точек имеет два состояния. В компьютерной интерпретации Брайля плоскую точку следует воспринимать как 0, а выпуклую как 1. Таким образом, каждая отдельно взятая брайлевская точка представляет собой как бы бит информации, а восьмиточие формирует полноценный байт, состоящий из восьми битов. Здесь мы переходим к тому, что теперь брайлевский символ можно представить в двоичной форме, просто записав значение его точек в строку из восьми цифр, в качестве которых будут использоваться только нули и единицы. Особо следует обратить внимание на то, что точки надо записывать в обратном порядке, то есть в начале строки должна стоять точка 8, а в конце - точка 1, чтобы получилось именно двоичное число. Например, буква "t" пишется точками 2, 3, 4 и 5. Это означает, что данные точки будут иметь значение 1, а оставшиеся точки 1, 6, 7 и 8 будут иметь значение 0 [11].

Существуют программные модули, которые облегчают ввод информации за счет программного видоизменения раскладки клавиатуры.

Одна из программных разработок представляет собой эмулированную клавиатуру, использующую всего 15 функциональных клавиш (Рис. 2.9, 2.10). Для изображения букв и цифр в шрифте Брайля используются 6 точек, поэтому для реализации ввода этим шрифтом были выбраны клавиши S, D, F, J, K, L, эмулирующие ячейки 1-6. Именно эти клавиши были выбраны потому, что на всех современных клавиатурах, на клавишах F и J есть насечки – то есть эти клавиши можно без проблем отличить от других. Эмуляция выше перечисленных клавиш производится с помощью языка Javascript.

Рисунок 2.9 – Рабочие клавиши пользователя

Рисунок 2.10 – Символы, эмулирующие рабочие клавиши пользователя

Происходит эмуляция по следующей схеме: пользователь нажимает сочетание клавиш, после чего система перехватывает код нажатых клавиш, сравнивает его со словарем, и транслирует его в некоторый код, означающий ячейку брайлевого шрифта. Далее информация по протоколу SOAP передается на обработку в ядро.

Помимо основных символьных клавиш, в системе присутствуют также и специальные «горячие клавиши». Вывод информации производится побуквенно (при наборе текста) и пословно (при чтении текста) плеером, написанным специально для этого модуля. Также для программного решения характерные такие возможности как выбор языка, корректировка сообщений, согласно словарю для данного речевого движка, запись сообщения в разных форматах [12].


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: