Понятность и разборчивость речи

Основной характеристикой любого канала передачи речи является понятность речи. Для определения этой характеристики применяют статистический метод с участием большого числа слушателей и дикторов. Разработан количественный метод определения понятности речи через ее разборчивость.

Под разборчивостью речи понимают относительное или процентное количество принятых (понятых) элементов речи из общего числа переданных по каналу связи. Элементы речи составляют слоги, звуки, слова, фразы, цифры. В соответствии им поставлены слоговая, звуковая, словесная, смысловая и цифровая разборчивость. Для измерения разборчивости разработаны артикуляционные таблицы слогов, звукосочетаний и слов с учетом встречаемости их в русской речи.

В таблице 3.1 приведены градации понятности речи и соответствующие им разборчивости, полученные эмпирическим путем [4].

Таблица 3.1

Понятность речи Разборчивость речи, %
Слоговая Словесная
Предельно допустимая 25-40 75-87
Удовлетворительная 40-50 87-93
Хорошая 50-80 93-98
Отличная 80 и выше 98 и выше

Звуки речи являются сложными звуками в основном из-за того, что процесс речеобразования сопровождается резонансными явлениями. Собственные частоты которых изменяются в зависимости от того, какой звук в данный момент произносится.

Источник звука вызывает в системе резонаторов речеобразующего тракта собственные колебания. Звуки на собственных частотах резонаторов являются наиболее усиленными. Собственные частоты резонаторов называются формантами звука, так как они формируют характерное звучание гласных и согласных.

Частоты формант определяются конфигурацией речевого тракта и свойства источника звука на них не влияет. Это одно из важнейших положений акустической теории речеобразования.. Это положение позволяет связывать частоты формант только со спецификой артикуляции и по частотам формант судить о положении артикуляционных органов.

Форманты звуков речи заполняют весь частотный диапазон 150-7000 Гц. Средняя вероятность появления формант в том или ином участке частот для каждого языка вполне определена. Условились делить весь частотный диапазон на 20 полос (в том числе и для русского языка) с одинаковой вероятностью появления формант в каждой из них. Соответсутвющие полосы назвали полосами равной разборчивости. Оказалось, что при достаточно большой объеме передаваемой речи вероятности появления формант подчиняются правилу аддитивности. Вследствие этого вероятность появления формант в каждой полосе равной разборчивости равна 0,05.

Если воспринимать речь в условиях шумов и помех, то ее разборчивость получается меньшей. Это связано с тем, что форманты имеют различные уровни интенсивности: угромких звуков выше чем у глухих. Поэтому при повышении уровня шумов сначала маскируются форманты с низкими уровнями, а затем - с более высокими.

Так как вся энергия звуков речи в основном сосредоточена в формантах, то уровни формант практически совпадают с уровнями звуков речи.

Порог слышимости в шумах определяется спектральными уровнями шумов. Разность между средним спектральным уровнем речи и спектральным уровнем шумов будет определять вероятность появления формант выше уровня шумов.

Коэффициент разборчивости ώ определяется уровнем ощущения формант

Е = Вр х Вш,

где Вр средний спектральный уровень речи; Вш спектральный уровень шумов.

Для уровней ощущений, находящихся в пределах 0-18 дБ, коэффициент разборчивости можно определить по следующей приближенной формуле:

ώ = (Е+6)/30.

Для каждой полосы равной разборчивости коэффициент разборчивости ώn будет разным. Тогда суммарная вероятность приема формант (разборчивость формант) Àф определятся как

Àф = ∑0,05* ώn (при n = 1, 2, 3, …, 20).

3.2. Средства акустической разведки В общем случае акустическая разведка осуществляется перехватом производственных шумов объекта и перехватом речевой информации. По способу применения технические средства съема акустической информации можно подразделить на две большие категории [3,5,6]: 1. средства, требующие физического проникновения в защищаемые помещения: o радиозакладки; o закладки с передачей акустической информации в ИК-диапазоне; o закладки с передачей по сети 220 В; o закладки с передачей информации по телефонной линии; o диктофоны; o проводниковые микрофоны; o "телефонное ухо".   2. средства, не требующие физического проникновения в защищаемые помещения: o аппаратура, использующая "микрофонный эффект" устройств; o высокочастотное навязывание; o стетоскопы; o лазерные микрофоны; o направленные микрофоны. Рассмотрим более подробно перечисленные выше средства акустической разведки. Радиозакладки. Назначением этих устройств является передача по радиоканалу акустической информации с защищаемого объекта. Закладки могут быть исполнены в виде отдельного модуля или имитировать формой повседневные предметы обихода (пепельницу, зажигалку, калькулятор, авторучку и т.д.). Внешний вид радиозакладок представлен на рисунках 3.4, 3.5, 3.6. Рис. 3.4. Камуфлированная радиозакладка в виде зажигалки Рис. 3.5. Камуфлированная радиозакладка в виде монеты   Рис. 3.6. Радиозакладка в обычном исполнении Радиозакладка передает информацию с помощью электромагнитных волн радиодиапазона. Естественным является обязательное наличие приемника в данной схеме. Интересно, что приемники могут использоваться разные и принципиальных отличий бытовых приемников (плеер, музыкальный центр, магнитофон) от специальных нет. Единственное, что определяет в данном случае прием - частота, на которой работает радиозакладка. Фактически злоумышленник может не тратиться на покупку специального приемника и принимать сигнал стандартными средствами в широковещатетельном диапазоне. Конечно, в этом случае другой человек с бытовым приемником в радиусе действия радиозакладки сможет тоже принять данный сигнал, что увеличивает вероятность обнаружения злоумышленника. Недостатком радиозакладок с точки зрения злоумышленника является возможность их обнаружения специальным приемником контроля. Этого недостатка лишены закладные устройства, передающие информацию по оптическому каналу в ИК-диапазоне, который не видим для глаза человека. Естественно обнаружить ИК-передатчики крайне сложно. Ввиду того, что информация передается по оптическому каналу, закладка должна находиться в области прямой видимости злоумышленника. Как правило, ИК-передатчики располагаются с внешней стороны оконных рам, в вентиляционных отверстиях и т.п., что облегчает задачу их поиска. Пример применения ИК-датчика показан на рисунке 3.7. Рис. 3.7. Перехват акустической информации с помощью ИК-закладки К недостаткам ИК-закладок можно отнести высокую стоимость и высокое потребление энергии, в результате чего среднее время работы составляет в 15-20 часов. Кроме радио и оптического канала для передачи информации используются линии электропитания силовой сети 220 В и телефонные линии. Закладки, использующие линии электропитания для передачи информации, часто называют сетевыми закладками(рис. 3.8). Принцип работы таких закладок схож с радиозакладками. Рис. 3.8. Сетевая акустическая закладка К техническим средствам съема акустической информации относятся также диктофоны. Диктофон - устройство, регистрирующее голосовую информацию ленту, проволоку, внутреннюю микросхему памяти. Время записи различных диктофонов колеблется в пределах от 15 минут до 8 часов. Современные цифровые диктофоны записывают информацию во внутреннюю память, позволяющую производить запись разговора длительностью до нескольких часов. Эти диктофоны практически бесшумны (т.к. нет ни кассеты, ни механического лентопротяжного механизма, производящих основной шум), имеют возможность сброса записанной информации в память компьютера для ее дальнейшей обработки. Питание большинства диктофонов обеспечивается батарейками, вес которых составляет десятки и сотни грамм. При этом современные диктофоны могут иметь очень маленький размер, позволяющий размещать их где угодно в защищаемом помещении. Рис. 3.9. Мини-диктофон Edic-Mini Tiny B21 На рисунке 3.9 приведен пример современного цифрового мини-диктофона Edic-Mini Tiny B21, который имеет следующие характеристики: активация по голосу, вес 6 г, размеры 40x8x15 мм, до 60 часов работы при использовании воздушно-цинковых батареек. На стадии строительства или ремонта помещения в нем скрытно могут быть установлены маленькие микрофоны, которые по проводам соединяются с приемником сигнала. Такие микрофоны называют проводными. В проводных системах используются в основном электретные микрофоны, обеспечивающие регистрацию речи средней громкости на удалении до 7-10 м от его источника. При этом частотный диапазон составляет от 20 – 100 Гц до 6 – 20 кГц. Для питания таких микрофонов используется постоянно напряжение 9-15 В. Как правило, микрофон снабжается усилителем. Для передачи информации и питания усилителя используются 2-х или 3-х проводные линии (рисунки 3.10, 3.11.). Рис. 3.10. 3-х проводной микрофон Шорох-8   Рис. 3.11. 2-х проводной микрофон Микрофоны устанавливаются либо скрытно (немаскированые), либо маскируются под предметы обихода, офисной техники и т.д. Несколько микрофонов могут заводиться на общее коммутирующее устройство, позволяющее одновременно контролировать несколько помещений и осуществляющее запись перехваченных разговоров на диктофон. Для передачи акустической (речевой) информации по телефонной линии используются закладные устройства типа "телефонное ухо". Рис. 3.12. "Телефонное ухо" ТУ-2 Данное устройство тайно монтируется в корпус телефона или телефонную розетку и представляет собой, как правило, высокочувствительный микрофон электретного типа с усилителем и специальным устройством для подключения к телефонной линии при дозвоне по определенной схеме. Принцип работы следующий. Человек производит телефонный звонок по номеру, на котором "висит" закладка. "Телефонное ухо" "умалчивает" первые два звонка, таким образом, в помещении телефонные звонки не раздаются. Вызывающий кладет трубку и опять набирает этот номер. В трубке будет звучать сигнал "занято", оператор ждет 30-60 с (временной пароль) и после прекращения сигнала "занято" набирает бипером номер - включается микрофон и оператор слышит все, что происходит в контролируемом помещении практически из любой точки мира, где есть телефонный аппарат. Разрыв связи произойдет, если оператор положит трубку или если кто-то поднимет телефонную трубку в контролируемом помещении. Для всех остальных абонентов, желающих дозвониться по этому номеру, бу дет слышен сигнал "занято". Данный алгоритм работы является типовым, но может отличаться в деталях реализации, в зависимости от требований. При этом питание устройства осуществляется по телефонной линии, то есть срок службы его практически не ограничен. Направленные микрофоны Если требуется организовать прослушивание разговоров в помещении, доступ в которое так же, как и доступ в соседние помещения, невозможен, то используются направленные микрофоны. Направленные микрофоны имеют узкую диаграмму направленности (5…35˚) и коэффициент усиления более 70...90 дБ. Максимальная дальность действия НАМ в условиях города не превышает 100 – 150 м, за городом при низком уровне шумов дальность разведки может составлять до 500 м и более. Виды направленных микрофонов: • параболические; • плоские акустические фазированные решетки; • трубчатые, или микрофоны "бегущей" волны; • органного типа; • градиентные. Параболический микрофон. Представляет собой отражатель звука параболической формы, в фокусе которого расположен обычный (ненаправленный) микрофон. Отражатель изготавливается как из оптически непрозрачного, так и прозрачного (например, акриловая пластмасса) материала. Величина внешнего диаметра параболического зеркала может быть от 200 до 500 мм. Принцип работы этого микрофона поясняется на рисунке 3.13. Звуковые волны с осевого направления, отражаясь от параболического зеркала, суммируются в фазе в фокальной точке А. Возникает усиление звукового поля. Чем больше диаметр зеркала, тем большее усиление может обеспечить устройство. Если направление прихода звука не осевое, то сложение отраженных от различных частей параболического зеркала звуковых волн, приходящих в точку А, даст меньший результат, поскольку не все слагаемые будут в фазе. Ослабление тем сильнее, чем больше угол прихода звука по отношению к оси. Создается, таким образом, угловая избирательность по приему. Параболический микрофон является типичным примером высокочувствительного, но слабонаправленного микрофона. Внешний вид параболических направленных микрофонов представлен на рисунках 3.14, 3.15. Трубчатые микрофоны, или микрофоны "бегущей" волны.В отличие от параболических микрофонов и плоских акустических решеток, принимают звук не на плоскости, а вдоль некоторой линии, совпадающей с направлением на источник звука. Принцип их действия поясняется на рисунке 3.16.   Рис. 3.13. Принцип работы параболического микрофона     Рис. 3.14.Внешний виднаправленного микрофона «Супер Ухо – 100»   Рис. 3.15.Внешний вид параболического направленного микрофона   Рис. 3.16.Трубчатый микрофон. Основой трубчатого микрофона является звуковод в виде жесткой полой трубки диаметром 10-30 мм со специальными щелевыми отверстиями, размещенными рядами по всей длине звуковода, с круговой геометрией расположения для каждого из рядов. Очевидно, что при приеме звука с осевого направления будет происходить сложение в фазе сигналов, проникающих в звуковод через все щелевые отверстия, поскольку скорости осевого распространения звука вне трубки и внутри нее одинаковы. Когда же звук приходит под некоторым углом к оси микрофона, то это ведет к фазовому рассогласованию, так как скорость звука в трубке будет больше осевой составляющей скорости звука вне ее, вследствие чего снижается чувствительность приема. Обычно длина трубчатого микрофона от 15-230 мм до 1 м. Чем больше его длина, тем сильнее подавляются помехи с боковых и тыльного направлений.     Рис. 3.17.Внешний вид трубчатого направленного микрофона PKI 2925 Рис. 3.18.Миниатюрный направленный микрофон UEM-88 Направленный микрофон органного типа.С помощью направленного микрофона органного типа можно прослушать разговор на расстоянии до 1 км в пределах прямой видимости. Здесь имеет место принцип: "поблизости никого нет, но тем не менее вас хорошо прослушивают". Использование явления резонанса звуковых волн в направленных системах приводит к увеличению уровня сигнала звуковой энергии, который поступает в микрофон. Простой направленный микрофон представляет собой набор из семи алюминиевых трубок диаметром 10 мм. Длина трубки определяет резонансную частоту звукового сигнала. Формула для расчета длины трубок имеет следующий вид: L = 330/2F, где L - длина трубки в метрах; F - резонансная частота в герцах. Исходя из вышеприведенной формулы, можно построить таблицу 3.2, где N - номер трубки. Таблица 3.2
N              
L, м              
F, Гц              

Рис. 3.19. Избирательная система из направленных трубок

 

Рис. 3.20. Микрофон в параболическом улавливатели

Усиление сигнала происходит за счет использования высокочувствительного микрофонного усилителя МУ. Этот направленный микрофон перекрывает диапазон частот от 300 Гц до 3300 Гц, т. е. основной информационный диапазон речевого сигнала.

Если необходимо получить более качественное восприятие речи, то необходимо расширить диапазон принимаемых частот. Это можно сделать путем увеличения количества резонансных трубок, например, до 37 штук. Такая резонансная система перекрывает диапазон частот от 180 Гц до 8200 Гц.

Плоские фазированные решетки. Плоские фазированные решетки реализуют идею одновременного приема звукового поля в дискретных точках некоторой плоскости, перпендикулярной к направлению на источник звука (рис. 2). В этих точках (А1, А2, А3...) размещаются либо микрофоны, выходные сигналы которых суммируются электрически, либо, и чаще всего, открытые торцы звуководов, например трубки достаточно малого диаметра, которые обеспечивают синфазное сложение звуковых пален от источника в некотором акустическом сумматоре.

 

Рис. 3.21. Плоская фазированная решетка

К выходу сумматора подсоединен микрофон. Если звук приходит с осевого направления, то все сигналы, распространяющиеся по звуководам, будут в фазе, и сложение в акустическом сумматоре даст максимальный результат. Если направление на источник звука не осевое, а под некоторым углом к оси, то сигналы от разных точек приемной плоскости будут разными по фазе и результат их сложения будет меньшим. Чем больше угол прихода звука, тем сильнее его ослабление. Обычно число приемных точек Аi в таких решетках составляет несколько десятков. Конструктивно плоские фазированные решетки встраиваются либо в переднюю стенку атташе-кейса с последующим камуфляжем, либо в майку-жилет, которая надевается под пиджак или рубашку. Необходимые электронные блоки (усилитель, элементы питания, магнитофон) располагаются соответственно либо в кейсе, либо под одеждой. Таким образом, плоские фазированные решетки с камуфляжем визуально более конспиративны по сравнению с параболическим микрофоном.

Градиентный микрофон. Он представляет собой два достаточно миниатюрных и близкорасположенных высокочувствительных микрофона М1 и М2, выходные сигналы которых электрически (или акустически) вычитаются друг из друга, реализуя в конечных разностях первую производную звукового поля по оси микрофона и формируя диаграмму вида cosQ, где Q - угол прихода звука. Тем самым обеспечивается относительное ослабление акустических полей с боковых направлений (О - 90°). Градиентными микрофонами высоких порядков называют системы, реализующие пространственные производные 2-го, З-го и более старших порядков.

Основной пользовательской характеристикой направленных микрофонов является дальность их действия в конкретных условиях R. Для открытого пространства и изотропных и независимых по угловым направлениям внешних акустических помех дальность действия R связана:

• со спектральным отношением сигнал/помеха q на выходе направленного микрофона;

• со спектральным уровнем речи Вр;

• со спектральным уровнем внешних акустических помех Вш соотношением вида:

q = Bp - Bш - 20lg R+G - Bп, (1)

где G - так называемый коэффициент направленного действия микрофона (дБ), Вп - пороговая акустическая чувствительность микрофона (дБ).

Рис. 3.22. Простейший градиентный микрофон

Входящий в формулу (1) коэффициент G направленного действия характеризует степень относительного подавления внешних акустических помех: чем он больше, тем сильнее это подавление. Теоретически он связан с нормированной диаграммой направленности микрофона F (Q,j) соотношением вида:

,

где Q - угол прихода звуковой волны по отношению к оси микрофона; j - угол прихода звуковой волны в полярных координатах плоскости, перпендикулярной оси.

Например, для трубчатого микрофона, когда

,

где l - длина волны звука. а L - длина трубки, имеем (при L > l.):

G = 4 L/l. (4)

Аналогично выводится приближенная формула для коэффициента направленного действия параболических микрофонов и фазированных плоских решеток:

G = 4π (S/l2), (5)

где S - площадь входной апертуры; l - длина волны звука. Для градиентных микрофонов n -го порядка при оптимальной обработке сигналов

G=n (n+1), (6)

где n - порядок градиента.

При известных значениях величины G формула (1) достаточна для получения абсолютных оценок ожидаемого спектрального отношения сигнал/помеха, если известны условия. Но во многих случаях знания этих условий бывают неточны. Поэтому более оправданно использовать не абсолютные, а относительные оценки дальности, как не требующие точных знаний условий, поскольку сопоставление происходит при их равенстве. Принимая такую идеологию, сравним возможности направленных микрофонов с возможностями не вооруженного специальными устройствами человеческого слуха. Формально для него можно записать соотношение, аналогичное (1). В результате сравнения получим:

R=R0 x 10 0,05 (G-G0) – 0,005 (D-Bп), (7)

где R0 - дальность слышимости звука органом слуха; R - дальность действия направленного

мммикрофона микрофона с тем же качеством контроля; G0 - коэффициент направленного действия органа слуха человека (режим биноурального прослушивания); (D-Bп) - разность пороговой чувствительности направленного микрофона и органа слуха.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: