Формула Шеннона и интервал Найквиста

Развитие телеграфной техники привело к необходимости теоретически оценить предельно достижимую скорость передачи элементарных посылок тока через канал связи, рассматриваемый как линейный фильтр нижних частот с частотой среза F н (Проблема № 3 ПТИ). Первым, кто в 1928 г. успешно решил эту задачу, был американский электроинженер шведского происхождения Гарри Найквист. Он доказал, что интервал между соседними элементарными телеграфными посылками T э должен быть не менее, чем величина 1/(2 F н): T э ≥ 1/(2 F н). Подчеркнём, что при аналого-цифровом преобразовании сигналов s (t) со спектром, ограниченным величиной Fm, величина интервала дискретизации Δ t д, напротив, должна быть не более, чем величина 1/(2 Fm): Δ t д ≥ 1/(2 Fm).

По предложению Шеннона предельное значение интервала (шага, периода) дискретизации Δ t макс = 1/(2 Fm), где Fmмаксимальное значение частоты финитного спектра детерминированного сигнала s (t) с ограниченной энергией или энергетического спектра W ξ(ω) эргодического случайного сигнала ξ(t), называется интервалом Найквиста (см. разд. 15), хотя сам Найквист проблемой дискретизации не занимался. Однако рассуждения Г. Найквиста относительно предельно достижимой скорости телеграфирования оказались настолько логически безукоризненными и нашли такое широкое применение в современных цифровых системах электросвязи, что они безусловно должны войти в курс «Прикладная теория информации» как пример глубокого инженерного подхода к математическим проблемам.

В 1924 г. Г. Найквист опубликовал статью «Некоторые факторы, влияющие на скорость телеграфирования» [53], в которой он сформулировал эвристическое положение (p. 332-333): «Скорость, с которой сообщение может передаваться по телеграфной линии, имеющей заданную … частоту следования элементарных посылок, может быть определена приблизительно следующей формулой … W = K log m, где W – скорость передачи сообщения, m – число уровней тока [используемых в многоуровневой телеграфии – Г. Х.], – константа».

Отметим, что в 1924 г. Найквист пользуется термином “ intelligence ” (сообщение), а не “ information ” (информация).

Вместе с тем, величина K в формуле Найквиста должна зависеть от частоты среза F Н полосы пропускания телеграфной линии, рассматриваемой как фильтр нижних частот, поскольку элементарные посылки тока претерпевают в проводной линии связи соответствующие линейные искажения: затягивание фронтов импульсов тока, наличие у телеграфных сигналов на выходе линии связи «хвостов» и т. п.

Сотрудник Найквиста по Белловским телефонным лабораториям Ральф Хартли в 1928 г., на основании анализа переходных процессов в телеграфнойсистеме, пришёл к следующем качественному выводу (цит. по рус. переводу [50], с. 24): «… максимальная скорость передачи информации, возможная в системе, частотный диапазон которой ограничен некоторой областью [не обязательно частотой среза по низким частотам – Г. Х.], пропорциональна ширине этой полосы частот. Отсюда и следует, что о б щ е е к о л и ч е с т в о и н ф о р м а -ц и и, к о т о р о е м о ж е т б ы т ь п е р е д а н о п о с р е д с т в о м т а к о й с и ст е м ы, п р о п о р ц и о н а л ь н о п р о и з в е д е н и ю п е р е д а в а е -

м о й п о л о с ы ч а с т о т н а в р е м я, в т е ч е н и е к о т о р о г о с и с т е-м а и с п о л ь з у е т с я д л я п е р е д а ч и» [разрядка Р. Хартли – Г. Х.]. Кроме того, он считает, что следующую элементарную посылку нужно передавать тогда, когда переходные процессы в телеграфной линии практически уже затухли. Подчеркнём, что в 1928 г. Хартли использует уже термин “ information ” и обобщает меру количества информации, предложенную Найквистом (log m) для случая равновероятных дискретных сообщений.

В фундаментальной статье 1928 г. [54] Г. Найквист пишет (p. 617): «Чтобы определить степень искажения телеграфных сигналов, нужно рассчитать переходные процессы в телеграфной системе. Эта методика использовалась различными авторами [в том числе и Хартли – Г. Х.], а их решения справедливы для телеграфных систем с простыми начальными условиями...

Статья “атакует” эту же проблему с альтернативной точки зрения: с использованием характеристик установившегося режима в системе».

Вначале Найквист рассматривает «многоуровневую телеграфию», при которой длительности подряд идущих элементарных прямоугольных посылок одинаковы и равны τэ, а каждая элементарная посылка имеет свой индивидуальный множитель ah. Если взять N таких телеграфных посылок, то спектр Фурье последовательности посылок с амплитудами a 1, a 2, …, ah, …, aN будет линейчатым и определяться «фактором формы»:

F (fn) = 2 sin fn τэ)/(π fn τэ) = 2 sinc fn τэ), где sinc (x) ≡ (sin x)/ x.

Наоборот, если имеется элементарная посылка, спектр которой является равномерным в полосе частот f от f = 0 до f = F Н, а вне этой полосы – нулевой, то её форма есть s э(t) = 2 F Н sinc (2 π F Н t). Позже эту функцию назвали функцией отсчётов (см. разд. 15).

При t = 0 величина s э(0) = 2 F Н, а при tk = k /(2 F Н); k ≠ 0; величина s э(tk) = 0. Отметив этот математический факт, Найквист переходит к анализу сигналов во временнόй области.

Телеграфный канал в первом приближении можно считать фильтром нижних частот с частотой среза F Н. Поэтому на выходе системы сигнал s вых(t) по отношению к входной прямоугольной посылке длительностью τэ будет «затянутым», и часть энергии предыдущих элементарных посылок будет попадать в интервал времени, отведённый для текущего элемента, что вынуждает уменьшать скорость телеграфирования (скорость поступления на вход телеграфного канала элементарных посылок), то есть подавать элементарные посылки с частотой (0,5... 0,7) F Н, что характерно для обычного однополюсного двухуровневого телеграфа.

Как истинный инженер-изобретатель, Найквист вводит неожиданный, но почти очевидный критерий отсутствия межсимвольных искажений. Он замечает, что если на выходе телеграфной линии, на которую поступают прямоугольные (элементарные) посылки с различными амплитудами из множества (многоуровневая телеграфия), измеряются мгновенные напряжения (или токи) в середине каждой посылки и если измеренные напряжения будут пропорциональны этим амплитудам, то на выходе канала можно будет синтезировать последовательности прямоугольных посылок, подобные входным последовательностям. В таком случае, несмотря на межсимвольную интерференцию, имеющуюся на выходе телеграфной линии с ограниченной полосой пропускания F Н, передача сообщений будет неискажённой.

В Прил. II к статье [54] Найквист показывает, что такому критерию удо-влетворяют сигналы, которые имеют равномерную амплитудно-частотную характеристику в диапазоне частот f от f = 0 до f = F Н, то есть s вх(t) = ah sinc t э), где τэ = 1/(2 F Н). На выходе канала связи с равномерным коэффициентом передачи в полосе частот f от f = 0 до f = F Н вклад всех элементарных посылок, предшествующих данной посылке, в середине временного интервала, который соответствует текущей посылке, будет нулевым, и межсимвольных искажений не будет.

Такие телеграфные системы – нереализуемы. Однако Найквист доказывает, что если к сигналу с идеальной прямоугольной амплитудно-частотной характеристикой (АЧХ) добавить сигнал, спектр которого симметричен относительно F Н(с точностью до знака), то получившийся суммарный телеграфный сигнал также не будут вносить межсимвольных искажений и будет передавать сообщения со скоростью v т, близкой к величине 2 F Н, что в 2-3 раза превышает скорость телеграфирования в обычном (однополярном) телеграфе. Правда, для этого в телеграфной системе должна производиться сложная синхронная нелинейная обработка сигналов, что было реализовано лишь в 1980-х годах в системах электросвязи с многоуровневой амплитудной манипуляцией N-ASK.

На рис. 27 представлены действительные и мнимые части коплексных спектров телеграфной волны (элементарной посылки), которая позволяет пере-

давать телеграфные сообщения с максимальной скоростью телеграфирования

по телеграфной линии связи без помех, имеющей коэффициент передачи вида: = 1 при | f | >> F Н. Рис. 27. а соответствует идеальному телеграфному сигналу s вх(t) с прямоугольной амплитудно-частотной характеристикой и с физически не реализуемой формой s вх(t) = A sinc (2 π F Н t).

На рис. 27. б и 27. в представлены соответственно действительные и мнимые части спектра сигнала, имеющего нулевые переходы в точках: tk = k /(2 F Н), где k = 0, ± 1, ± 2, … На рис. 27. г – действительная часть спектра суммарного сигнала s вх(t), который может быть передан по рассматриваемой телеграфной линии с максимальной скоростью телеграфирования v т = 2 F Н. Покажем, что добавочный сигнал s +(t), который имеет «кососимметричную» реальную и симметричную относительно точки f = F Н мнимую части спектра , изображённые на рис. 27. б, не будет вносить линейных искажений в значения сигнала s вх(t) = A sinc (2 π F Н t) в точках tm = m /(2 F Н) = m э.

Действительно. Выделим в спектре сигнала s +(t) элементарные полосы частот шириной Δ f около частот f + n = F Н + n Δ f и f n = F Нn Δ f ; n ≠ 0.

Получим элементарные колебания:

По построению (см. рис. 27. б) имеем:

,

Значит, sn (t) = s + n (t) + s n (t) =

Если просуммировать все элементарные составляющие добавочного сигнала s +(t), то получим:

или то есть добавочный сиг-

1

0,5

       
 
   
 


0 F Н f 0 F Н f

а)

 
 


0,5

       
   
 
 


Δ f n Δ f n Δ f

0 F Н f 0 F Н f

б )

1

 
 


0,5

       
   
 


0 F Н f 0 F Н f

в)

Рис. 27. Синтез оптимального телеграфного сигнала по Найквисту

сигнал s +(t) представляет собой некоторый амплитудно-модулированный сигнал без несущей и с огибающей и высокочастотным заполнением cos (2 π F Н t).

Огибающую сигнала можно выбрать так, чтобы она не имела нулевых переходов вообще. Тогда временнóе положение tl+ нулевых переходов добавочного сигнала s +(t) будет определяться равенством:

cos (2 π F Н tl+) = 0, или 2 π F Н tl+ = (l – 1/2) π, или tl+ = τэ (l – 1/2).

Если во входном элементарном сигнале s вх(t) = A sinc tэ) ввести задержку на величину t з = τэ /2, то во всех характерных (отсчётных) точках tm = τэ (m + 1/2) сигнала s 0(t) = s вх(t – τэ /2) = A sinc [2 π FН(t – τэ /2)] величина cos (2 π FН tm) = cos [2 π FН τэ (m + 1/2)] = cos (m + 1/2)] = sin (m π) равна нулю. Значит, построенный нами добавочный сигнал s +(t) в мгновенные значения идеального телеграфного сигнала s 0(t) в середине каждого из элементарных временных интервалов длительностью τэ линейных искажений вносить не будет, но зато может «погасить» колебания идеального сигнала s 0(t) при t 0 и сделать его физически реализуемым.

Всё это справедливо для многоуровневой телеграфии, в которой (в подавляющем большинстве случаев) соседние посылки не имеют одинаковых амплитудных множителей ah. В двухуровневой однополярной телеграфии (в обычном телеграфе) это может случаться очень часто. Поэтому в обычном телеграфе следует на интервале длительностью τэ передавать одну из двух элементарных посылок с амплитудами ah = + A либо – A и длительностью τ h = τэ /2. Спектр таких посылок будет равным S (ω) = ± A sinc τэ /4). В пределах полосы пропускания телеграфной линии связи [0, F Н = 1/(2 τэ)] будет располагаться лишь часть энергии элементарной посылки. Чтобы наиболее полно использовать линию связи (то есть максимизировать отношение сигнал/помеха на выходе телеграфного канала), следует скорректировать характеристику АЧХ посылки, сделав её прямоугольной в полосе частот [0, F Н = 1/(2 τэ)]. А чтобы коэффициент передачи телеграфной линии был физически реализуемым, нужно к нему добавить соответствующий «кососимметричный» член.

Такие характеристики телеграфной линии связи могут быть реализованы с помощью хорошо разработанных методов синтеза электрических цепей с минимально-фазовыми коэффициентами передачи. Обычно в качестве физически реализуемого коэффициента передачи такой линии электросвязи используют

функцию «приподнятого косинуса» с коэффициентом скругления α = 0,3 [35]:

при ;

при ;

0 при .

В Прил. II к статье [54] Найквист приводит простой пример реализации телеграфной системы, которая может передавать сообщения со скоростью v т = = 2 F Нбез межсимвольных искажений (см. рис. 28. а). При поступлении прямоугольных посылок на вход такой системы на её выходе получаются сигналы (рис. 28. б ), представляющие собой затухающие колебания с эквидистантным расположением своих нулевых переходов (как у функции отсчётов!), что и обеспечивает неискажённую передачу сообщений с предельно возможной скоростью.

Далее Найквист получает аналогичные результаты для многоканального телеграфа с частотным разделением каналов, рассматривает телеграфию с произвольной формой элементарных посылок и эквивалентность (дуальность) временнóго анализа и частотного. Тем самым он полностью решает вопрос о значении коэффициента К в формуле W = K log т:величина К не может превосходить величину 2 F Н,но может быть достаточно близкой к ней.

Наконец – он возвращается к оценке возможного числа уровней т,используемых для многоуровневой телеграфии. Найквист приходит к выводу, что число т ограничивается двумя факторами: максимально возможными (в данной телеграфной системе) уровнями токов или напряжений и уровнями электрических помех. Найквист заключает [54]: «Если помеха непредсказуема, её абсолютная величина должна быть меньше, чем половина разности между любыми двумя уровнями тока, используемыми для телеграфирования [курсив наш – Г. Х.]».

Рис. 28. Реализация (Найквиста) телеграфной системы,

имеющей наибольшую скорость телеграфирования

Отсюда непосредственно следует формула (Найквист почему-то её не приводит): W = 2 F Нlog (I мaкc / I п+ 1), где W – скорость передачи сообщений (мы бы сказали: информации); F Н– частота среза частотной характеристики телеграфного канала; I мaкc – максимально допустимый ток в телеграфной линии; I п – максимальный уровень помех в этой линии.

Как видим, роль Г. Найквиста в разработке прикладной теории информации аналогична роли М. Фарадея в разработке электродинамики: К. Шеннону «оставалось только обобщить»результаты Найквиста и провести их строгое математическое обоснование. Хотя содержание статьи Найквиста [54] 1928 г. не имеет прямого отношения к теореме отсчётов, результаты этой статьи являются выдающимися, что по достоинству было оценено лишь в конце 1980-х гг.

Таким образом, фундаментальные результаты Г. Найквиста по оцениванию предельно достижимой скорости телеграфирования могут быть практически реализованы, по крайней мере, в двух простейших вариантах.

Если мы передаём аналоговый сигнал с финитным спектром, ограниченным верхней частотой Fm, то (без учёта электрических помех в линии связи) для его передачи можно использовать аналоговый канал с «кососимметричным» коэффициентом передачи и с частотой среза (Найквиста) F Н = Fm. При этом на входе канала передачи «непрерывных сообщений» передаваемый сигнал превращается в ступенчатый сигнал с длительностью «элементарных ступенек» τэ = 1/(2 Fm) и значениями амплитуды этих «ступенек», равными мгновенным значениям передаваемого сигнала в середине каждой «ступеньки».

На выходе канала связи мгновенные значения выходного сигнала в середине соответствующих интервалов времени длительностью τэ будут пропорциональны соответствующим им мгновенным значениям переданного сигнала. Зная этот коэффициент пропорциональности (например, измеряя его текущее значение по эталонной – единичной – посылке), можно восстановить все дискретные отсчёты переданного сигнала и в соответствии с теоремой Котельникова-Шеннона полностью восстановить переданное сообщение.

Если мы хотим передавать некоторое бинарно-закодированное сообщение с помощью обычного телеграфа со скоростью v т, то следует организовать синхронизированную линию электросвязи такого телеграфа с тактовой частотой синхронизации v т = 2 F Н и с коэффициентом передачи типа «приподнятого косинуса» с частотой среза F Н. Сообщения следует передавать бинарными посылками длительностью τ э = 1/(4 F Н), а на приёмном конце телеграфа реализовать синхронную обработку согласно методу Найквиста.

В статьях 1940 и 1948 гг. ([46], с. 433-460 и 243-332) Клод Шеннон завершил создание основ прикладной теории информации, продолжив развитие идей своих старших коллег по БТЛ Г. Найквиста и Р. Хартли. Он впервые ввёл в рассмотрение меру количества информации для неравновероятных сообщений

(энтропию источника ДИС), а также количественную меру для степени потери информации в каналах КПДС при наличии в последних различного рода помех (пятый постулат ПТИ – см. разд. 7).

В разд. 9 мы провели оценивание информационной ёмкости ℰ каналов передачи дискретных сообщений (КПДС), то есть рассмотрели информационную эффективность передачи сообщений по различным каналам КПДС в статическом режиме его работы. Проведённые в разд. 16 рассуждения позволяют достаточно просто обобщить результаты разд. 9 на динамические каналы КПДС, работающие в режиме реального времени в присутствии помех.

Итак, дискретные сообщения из ансамбля с помощью квантованных уровней электрического напряжения на входе линии связи мы можем (в отсутствие в канале КПДС помех) без линейных искажений передавать с «физической скоростью» v т = 1/(2 F Н), где F Н – частота среза линии электросвязи (Найквиста). В этом случае скорость передачи информации v и (при полностью снятой избыточности источника дискретных сообщений) будет определяться выражением: v и = log N /(2 F Н).

Как же повлияют помехи в канале КПДС на величину скорости v и, если «физическую скорость передачи» мы увеличить не можем, поскольку она определяется частотой Найквиста F Н?

Пусть в полосе пропускания канала электросвязи присутствует аддитивный белый гауссовский шум (АБГШ) со средней спектральной плотностью мощности N 0 и пусть модуль коэффициента передачи канала имеет вид:

при | ω | ≤ 2 π F Н и при | ω | > 2 π F Н.

Тогда на выходе канала электросвязи корреляционная функция R Н(τ) шума АБГШ ξН(t) есть:

R Н(τ) = .

Значит, при τ n = n τэ корреляционная функция R Нn) = 0.

Если же мы к прямоугольному коэффициенту передачи добавим «кососимметричный» член, то получим результирующий коэффицеинт передачи канала связи:

Отсюда:

или

Таким образом, получаем:

В силу зеркальной симметрии функции и чётности функции cos (2 π f τ) получаем:

.

Корреляционная функция «добавочного» шума R +(τ), в силу чётности функции , есть:

где – огибающая функции , а F Н – частота её высокочастотного заполнения.

Значит, стационарные гауссовские шумы на выходе канала электросвязи с коэффициентом передачи имеют в качестве корреляционной функции

R Σ(τ) функцию: R Σ(τ) = R Н(τ) + K 02 cos (2 π F Н τ).

Корреляционная функция имеет нулевые переходы в точках τ n, удовлетворяющих уравнению: 2 F Н τ n = n /2. При F Н = 1/(2 T э) получаем: τ n = n τэ /2.

Значит, корреляционная функция R Σ(τ) шумов ξΣ(t) на выходе канала электросвязи с коэффициентом передачи имеет нулевые значения в точках τ n = n τэ /2, то есть мгновенные значения реализаций шума ξΣ(t) в точках t = t 1 и t = t 2 при t 2t 1 = τэ не коррелированы, а в силу их гауссовости – независимы.

Мы доказали, что

в динамическом многоуровневом канале передачи дискретных сообщений, имеющем линию электросвязи с шириной полосы пропускания Δ F = 2 F Н (по уровню половины модуля коэффициента передачи линии), количества передаваемой по каналу КПДС информации, которое соответствуют дискретным отсчётам, отстоящим друг от друга на интервалы n τэ = n /(2 F Н), суммируются.

В разд. 9 мы рассмотрели информационную ёмкость ℰ(Q) статических каналов КПДС и вывели её асимптотическую оценку – формулу Клода Шеннона: ℰШ(Q) = log .

Поскольку в динамическом канале КПДС в единицу времени мы можем передавать 1/ T э = 2 F Н отсчётов, то при стационарном режиме работы динамического канала КПДС мы можем передавать сообщения с информационной скоростью C Ш(Q) = 2 F Н Ш(Q) = F Н log (1 + Q).

Таким образом, мы связали информационную статику с информационной динамикой, теорему Котельникова-Шеннона с интервалом и частотой Найквиста и доказали центральную теорему прикладной теории информации:

информационная скорость передачи дискретных сообщений (по обычным каналам электросвязи) при наличии в них аддитивных белых гауссовских шумов ограничена сверху пределом C Ш(Q) = F Н log (1 + Q), где F Нчастота среза (Найквиста) линии электросвязи, рассматриваемой как фильтр нижних частот (Гц), Qотношение сигнал / шум (по мощности), C Ш(Q) – информационная пропускная способность аналогового канала передачи дискретных сообщений (бит / с).

Формулу C Ш(Q) = F Н log назовём формулой Шеннона информационной динамики.

Перейдём к рассмотрению так называемых «непрерывных сообщений» и «оптимальных каналов» передачи таких сообщений.

Вопросы для самопроверки

1. Какова простейшая математическая модель динамического источника дискретных сообщений?

2. Что такое производительность динамического источника дискретных сообщений?

3. Какова максимальная производительность бинарного динамического источника дискретных сообщений?

4. Каким образом передаётся дискретная информация в динамической системе передачи информации в отсутствие помех?

5. Как формулируется основная теорема Шеннона информационной динамики для дискретного канала без помех?

6. Как формулируется основная теорема Шеннона информационной динамики для дискретного канала при наличии в канале помех?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: