Одномерный линейный фильтр Калмана-Бьюси

Пусть некая одномерная система с дискретным временем на k -ом шаге характеризуется «состоянием» x (k) и эволюционирует по закону

; (3.4)

a – известный параметр. Соотношение (10.4) называют уравнением динамики системы. Пусть на каждом шаге имеются измерения

(3.5)

с известным параметром h. Соотношение (3.5) называют уравнением измерений. Требуется найти в рекуррентной форме последовательность оценок состояния .

Предположим, что оценка для k -го шага уже найдена, при этом известна ее дисперсия . Тогда для нахождения и ее дисперсии имеем следующую систему уравнений:

Выровняем эти соотношения так, чтобы дисперсии погрешностей в них стали одинаковыми:

и найдем с помощью метода наименьших квадратов:

(3.6)

Приравняем нулю производную

Отсюда

(3.7)

или

. (3.8)

Остается только найти закон изменения дисперсии Это легче всего сделать на основе предпоследнего соотношения (3.7):

(3.9)

Это соотношение называют уравнением Рикатти. График изменения дисперсии называют обучающей кривой.

Действительный интерес представляют схемы, в которых параметры сами меняются от шага к шагу.

Если а =1 и то есть на каждом шаге оценивается постоянный параметр x, получаем рекуррентную схему вычисления коэффициента наклона x в линейной модели

y (k) = x ^.h (k)+ η(k).

Основной смысл рассмотренной конструкции состоит в том, что она на каждом шаге комплексирует данные, поступающие из двух источников, выдавая оценку, усредненную в соответствии с текущими характеристиками точности этих источников.

3.3. m - мерный линейный фильтр Калмана

Рассмотрим вероятностную динамическую систему, описываемую линейными разностными уравнениями состояний и наблюдений. Уравнение состояний

x (n+ 1) = F(n+ 1 ,n) ^.x (n) + G(n+ 1 ,n) ^.w (n+ 1) (3.10)

характеризует динамику системы, уравнение наблюдений

y (n) = H (n) ^.x (n) + v (n) (3.11)

определяет механизм образования данных, получаемых в процессе измерений.

В уравнениях (3.10) и (3.11)

· x (n) – m -мерный вектор состояния системы;

· F(n+1,n) – ее переходная матрица размерности m ´ m;

· w (n) – случайный k -мерный вектор гауссовых шумов (возмущений) системы с нулевым средним и ковариационной матрицей M[ w (n) w^T (j)]= Q (n)^. d (j,n);

· G (n +1, n) – переходная матрица возмущений системы размерности m ´ k;

· y (n) – s –мерный вектор результатов измерений на n -м шаге;

· H (n) – переходная матрица наблюдений размерности s ´ m;

· v (n) – случайный s -мерный вектор гауссовых шумов измерений с нулевым средним и ковариационной матрицей M[ v (n) v^T (j)]= R (n)^. d (j,n);

· d (j,n) – символ Кронекера.

В этих условиях оптимальная текущая оценка описывается следующими рекуррентными соотношениями:

(3.12)

Матрица Q(n), скорее даже более общая конструкция G(n) Q (n)G ^T (n), определяет степень неопределенности для уравнения состояний.

При прогнозировании на k шагов вперед используется уравнение состояний (3.10) с переходной матрицей

Наилучшие ситуации здесь возникают, когда матрица F с самого начала задана в виде F(t, t+t).

Ковариационная матрица погрешностей прогноза вычисляется по формуле

Замечание. Если положить в (3.10) F(n+ 1 ,n)= I, G(n+ 1 ,n)=0, то соотношения (3.12) примут вид

(рекуррентный МНК). В качестве начального приближения берется произвольный вектор размерности < r ×1> и, например, матрица uI размерности < r × r > с достаточно большим множителем u.

Варианты определения исходных параметров

Если используется гипотеза о равномерном прямолинейном движении объекта, то его состояние описывается 4-мерным вектором x (t) = [ x, y, vx, vy ] ^T, а переходная матрица имеет вид

Отсюда получается основное соотношение

x (t +t) = F(t) x (t),

или, в координатах,

x (t +t) = x (t) +t vx, y (t +t) = y (t) +t vy, vx (t +t) = vx (t), vy (t +t) = vy (t).

Переходная матрица возмущений системы G в простейших случаях оказывается единичной, а ковариационную матрицу Q следует выбирать достаточно большой, например,

Эти матрицы описывают степень нашей неуверенности в правильности предположения о равномерности и прямолинейности движения. Большое значение Q обеспечивает возможность следить за маневрирующими объектами. Более сложные конструкции Г появляются, если нужно описать коррелированные возмущения.

Если используются прямые измерения, то переходная матрица наблюдений Н оказывается единичной. Если бы на вход системы подавалась информация, например, в виде пеленгов и дальностей, это нашло бы отражение в конструкции матрицы Н.

Более общий вариант возникает, когда динамика системы задана в виде системы дифференциальных уравнений, например,

Решение этой системы с помощью матричной экспоненты на равномерной сетке с шагом τ приводит к соотношениям

Возможны более сложные варианты, когда динамика задана неоднородной системой или системой стохастических дифференциальных уравнений. В этом случае решение системы с помощью матричной экспоненты сразу включает адекватное представление второго слагаемого в (3.10).

Пример. Типичную ситуацию можно представить себе следующим образом. Базовое представление траектории спутника – эллипс. Этим и диктуется задание уравнения динамики. В действительности над, например, месторождением тяжелых металлов спутник летит на несколько десятков метров ниже, над соляным куполом (под такими куполами часто скапливается нефть) - на несколько десятков метров выше. Текущие измерения высоты осуществляются с ошибкой, характеристики которой зависят от условий наблюдаемости. Фильтр комплексирует предполагаемую динамику с текущими измерениями, выдавая на каждом шаге оценку, усредненную в соответствии с заданными характеристиками точности, определяемыми матрицами Q и R.

Контрольные вопросы

Связь между вычислением среднего и экспоненциальным сглаживанием
Понятия коэффициента передачи и обновляющего процесса
Понятия вектора состояний и переходных матриц
Понятия переходных матриц возмущений и наблюдений
Уравнение Рикатти и обучающие кривые
Простейшие варианты задания переходных матриц
Получение переходных матрицы из мультипликативной процедуры решения систем дифференциальных уравнений

Задания на лабораторную работу № 3

1. Сформировать временной ряд измерений среднего

2. Запрограммировать процесс рекуррентного оценивания среднего

3. Вывести графики временных рядов измерений и оценок и обучающую кривую

4. Сформировать временной ряд измерений коэффициента наклона

5. Запрограммировать процесс рекуррентного оценивания коэффициента наклона

6. Вывести графики временных рядов измерений и оценок и обучающую кривую