Одномерный линейный фильтр Калмана-Бьюси

  Пусть некая одномерная система с дискретным временем на k -ом шаге характеризуется «состоянием» x (k) и эволюционирует по закону

;                             (3.4)

a – известный параметр. Соотношение (10.4) называют уравнением динамики системы. Пусть на каждом шаге имеются измерения

                                 (3.5)

с известным параметром h. Соотношение (3.5) называют уравнением измерений. Требуется найти в рекуррентной форме последовательность оценок состояния .

  Предположим, что оценка для k -го шага уже найдена, при этом известна ее дисперсия . Тогда для нахождения  и ее дисперсии   имеем следующую систему уравнений:

Выровняем эти соотношения так, чтобы дисперсии погрешностей в них стали одинаковыми:

и найдем  с помощью метода наименьших квадратов:

                         (3.6)

Приравняем нулю производную    

.

Отсюда

                      (3.7)

или

.       (3.8)

Остается только найти закон изменения дисперсии  Это легче всего сделать на основе предпоследнего соотношения (3.7):

              (3.9)

Это соотношение называют уравнением Рикатти. График изменения дисперсии называют обучающей кривой.

     Действительный интерес представляют схемы, в которых параметры сами меняются от шага к шагу.

  Если а =1 и  то есть на каждом шаге оценивается постоянный параметр x, получаем рекуррентную схему вычисления коэффициента наклона x в линейной модели

y (k) = x . h (k)+ η(k).

  Основной смысл рассмотренной конструкции состоит в том, что она на каждом шаге комплексирует данные, поступающие из двух источников, выдавая оценку, усредненную в соответствии с текущими характеристиками точности этих источников.

  3.3. m - мерный линейный фильтр Калмана

     Рассмотрим вероятностную динамическую систему, описываемую линейными разностными уравнениями состояний и наблюдений. Уравнение состояний

           x (n+ 1) = F(n+ 1 ,n) .x (n) + G(n+ 1 ,n) .w (n+ 1)                             (3.10)

характеризует динамику системы, уравнение наблюдений

                          y (n) = H (n) .x (n) + v (n)                                                (3.11)

определяет механизм образования данных, получаемых в процессе измерений.

  В уравнениях (3.10) и (3.11)

· x (n) – m -мерный вектор состояния системы;

· F(n+1,n) – ее переходная матрица размерности m ´ m;

· w (n) – случайный k -мерный вектор гауссовых шумов (возмущений) системы с нулевым средним и ковариационной матрицей M[ w (n) wT (j)]= Q (n). d (j,n);

· G (n +1, n) – переходная матрица возмущений системы размерности m ´ k;

· y (n) – s –мерный вектор результатов измерений на n -м шаге;

· H (n) – переходная матрица наблюдений размерности s ´ m;

· v (n) – случайный s -мерный вектор гауссовых шумов измерений с нулевым средним и ковариационной матрицей M[ v (n) vT (j)]= R (n). d (j,n);

· d (j,n) – символ Кронекера.

   В этих условиях оптимальная текущая оценка описывается следующими рекуррентными соотношениями:

(3.12)

Матрица Q(n), скорее даже более общая конструкция G(n) Q (n)G T (n), определяет степень неопределенности для уравнения состояний.

  При прогнозировании на k шагов вперед используется уравнение состояний (3.10) с переходной матрицей

Наилучшие ситуации здесь возникают, когда матрица F с самого начала задана в виде F(t, t+t).

  Ковариационная матрица погрешностей прогноза вычисляется по формуле

  Замечание. Если положить в (3.10)   F(n+ 1 ,n)= I, G(n+ 1 ,n)=0, то соотношения (3.12) примут вид

  (рекуррентный МНК). В качестве начального приближения  берется произвольный вектор размерности < r ×1> и, например, матрица uI размерности < r × r > с достаточно большим множителем u.

Варианты определения исходных параметров

   Если используется гипотеза о равномерном прямолинейном движении объекта, то его состояние описывается 4-мерным вектором x (t) = [ x, y, vx, vy ] T, а переходная матрица имеет вид

.

Отсюда получается основное соотношение

x (t +t) = F(t) x (t),

или, в координатах,

x (t +t) = x (t) +t vx, y (t +t) = y (t) +t vy, vx (t +t) = vx (t), vy (t +t) = vy (t).

Переходная матрица возмущений системы G в простейших случаях оказывается единичной, а ковариационную матрицу Q следует выбирать достаточно большой, например,

Эти матрицы описывают степень нашей неуверенности в правильности предположения о равномерности и прямолинейности движения. Большое значение Q обеспечивает возможность следить за маневрирующими объектами. Более сложные конструкции Г появляются, если нужно описать коррелированные возмущения.

  Если используются прямые измерения, то переходная матрица наблюдений Н оказывается единичной. Если бы на вход системы подавалась информация, например, в виде пеленгов и дальностей, это нашло бы отражение в конструкции матрицы Н.

   Более общий вариант возникает, когда динамика системы задана в виде системы дифференциальных уравнений, например,

Решение этой системы с помощью матричной экспоненты на равномерной сетке с шагом τ приводит к соотношениям

Возможны более сложные варианты, когда динамика задана неоднородной системой или системой стохастических дифференциальных уравнений. В этом случае решение системы с помощью матричной экспоненты сразу включает адекватное представление второго слагаемого в (3.10).

    Пример. Типичную ситуацию можно представить себе следующим образом. Базовое представление траектории спутника – эллипс. Этим и диктуется задание уравнения динамики. В действительности над, например, месторождением тяжелых металлов спутник летит на несколько десятков метров ниже, над соляным куполом (под такими куполами часто скапливается нефть) - на несколько десятков метров выше. Текущие измерения высоты осуществляются с ошибкой, характеристики которой зависят от условий наблюдаемости. Фильтр комплексирует предполагаемую динамику с текущими измерениями, выдавая на каждом шаге оценку, усредненную в соответствии с заданными характеристиками точности, определяемыми матрицами Q и R.  

Контрольные вопросы

  1. Связь между вычислением среднего и экспоненциальным сглаживанием
  2. Понятия коэффициента передачи и обновляющего процесса
  3. Понятия вектора состояний и переходных матриц
  4. Понятия переходных матриц возмущений и наблюдений
  5. Уравнение Рикатти и обучающие кривые
  6. Простейшие варианты задания переходных матриц
  7. Получение переходных матрицы из мультипликативной процедуры решения систем дифференциальных уравнений

Задания на лабораторную работу № 3

1. Сформировать временной ряд измерений среднего

2. Запрограммировать процесс рекуррентного оценивания среднего

3. Вывести графики временных рядов измерений и оценок и обучающую кривую

4. Сформировать временной ряд измерений коэффициента наклона

5. Запрограммировать процесс рекуррентного оценивания коэффициента наклона

6. Вывести графики временных рядов измерений и оценок и обучающую кривую


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow