КТ, ориентированные на автоматизированную поддержку МБИ, имеющих целью получение экспериментальных математических моделей биологических объектов (БО) или процессов (БП)

Постановка задачи опирается на следующие предположения:

Полагаем, что состояние объекта формируется под влиянием некоторой совокупности входных воздействий x_i (i=1, …, n), называемых в дальнейшем входными переменными модели. Реакция объекта на произведенное воздействие оценивается путем измерения в ходе исследований скалярной характеристики y, называемой в дальнейшем выходной переменной модели.

Совокупность входных переменных модели в дальнейшем будем представлять в виде вектора входных переменных, компонентами которого являются входные воздействия: X = (x₁, x₂, …, x_n)^Т.

Целью является получение аналитической зависимости, описывающей связь между входными x_i, и выходной у переменными модели на основе выражения вида

y = a₁f₁(x) + a₂f₂(x) + … + a_kf_k(x)

В этом выражении а₁, а₂, …, а_k – неизвестные параметры модели, оценки которых должны быть получены на основе обработки результатов проведенных МБИ; f₁(x), f₂(x), …, f_k(x) – скалярные функции, предполагаемые заданными.

Таким образом, доступные для использования практически реализуемые методы построения экспериментальных моделей по своей сути являются методами параметрического синтеза моделей. Эти методы предполагают, что структура модели задана и известна нам с точностью до некоторой совокупности неизвестных параметров.

Методы параметрического синтеза позволяют подобрать оценки этих неизвестных параметров наилучшим (оптимальным) образом так, чтобы предлагаемая модель с максимальной точностью описывала результаты проведенных МБИ. К сожалению, методов структурного синтеза моделей, позволяющих выбрать наилучшую в смысле точности структуру модели, не существует.

Введем некоторые векторные обозначения, которые будем использовать в дальнейшем.

– вектор размера (k × 1), компонентами которого являются неизвестные параметры моделей.

– вектор функции размера (k × 1), компоненты которого предполагаются заданными.

Тогда, с учетом введенными обозначений, искомая модель может быть описана векторным выражением вида.

y = a^T × f(x)

С целью получения оценок параметров модели а₁, а₂, …, а_k проводится серия из N экспериментов, в ходе которых на вход объекта подаются точно известные входные воздействия x^j, где j = 1, …, N – номер эксперимента, и измеряются значения y_j (j = 1, …, N), выражающие реакции объекта на эти воздействия.

Результаты проведенных экспериментов с помощью предлагаемой модели могут быть описаны следующим образом:

y₁ = a^Tf(x¹) + ε₁ = a₁f₁(x¹) + a₂f₂(x¹) +…+ a_kf_k(x¹) + ε₁

y₂ = a^Tf(x²) + ε₂ = a₁f₁(x²) + a₂f₂(x²) +…+ a_kf_k(x²) + ε₂

………………………………………………………………

y_N = a^Tf(x^N) + ε_N = a₁f₁(x^N) + a₂f₂(x^N) +…+ a_kf_k(x^N) + ε_N

Введем некоторые векторные и матричные обозначения с целью более компактного описания результатов проведенных экспериментов.

F - матрица размера (N × k), где N – количество проведенных экспериментов, а k – количество неизвестных параметров модели.

Строки этой матрицы представляют собой значения функций, присутствующих в модели, рассчитанные для того набора входных переменных, который использовался в конкретном эксперименте.

Кроме того, введем векторa

размера (N×1), компонентами которого являются измеренные в ходе экспериментов значения выходной переменной;

размера (N×1), компонентами которого являются случайные ошибки измерения выходной переменной в ходе экспериментов.

Используя введенные векторные и матричные обозначения, результаты проведенных экспериментов в компактном виде можно представить следующим образом:

Y = F ∙ a + ε

Тот факт, что в приведенном выражении присутствует случайный вектор ε, указывает на необходимость использования статистических методов для получения оценок неизвестных параметров модели. Наиболее распространенным из таких методов является метод наименьших квадратов (МНК).

Широкое использование МНК обусловлено тем, что реализация этого метода опирается на очень слабые предположения о статистических свойствах ошибок измерений, которые практически всегда выполняются в условиях реального исследования. Эти предположения сводятся к трем утверждениям:

1) Отсутствует систематическая составляющая ошибок измерения. Фактически это означает, что математическое ожидание ошибок измерений равно нулю:

М [ε_j] = 0 для ∀ j = 1,…,N

2) Ошибки ε_i, ε_j, с которыми проводится измерение выходной переменной, в разных экспериментах не коррелированы или статистически независимы:

М [ε_i ∙ ε_j] = 0 для ∀ i ≠ j

3) Измерения значений выходной переменной являются равноточными, т.е. дисперсия ошибок измерений во всех экспериментах одинакова:

для ∀ j = 1,…,N

МНК обеспечивает получение оптимальных, т.е. наилучших в смысле точности, параметров модели. В качестве критерия оптимальности оценок параметров модели в МНК используется скалярный критерий следующего вида:

Эта запись предполагает отыскания таких оптимальных оценок параметров модели, при которых достигается минимум суммы (по всем экспериментам) квадратов рассогласований между фактическими значениями выходной переменной (Y) и её значениями, рассчитанными с помощью модели (F∙a).

Доказано, что оптимальным в смысле приведенного критерия является вектор оценок параметров модели, который рассчитывается на основе выражения:

â = С∙F^TY

C – дисперсионная матрица: С = (F^T∙F)^-1 – квадратная симметричная (по способу определения) матрица размера (k×k)

Анализ точности полученной модели

Анализ точности экспериментальной модели можно проводить с разных позиций.

I. В первом случае точность полученной экспериментальной модели определяется точностью полученных оценок параметров модели. Действительно, поскольку мы предполагаем, что структура модели задана, её точность будет зависеть только от того, насколько полученные оценки параметров модели отличаются от неизвестных нам истинных значений этих параметров.

Проблема заключается в том, что вектор оценок â, рассчитанный на основе приведенного выше выражения, является случайным вектором, поскольку в его вычислении участвуют вектор Y измеренных значений выходной переменной, компоненты которого искажены присутствием случайных погрешностей.

Характеристикой точности любого случайного вектора является ковариационная матрица. Эта матрица имеет следующую структуру: её диагональные элементы представляют собой дисперсии компонент случайного вектора. Внедиагональные элементы ковариационной матрицы представляют собой корреляционные моменты, характеризующие степень статистической связи между различными компонентами случайного вектора. Именно дисперсии, расположенные на диагонали ковариационной матрицы, являются характеристиками точности компонент случайного вектора.

Применительно к рассматриваемой задаче дисперсии, расположенные на диагонали ковариационной матрицы, характеризуют то, насколько полученные оценки параметров модели отличаются от истинных значений. Чем больше эти дисперсии, тем более грубой является модель; чем меньше эти дисперсии, тем точнее модель.

Таким образом, необходимо получить ковариационную матрицу К_â вектора оценок и проанализировать её диагональные элементы.

По определению ковариационная матрица есть ничто иное как математическое ожидание произведения центрированного случайного вектора на результат транспонирования этого центрированного случайного вектора.

К_â = М[(â-m_â)(â-m_â)^T]

â = С∙F^T∙Y

m_â =M[â]= M[С∙F^T∙Y] = С∙F^T∙M[Y] = C∙F^T∙m_Y

â – m_â = C∙ F^T∙Y - C∙F^T∙m_Y = C∙F^T(Y – m_Y) = CF^Tε

(â – m_â)^Т = ε^T∙F∙C^T = ε^T∙F∙C (в силу симметрии дисперсионной матрицы)

С учетом полученных результатов выражение ковариационной матрицы К_â принимает вид

К_â = M[C∙F^T∙ε∙ε^T∙F∙C]=C∙F^TM[ε∙ε^T] ∙F∙C = C∙F^TК_ε∙F∙C

Где К_ε – ковариационная матрица вектора ошибок измерений ε.

Учитывая ранее сформулированные предположения о статистических свойствах ошибок измерений, приходим к следующей структуре ковариационной матрицы К_ε:

где – единичная матрица размера (N×N)

С учетом полученного выражения для ковариационной матрицы К_ε приходим к следующему выражению для ковариационной матрицы К_â:

К_â = C ∙ F^T∙ E_N_×_N ∙ F ∙ C ∙ σ² = C ∙ F^T∙ F ∙ C ∙ σ² = (F^TF)^-1 ∙ F^TF ∙ C ∙ σ² = C ∙ σ²

Из этого выражения можно получить выражения для дисперсий (i = 1,…, k), характеризующих точности отдельных оценок параметров моделей. Как указывалось ранее, эти дисперсии представляют собой диагональные элементы ковариационной матрицы К_â.

Иными словами, приходим вот к такому выражению:

где С_ii – диагональные элементы дисперсионной матрицы С.

II. Другой подход использует в качестве характеристики точности модели дисперсию σ_Y² оценки значений выходной переменной с помощью модели – чем больше эта дисперсия, тем больше рассчитанное с помощью модели значение выходной переменной отличается от его истинного значения, тем более грубой является модель.

Оценим значение этой дисперсии.

σ_Y² = М[(Y-m_Y)²]

Это выражение можно записать иначе

σ_Y² = М[(Y-m_Y)^T(Y-m_Y)]

Y = â^T ∙ f(x)

m_Y = M[Y] = M[â^T ∙ f(x)] = M[â^T] ∙ f(x) = m_â^T ∙ f(x)

Y - m_Y = (â - m_â)^T ∙ f(x)

(Y - m_Y)^T = f^T(x) ∙ (â - m_â)

Тогда выражение для дисперсии σ_Y² примет вид

σ_Y² = М[f^T(x) ∙ (â-m_â) ∙ (â - m_â)^T ∙ f(x)] = f^T(x) ∙ М[(â-m_â) ∙ (â - m_â)^T] ∙ f(x)

Поскольку М[(â-m_â) ∙ (â - m_â)^T] = К_â = C ∙ σ², окончательное выражение для σ_Y²:

σ_Y² = f^T(x) ∙ C ∙ f(x) ∙ σ²

В том случае, если ошибки измерений в дополнение к тем свойствам, которые были упомянуты выше, представляют собой нормально-распределенные случайные величины, можно получить более совершенные характеристики для оценки точности модели. В этом случае могут быть рассчитаны доверительные интервалы, к которым с заданной вероятностью, близкой к единице, принадлежат неизвестные нам истинные значения параметров модели. Но такая возможность существует только в том случае, если ошибки являются гауссовскими случайными величинами.

Для получения доверительных интервалов, к которым с заданной вероятностью, близкой к единице, принадлежат неизвестные нам истинные значения коэффициентов модели, используются скалярные величины вида

В этом выражении а_i – истинное значение параметра модели;

â_i – оценка этого параметра, полученная с помощью МНК на основе приведенного ранее выражения.

S_â_i - выборочная оценка среднеквадратичного отклонения (СКО), соответствующая оценки параметра модели.

Ранее было получено выражение для дисперсии , характеризующей точность оценки â_i:

где С_ii – соответствующий диагональный элемент дисперсионной матрицы С;

σ² – дисперсия ошибок измерения.

Опираясь на это выражение, выборочную оценку дисперсии можно записать так:

где S² – выборочная оценка дисперсии ошибок измерения выходной переменной. Эта выборочная оценка рассчитывается на основе выражения:

Это выражение и есть выборочная оценка дисперсий.

Тогда выборочная оценка СКО S_â_i может быть получена на основе выражения:

Оказывается, что определенная таким образом случайная величина T_i в ситуации, когда ошибки измерений подчиняются нормальному закону, имеет теоретическое t-распределение (распределение Стьюдента) с числом степеней свободы, равном N-k, где N – число проведенных экспериментов, k – число неизвестных параметров модели.

Распределение Стьюдента относится к классу теоретических распределений, связанных с нормальным. Для него в таблицах математической статистики приведены значения квантилей T_α, соответствующих доверительным вероятностям α = 0.95, 0.99, 0.999.

Квантилью T_α называется значение, которое гарантировано (с вероятностью α) не будет превышено случайной величиной T_i. Иными словами, вероятность события, состоящего в том, что случайная величина T_i не превысит значение T_α равна α:

P {T_i ≤ T_α} = α

Допустим, что T_α – значение квантили, соответствующее доверительной вероятности α = 0,95. Тогда с вероятностью 0,95 должно выполняться неравенство

Отсюда находим границы доверительного интервала, к которому с вероятностью 0,95 принадлежат неизвестные нам истинные значения коэффициента a_i:

â_i – T_α∙S_â_i ≤ a_i ≤ â_i + T_α∙S_â_i

Завершающим этапом построения модели является проверка её адекватности

Оценка адекватности полученной экспериментальной модели

Мы рассмотрели сценарий проведения МБИ, предполагая, что в ходе экспериментов объект подвергался организованным воздействиям x^j (j=1,…,N) – номер эксперимента, и для каждого конкретного воздействия проводилось единственное измерение выходной переменной y_j.

Подобный сценарий позволяет получить оценки параметров модели и провести анализ её точности. Однако подобная организация экспериментального исследования не позволяет оценить адекватность полученной модели. Под адекватностью понимается способность полученной модели с приемлемой для нас точностью описать экспериментальные данные.

Для того, чтобы иметь возможность в дальнейшем оценить адекватность полученной модели, экспериментальное исследование должно быть организовано следующим образом: для каждого конкретного набора входных переменных x^j должна быть проведена серия экспериментов i = (m≥2), в результате которых будет получен набор значений выходной переменной y_j¹, y_j², …, y_j^m для одного и того же набора входных переменных x^j.

Анализ адекватности модели базируется на вычислении двух оценок S₁², S₂² одной и той же дисперсии – дисперсии ошибок измерений. Причем способ вычисления оценки S₁² таков, что её величина зависит от адекватности модели. Способ вычисления оценки S₂² таков, что её величина никак не связана с адекватностью модели.

Оценка рассчитывается по формуле:

Здесь

Оценка S₂² рассчитывается на основе выражения:

Дальнейший анализ адекватности экспериментальной модели базируется на переходе от оценок S₁², S₂² к скалярной величине F (to pay respects), которая рассчитывается на основе выражения:

Из вида этой величины следует, что признаком адекватности модели является значение F близкое к единице. Любое нарушение адекватности модели будет сопровождаться ростом значения F. Другими словами, чем более грубой является модель, тем большее значение будет принимать величина F.

Вопрос в том, какое значение этой величины считать достаточно большим, чтобы можно было уверенно и безошибочно утверждать, что полученная экспериментальная модель неадекватна. Ответ на этот вопрос осложняет то обстоятельство, что определенная таким образом величина F является случайной величиной. Для случайной величины невозможно указать фиксированный порог, который делит её значения на условно маленькие и условно большие, поскольку случайная величина может принять любое значение с разной вероятностью.

Ответить на этот вопрос помогает доказанное свойство, которым обладает определенная таким образом величина F: если полученная модель является адекватной, случайная величина F имеет теоретическое F-распределение (распределение Фишера) с числом степеней свободы (N-k), (N(m-1)).

F-распределение, как и распределение Стьюдента, относится к классу теоретических распределений, связанных с нормальным. Для него в таблицах математической статистики приведены значения квантилей F_α, как правило соответствующих доверительным вероятностям α = 0.95, 0.99, 0.999.

Допустим, что F_α – значение квантили F-распределения, соответствующее вероятности 0.95. Тогда с вероятностью 0.95 можно утверждать, что предложенная модель адекватна, если имеет место неравенство

F ≤ F_α

Нарушение этого неравенства (F > F_α) указывает на то, что предложенная модель недостаточно адекватно описывает экспериментальные данные. А значит требуется её уточнение на уровне структуры.