Оценка соответствия модели экспериментальным данным

После того как получены экспериментальные данные, выбрана структура математической модели и найдены МНК значения коэффициентов этой структуры, необходимо оценить соответствие полученной модели тем экспериментальным данным, которые были использованы для получения этой модели.

В регрессионном и корреляционном анализах такая оценка осуществляется различными способами. Рассмотрим, как осуществляется такая оценка соответствия в регрессионном анализе. Здесь предусматривается решение двух задач:

1) оценка значимости коэффициентов;

2) оценка адекватности модели.

1. Оценка значимости коэффициентов.

Здесь проверяется гипотеза о значимом отличии полученных значений коэффициентов âm от нуля. При этом оценка коэффициента âm рассматривается как случайная величина, которая может принимать различные значения в некоторой небольшой окрестности от действительного значения этого коэффициента.

В математической статистике существует понятие генеральной совокупности значений случайной величины, которая имеет бесконечный объем. И в теории показано, что оценка коэффициентов регрессионной модели (при выполнении всех условий применимости МНК) может совпадать с действительным значением лишь в том случае, когда объем экспериментальных данных равен бесконечности. В противном случае оценка коэффициентов всегда будет отличаться от действительного значения. И чем меньше объем (количество) экспериментальных данных, тем больше может быть это различие. Поэтому конечное число экспериментальных данных, используемое для построения регрессионных моделей, называют выборкой данных из генеральной совокупности или просто выборкой.

Поэтому оценка âm будет всегда отличаться от действительного значения am. Причем величина этого отличия будет зависеть не только от объема выборки экспериментальных данных, но также и от эффекта влияния прочих, не учитываемых моделью факторов. А раз это так, то и âm рассматривается как случайная величина с центром аm.

В основе процедуры оценивания значимости коэффициентов регрессии лежит нахождение доверительного интервала для оценки âm. При этом в математической статистике под доверительным интервалом какой-либо вероятной характеристики понимают такой интервал ее значений, который с заданной (большой) вероятностью покрывает действительное значение коэффициента регрессии. Эту вероятность называют доверительной. Её значение необходимо предварительно выбрать в диапазоне 0,8 – 0,99. И по специальным таблицам t – распределения Стьюдента находят значение величины tт – критерий Стьюдента, в зависимости от доверительной вероятности и числа экспериментальных данных N. После этого находят величину ∆аm, которая равна по модулю:

(32)

- оценка дисперсии коэффициента регрессии аm как случайной величины

; (33)

где N – число учитываемых факторов;

V – учитываемые факторы.

m = 1,…, М;;

; (34)

. (35)

Таким образом, для того чтобы определить доверительный интервал и оценить значимость коэффициента регрессии необходимо выполнить следующий порядок действий.

1. Задаться доверительной вероятностью или уравнением значимости.

2. По таблицам t – распределения Стьюдента, которые приводятся в любом учебнике по математической статистики, находится конкретное значение tт (табличное) в зависимости от и (или) и N.

3. Определяется значение Δаm по формулам (32) – (35).

4. Определяется величина доверительного интервала

m - Δаm; аm + Δаm}

5. Анализ доверительного интервала, при котором проверяется наличие внутри этого интервала нуля. Соответственно ноль может быть внутри этого интервала, если |аm| ≤ |Δаm|.

Если выполняется условие |аm| > |Δаm|, то выполняется гипотеза о значимом отличии оценки коэффициента аm от нуля. И принимается решение о том, что фактор Vm значимо влияет на у, и его необходимо учитывать в уравнении регрессии.

Если выполняется условие |аm| ≤ |Δаm|, т. е. внутрь доверительного интервала может попасть ноль, то принимается гипотеза о том, что при зафиксированном диапазоне изменения Vm значение коэффициента â может быть равно нулю; и делается вывод, что фактор Vm при данном диапазоне его изменения не влияет на у.

Таким образом, по результатам этой процедуры отбраковываются те из первоначально учтенных факторов Vm, которые не влияют или слабо влияют на у.

2. Оценка адекватности модели.

В основе процедуры оценивания адекватности модели лежит расчет и анализ F – критерия Фишера, который по определению равен отношению и с помощью этого критерия и процедуры предложенной Фишером проверяется гипотеза, принадлежат ли выборки I и II одной и той же генеральной совокупности. При этом получена на основе выборки I, а дисперсия - на основе выборки II. Согласно Фишеру расчетным путем определяется значение критерия, т.е. как отношение двух оценок дисперсии:. Затем по специальным таблицам находятся табличные значения этого критерия в зависимости от числа степеней свободы, где под степенью свободы понимают численное значение знаменателя в выражении дисперсии, например, при расчете знаменатель равен N-M-1. Для проверки адекватности модели представляют как отношение остаточной дисперсии к дисперсии опыта, т.е.. С помощью этого отношения по процедуре Фишера проверяется гипотеза: принадлежат ли эти две дисперсии одной и той же генеральной совокупности. Согласно Фишеру, если, то эти две дисперсии принадлежат одной и той же генеральной совокупности и различие их оценок вызвано лишь малостью выборки. Если анализируются дисперсии опыта и остаточной дисперсии, то в случае выполнения этого условия считают, что эти две дисперсии принадлежат одной и той же генеральной совокупности. Грубо говоря, можно считать, что они равны. И в этом случае модель будет адекватной. Почему? Дисперсия опыта отражает влияние не учитываемых факторов ε, т. е.. А остаточная дисперсия, в свою очередь, обязательно содержит в себе дисперсию опыта, дополнительно она еще может отражать ошибки аппроксимации выбранной модели существующей причинно-следственной зависимости, т.е.. И если структура модели выбрана правильно, то примерно равна нулю. Таким образом, в соответствии с процедурой Фишера осуществляется проверка правильности выбора структуры модели.

Практическая значимость модели.

Процедуры Стьюдента и Фишера гарантируют адекватность модели при выполнении всех предпосылок этих методов. Эти все предпосылки выполнить практически не возможно, поэтому в инженерной практике используются другие приемы оценки пригодности (полезности) полученной модели.

1. Оценка по целевому критерию.

2. Находятся две дисперсии: первая остаточная дисперсия по известной формуле, вторая -.

СТРУКТУРА МНОГОВАРИАНТНОГО ИСПЫТАТЕЛЬНО-НАЛАДОЧНОГО КОМПЛЕКСА


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: