Регрессионный анализ

Этот метод оценки адекватности основан на использовании независимых статистических критериев, позволяющих охарактеризовать справедливость исследуемых гипотез. Регрессионный анализ обычно выполняется в три этапа, которые сводятся к оценке воспроизводимости эксперимента, проверке значимости коэффициентов разработанной модели (например, уравнения регрессии) и оценке адекватности модели.

Допустим, что в нашем распоряжении имеется серия экспериментальных данных (выборка) объемом независимых опытов, в котором каждый случай измерения результата процесса повторен в серии параллельных опытов М раз. Для статистической обработки эксперимент должен удовлетворять следующим требованиям:

1) независимые параметры должны измеряться с пренебрежимо малой ошибкой по сравнению с зависимым параметром , так как в ошибку определения входят и неучтенные возмущения параметров , например, погрешность измерения температуры, погрешность взвешивания и т.д.;

2) при закрепленных значениях случайная величина подчиняется закону нормального распределения;

3) для ряда серий параллельных опытов должно выполняться условие однородности дисперсий (среднеквадратичных отклонений опытных данных относительно среднего значения параметров для серии параллельных опытов).

Для проверки однородности дисперсий, то есть приемлемого качества эксперимента, используется статистический критерий Кохрена. Анализ эксперимента на однородность дисперсий выполняется следующим образом. Для каждой серии из М параллельных опытов рассчитывается выборочная дисперсия

, (4.5)

где

(4.6)

где –число независимых опытов, – число степеней свободы дисперсии, равное числу опытов, по которому рассчитывается данная дисперсия (в нашем случае число параллельных опытов М), за вычетом числа связей, наложенных на расчет дисперсии. Одной связью является один любой параметр, рассчитанный по данной серии из М опытов (например, расчет – это одна связь) и учтенный при расчете данной дисперсии. Таким образом, = М -1.

После расчета выборочных дисперсий для всех серий параллельных опытов выделяют из них наибольшую дисперсию и рассчитывают критерий Кохрена , проверяющий гипотезу «рассматриваемые дисперсии однородны»:

. (4.7)

Чем меньше величина критерия Кохрена Б тем выше качество (воспроизводимость) эксперимента, его однородность; дисперсии однородны если

, (4.8)

где – табличное значение критерия Кохрена при уровне значимости вероятности ошибки при оценке гипотезы Р и степенях свободы и М -1.

Дисперсия воспроизводимости , которая является эквивалентом среднеквадратичной погрешности эксперимента в целом, рассчитывается по формуле

. (4.9)

В тех случаях, когда число параллельных опытов в разных сериях неодинаково, дисперсия воспроизводимости рассчитывается как

, (4.10)

где , и в этом случае для оценки однородности дисперсий применяется статистический критерий Бартлетта [18].

Ранее было показано, что коэффициенты уравнений регрессии могут изменять свою величину в зависимости от объема выборки, то есть, выражаясь языком математической статистики, существует доверительный интервал значений, внутри которого может изменяться величина коэффициента математической модели процесса. Смысл проверки значимости коэффициента заключается в проверке гипотезы о наличии нуля внутри доверительного интервала. Очевидно, если коэффициент может принять нулевое значение (пусть не в выполненном, а гипотетическом эксперименте), то слагаемое можно объявить незначимым (не влияющим на ход изучаемого процесса)и исключить его из уравнения регрессии.

Оценка значимости коэффициентов выполняется по статистическому критерию Стьюдента

, (4.11)

где – погрешность определения коэффициента , связанная с погрешностью эксперимента.

В общем случае находят по закону накопления ошибок

, (4.12)

для ортогональных матриц планирования

. (4.13)

Чем больше величина , тем выше вероятность значимости коэффициента ; коэффициент значим, если расчетная величина критерия Стьюдента больше табличного значения (табл. 4.2), где Р уровень значимости вероятности ошибки при оценке гипотезы о значимости коэффициента, – число степеней свободы дисперсии воспроизводимости ( = )

Таблица 4.2

Табличные значения критерия Стьюдента

Число степеней свободы Р = 0,3   Р = 0,2   Р = 0,1   Р = 0,05   Р = 0,02   Р = 0,01
  1,963 3,078 6,314 12,706 31,821 63,657
  1,386 1,886 3,920 4,303 6,965 9,925
  1,250 1,638 2,353 3,182 4,541 5,841
  1,190 1,533 2,132 2,776 3,747 4,604
  1,156 1,476 2,015 2,571 3,365 4,604
  1,134 1,440 1,943 2,447 3,143 4,032
  1,119 1,415 1,895 2,365 2,998 3,707
  1,108 1,397 1,860 2,306 2,896 3,499
  1,100 1,383 1,833 2,262 2,821 3,355
  1,093 1,372 1,812 2,228 2,764 3,250
  1,064 1,325 1,725 2,086 2,528 2,865
  1,055 1,310 1,697 2,042 2,457 2,750

Как следует из табл. 4.2, при оценке значимости коэффициентов допускается довольно широкий диапазон значений вероятности ошибочности гипотезы о значимости – Р изменяется от 0.01 (суждение о значимости рассматриваемого коэффициента может оказаться ошибочным в одной серии опытов из ста) до 0.3 (суждение о значимости рассматриваемого коэффициента может оказаться ошибочным в тридцати сериях опытов из ста); эта гибкость оценок необходима для того, чтобы «оставить в живых» коэффициент уравнения регрессии с небольшим значением критерия Стьюдента (например, 6 при одной степени свободы), который при жестком подходе к оценке значимости станет незначимым, но по физической сущности процесса очень важен для модели. Например, рассматриваемый коэффициент характеризует температуру химического процесса, которая, как известно, существенно влияет на кинетику процесса; тогда взяв Р =0.2 получим, что коэффициент значим ( больше табличного значения ) и в дальнейшем модель будет учитывать влияние температуры на ход процесса.

Следует напомнить, что если оказывается незначимым коэффициент уравнения регрессии, полученного в пассивном эксперименте, то, после исключения незначимых слагаемых из уравнения регрессии, все остальные коэффициенты подлежат пересчету по методу наименьших квадратов. Если оказывается незначимым коэффициент уравнения регрессии, полученного в активном эксперименте, то, после исключения незначимых слагаемых из уравнения регрессии, остальные коэффициенты не пересчитывают.

Гипотеза об адекватности разработанной математической модели проверяется по статистическому критерию Фишера , в общем случае

, (4.14)

где – соответственно дисперсии адекватности и воспроизводимости. характеризует погрешность разрабатываемой математической модели относительно контрольных опытов, характеризует качество контрольных экспериментов. Очевидно, чем менше погрешность модели, тем выше уровень ее адекватности. Математическая модель адекватна, если расчетная величина критерия Фишера меньше табличного значения (табл. 4.3), где где Р уровень значимости вероятности ошибки при оценке гипотезы об адекватности модели, и – число степеней свободы дисперсий в числителе и знаменателе критерия Фишера.

Таблица 4.3

Таблица значений критерия Фишера

Число степеней свободы (f2) для меньшей дисперсии Число степеней свободы (f1) для большей дисперсии
           
             
  18,5 19,0 19,1 19,3 19,3 19,4
  10,1 9,55 9,28 8,94 8,78 8,69
  7,71 6,94 6,59 6,16 5,96 5,84
  6,61 5,79 5,41 4,95 4,74 4,60
  5,99 5,14 4,76 4,28 4,06 3,92
  5,59 4,74 4,35 3,87 3,63 3,49
  5,32 4,46 4,07 3,58 3,34 3,20
  5,12 4,26 3,86 3,37 3,13 2,98
  4,96 4,10 3,71 3,22 2,97 2,82
  4,75 3,88 3,49 3,00 2,76 2,60
  4,60 3,74 3,34 2,85 2,60 2,44
  4,49 3,63 3,24 2,74 2,49 2,33
  4,41 3,55 3,16 2,66 2,41 2,25

При больших значениях чисел степеней свободы, выходящих за пределы характеристик строк и граф табл. 4.3, величина критерия Фишера близка к двум.

Если эксперимент состоит из основных опытов, которые выполнены с одинаковым числом опытов в параллельных сериях экспериментов (), то

, (4.15)

где – число значимых коэффициентов в уравнении математической модели (уравнения регрессии), зависимых от выполненного эксперимента.

Если эксперимент состоит из основных опытов и одной серии параллельных опытов, то

, (4.16)

где – остаточная дисперсия.

Если параллельные опыты отсутствуют, то рассчитывают

, (4.17)

рассматривая при этом насколько предложенное уравнение лучше описывает рассматриваемую зависимость, чем простейшая модель в форме среднеарифметического представления всей совокупности экспериментальных данных . В этом случае исследуемое уравнение адекватно, если расчетное значение .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: