Порядок выполнения задания. Выбор уравнения модели, в большинстве случаев, производятся среди функций перечисленных в таблице 3

Выбор уравнения модели, в большинстве случаев, производятся среди функций перечисленных в таблице 3. В системе STATISTICA для построения линейного уравнения множественной регрессии можно воспользоваться модулем множественной регрессии , определив зависимую (dependent) переменную y и независимые (independent) переменные х₁, х₂, x₃, x₄.

Статистический вывод о пригодности (значимости) уравнения регрессии в системе Statistica обычно проверяется в следующей последовательности.

1. Проводится общаяпроверка модели, целью которой является выяснение, объясняют ли х -переменные значимую долю изменения у. Определение значимости модели рекомендуется проводить по следующим методам (см. табл. 5).

Таблица 5

Критерий Фишера	Использование уровня значимости α	Использование коэффициента детерминации R²
Проверяется нулевая гипотеза H₀ о равенстве полученных коэффициентов регрессии нулю: a₀=a₁=a₂=…=a_m=0. Для этого рассчитанное системой Statistica значение F -критерия (F_расч), сравнивается с табличным значением F_табл, определяемым с использованием специальных таблиц по заданным уровню значимости (например, a=0,05) и числу степеней свободы (df1=m, df2=n-m-1). Если выполняется неравенство F_расч < F_табл, то с уверенностью, например на 95 %, можно утверждать, что рассматриваемая зависимость y = а₀ + a₁x₁+ … +a_mx_m является статистически значимой.	Если рассчитанное в Statistica значение уровня значимости р больше, чем заданный уровень значимости a (например, a=0,05), то полученный результат нужно трактовать как незначимый (для 95% вероятности). В том случае, когда величина р <0,05, то вывод такой: это значимое уравнение с вероятностью 95%.	Рассчитанная системой Statistica величина сравнивается с табличными (критическими) значениями , определяемым с использованием специальных таблиц по заданному уровню значимости (например, α =0,05). Если окажется, что > , то с упомянутой степенью вероятности (95 %) можно утверждать, что анализируемая регрессия является значимой.

Если регрессия неявляется значимой, то говорить больше не о чем.

Осуществив переход к результатам регрессии (Summary: Regression results), получаем уравнение линейной множественной регрессии вида

y(x₁, x₂, x₃, x₄)=6,9+0,07x₁ –0,00035x₂–2,08x₃+0,00003x₄:

2. Если регрессия оказывается значимой, то существует взаимосвязь между параметром у и переменными х₁, х₂,…,x_m. Однако остается неясно, каково влияние конкретных факторов х₁, х₂,…,x_m на исследуемую функцию у. Можно продолжить анализ, используя t- тесты для отдельныхкоэффициентов регрессии а₀, a₁, a₂,…,a_m с целью выяснить, насколько значимой является влияние той или иной переменной х на параметр у при условии, что все другие факторы х_k остаются неизменными. Проверку на адекватность коэффициентов регрессии рекомендуется проводить по следующим эквивалентным методам (см. табл. 5).

Таблица 5

Использование t-критерия Стьюдента

Использование уровня значимости α

Анализируемый коэффициент а₀ _, a₁, a₂,…,a_m считается значимым, если рассчитанное системой Statistica для него значение t -критерия по абсолютной величине превышает t_табл, определяемым с использованием специальных таблиц по заданным уровню значимости (например, a=0,05) и числу степеней свободы (df=n-m-1).

Коэффициент регрессии а₀ _, a₁, a₂,…,a_m признается значимым, если рассчитанное системой Statistica для него значение уровня значимости р меньше (или равно) 0,05 (для 95%-ной доверительной вероятности).

Т.к. вычисленные уровни значимости p-level для коэффициентов, стоящих при x₂ и x₄ меньше 0,05, то они не значимы. К аналогичному выводу можно прийти, воспользовавшись t -критерием: t₂(10)=-0,013<2,228 и t₃(10)=1,44<2,228.

С учетом этого факта, пересчитаем уравнение множественной регрессии, выбрав в качестве зависимой (dependent) переменную y и независимые (independent) переменные х₁ и x₃, коэффициенты при которых значимы:

Получаем:

Т.о., уравнение регрессии имеет вид

y(x₁, x₃)=4,957+0,096x₁–1,559x₃

Для выполнения прогнозов по полученному уравнению необходимо показать, что регрессионная модель адекватна результатам наблюдений. С этой целью можно воспользоваться критерием Дарбина-Уотсона, согласно которого, рассчитанный системой Statistica коэффициент d_расч необходимо сравнить с табличным значением d_табл (для совокупности объемом n =15, уровня значимости a= 0,05 и трех оцениваемых параметров регрессии, значение d_таб _л=1,75). Если d_расч > d_табл, то полученная модель адекватна и пригодна для прогнозирования. Для определения d_расч в Statistica в окне Residual Analysis на вкладке Advanced необходимо выбрать опцию Durbin-Watson statistic:

В рассматриваемом примере d_расч=1,2<1,75, следовательно, модель не желательно использовать для прогнозирования.

В случае, когда модель адекватна результатам наблюдения для выполнения прогноза в окне Multyple Regression Results вкладки Residuals/assumptions/prediction (Остатки/Предположения/Прогнозирование) выбрать опцию (прогнозирование зависимой переменной). Например, если в Москве среднегодовую стоимость основных фондов(переменная x₁) повысить на 50 тыс. руб., а трудоемкость единицы продукции (переменная х₃) уменьшить в два раза, то следует ожидать производительности труда равной 19,16 (увеличится на 19,16-14=5,16):