Практическая часть. Задание 1. Используя данные из таблицы П1 Приложения 1 (файл analiz. Sta),построитьлинейную многофакторную регрессионную модель и провести анализ зависимости

Задание 1. Используя данные из таблицы П1 Приложения 1 (файл analiz.sta),построитьлинейную многофакторную регрессионную модель и провести анализ зависимости производительности труда (Y) от трудоемкости единицы продукции (X1), удельного веса комплектующих изделий (Х3) и фондоотдачи (X7).

Основные действия те же, что и при построении однофакторной регрессионной модели (см. Лабораторная работа №11). В данном примере независимой переменной является Y — производительности труда, зависимыми – трудоемкость единицы продукции (X1 ), удельный вес комплектующих изделий (Х3) и фондоотдача (X7).

Сначала следуетоткрыть файл исходных данных (analiz.sta), затем переключиться в модуль MultipleRegression, сделать соответствующие установки в окне Selectdependentandindependentvariablelist и установить флажок в поле Reviewdescr.stats,corr.Matrix(Обзор описательных статистик, корреляционная матрица), что позволит провести предварительный анализ исходных переменных и построить корреляционную матрицу, анализ которой дает возможность сделать важные выводы о структуре связей между выбранными переменными (см. рис. 12.1).

Рис. 12.1 – Окно Multiple Regression

После того, как будет нажата кнопка ОК, на экране появится окно Correlations (рис.12.2), в котором представлены значения коэффициентов парной корреляции. Не рекомендуется включать в модель переменные, слабо связанные с результативным признаком – это фактор X7 (ryx7=0.293).

Наиболее тесную связь с результирующим признаком Y имеют факторы Х1 (r y x1=0,816) и X3 (ryx3=0,64). Их и нужно оставить для построения модели (см. рис. 12.2).

Рис.12.2 – Окно Correlations

Далее следует вернуться в окно Selectdependentandindependentvariablelist, определить в качестве независимых переменных факторы X1 и X 3 и нажать кнопку ОК. Система произведет вычисления, и на экране появится следующее окно результатов (см. рис. 12.3).

Рис.12.3 – Окно Multiple Regression Results

В информационной части окна содержатся краткие сведения о результатах анализа, а именно:

коэффициент детерминации R 2, = 0,688. Это значение показывает, что построенная регрессия объясняет более 68,8% разброса значений переменной Y относительно среднего;

значение F -критерия Фишера и уровень значимости р. В данном примере мы имеем достаточно высокое значение F-критерия — 29,795, а представленный в окне уровень значимости p = 0,00 показывает, что построенная регрессия высоко значима.

Рассмотрим вторую часть информационного окна. В ней представлена информация о значимых и незначимых оценках регрессионных коэффициентов. При этом высвечивается строка

x1 beta = -0,69, x3 beta = 0.195

и приводится пояснение Significantbeta'sarehighlighted (Значимые beta высвечены). Отметим, что в данном случае beta есть стандартизованные коэффициенты В1, т. е. коэффициент при независимой переменной X1 и В3, т. е. коэффициент при независимой переменной X3.

Перейдем в функциональную часть окна результатов.

Нажав кнопку Regressionsummary (Итоговый результат регрессии), получим на экране Spreadsheet (Электронная таблица вывода) электронную таблицу с численными результатами оценивания регрессионной модели (см. рис. 12.4).

Рис.12.4 – Параметры модели множественной регрессии

Верхняя часть окна – информационная, в нижней части находятся параметры модели. В столбце В, например, коэффициенты b0 = 12,428, b1 =-17,108, b3 =2,836.

Таким образом, полученное уравнение множественной регрессии имеет вид

Y = -17,108∙X1 + 2,836∙X3 +12,428.

Значения критериев Стьюдента (t) позволяют оценить значимость коэффициентов уравнения регрессии, критерий Фишера (F=29,759) и скорректированныйкоэффициент детерминации(AdjustedR1=0,6648 ) – значимость построенной модели.

Для получения описательной статистики следует вернуться в окно Multiple Regression Results,нажать кнопкуCorrelations & desc.stats,после чего на экране появится окно ReviewDescriptiveStatistics(см. рис. 12.3), из которого следует выбрать необходимые для анализа статистики:

кнопкой Means&SD (поставив флажок в поле SD=Sums of Squares/N) смещенные среднеквадратичные отклонения;

кнопкой Correlations коэффициенты корреляции.

Из окна MultipleRegressionResults,нажав кнопкуAnalysisofvariance,можно получить таблицу адекватности – значения общей суммы квадратов, регрессионной суммы квадратов, сумму квадратов остатков, критерий Фишера, число степеней свободы, уровень значимости (см. рис.12.5).

Рис.12.5 – Таблица адекватности

Чтобы посмотреть, как связаны остатки с наблюдаемыми значениями, в окне MultipleRegressionResults следует нажать кнопку ResidualAnalysis (Анализ остатков) и в появившемся окне выбрать команду Obs&Residuals (см. рис.12.6).

Чтобы посмотреть, как наблюдаемые значения связаны с предсказанными с помощью построенной модели, следует нажать кнопку Pred&observed(F) (см. рис. 12.7).

Рис.12.6 – График наблюдаемых Рис.12.7 – График наблюдаемых
переменных остатков и предсказанных значений

Из графиков на рис. 12.6 и рис. 12.7 видно, что модель достаточно адекватно описывает данные. Следовательно, с ее помощью можно делать достаточно точные выводы о зависимости производительности труда от трудоемкости единицы продукции и удельного веса комплектующих изделий.

Чтобы получить прогноз значения зависимой переменной Y, в окнеMultipleRegressionResultsследует нажать кнопкуPredictdependentvarи в появившееся на экране окноSpecifyvaluesforindep.varsввести новые значения Х1, например 0,18, и X3, например 0,55, и нажать ОК (см. рис. 12.8).

В результате в окне Predictingvaluesfor(см. рис.12.9)на основании полученного ранее уравнения регрессии Y = -17,108∙X1 + 2,836∙X3 +12,428будет рассчитано прогнозируемое значение производительности труда Y(10,908) при снижении трудоемкости единицы продукции X1 до 0,18 и уровне удельного веса комплектующих изделий X3,равномзначению 0,55.


Рис. 12.8 –Окно Рис.12.9 – Окно
Specify values for indep. Vars Predicting values for

Задание 2. на основании условия Задания 1 (см. выше) построить нелинейную модель, отражающую зависимость производительности труда Y от трудоемкости единицы продукции X1 и удельного веса комплектующих изделий X3.

Для переключения в этот модуль следует в переключателе разделов (Statistica Module Switcher) выбрать раздел Nonlinear Estimation, после чего на экране появится окно с перечнем доступных пользователю нелинейных функций для построения регрессионной модели (см. рис. 12.10). Особый интерес вызывает раздел « Функции, определенные пользователем» (User-specified regression). Здесь пользователь сам может математически задать вид уравнения регрессии и рассчитать и оценить его.

Рис.12.10 – Окно Nonlinear Estimation

Для этого в окнеUser-Specified Regression Function (рис.12.11)нужно нажать Function to be еstimated & loss function.

Рис.12.11 – Окно User-Specified Regression Function

и в полеEstimated function(рис. 12.12)определить уравнение регрессии, которое требуется рассчитать и оценить.

Рис.12.12 – Окно Estimated function & loss function

В нижней части окна приведены допускаемые в формулах арифметические операторы и стандартные функции, а также примеры их использования для записи выражений.

Созданную функцию можно сохранить для дальнейшего использования, для чего следует нажать Save As.

Для оценки отклонений между расчетным и фактическим значениями результирующего параметра (Y ) в поле Loss functionпо умолчанию находится функция (OBS-PRED)**2. Сюда также при необходимости можно ввести другую функцию.

Далее следует нажать ОК, перейти в окно Model estimation(см. рис.12.13), определить метод (Estimation metod), при помощи которого будут рассчитываться коэффициенты уравнения регрессии, число итераций и точность вычислений. Кроме того, обозначить флажком поле Asymptotic standart errorsдля включения в итоговый отчет оценок стандартных ошибок и уровней значимости.

После проведения расчетов результаты, по которым можно оценить адекватность модели по описанной выше методике, будут находиться в таблице окна Model(см. рис.12.14).

Рис.12.13 – Окно Model estimation

Рис.12.14 – Окно Model

Задания для самостоятельной работы

Задание 1. Исследовать влияние факторов x1, x2,..., хn на результативный признак Y [6]. Построив матрицу коэффициентов парной корреляции и корреляционное поле, сделать предположение о наличии и типе связи между исследуемыми факторами и рассчитать экономико-математическую многофакторную регрессионную модель, отражающую влияние показателей экономического роста предприятия за период 1997 – 2002 г.г. x1, x2,..., хn на результативный признак Y. (см. таблицу 12.1). Оценить адекватность модели. Построить график наблюдаемых переменных остатков и график наблюдаемых и предсказанных значений.

Использовать модуль Multiple Regression.

Таблица 12.1. Показатели экономического роста предприятия

Период ИПЦ Выручка Себесто-имость Прибыль от реализации Балан-совая прибыль Стоимость основных фондов Рентабель-ность общая Рентабель-ность собственная
  x0 x1 x2 x3 x4 x5 x6 x7
1-1997 132,2           1,2 4,7
2-1997 130,3           1,1 4,3
3-1997 126,6           1,1 4,3
4-1997 115,4           0,5 1,8
1-1998 107,3             19,5
2-1998 105,6           4,2 20,4
3-1998 105,7           5,6 27,1
4-1998 104,5           5,7 28,2
1-1999               12,8
2-1999 103,5           2,3 14,2
3-1999 103,3           2,1  
4-1999 100,5           1,8 11,3
1-2000 107,6           5,4  
2-2000 109,5           4,9 19,1
3-2000 120,8           3,8 15,1
4-2000             3,1 10,7
1-2001 113,2           5,1 22,6
2-2001 111,4           5,1 22,4
3-2001 111,7           5,1 22,4
4-2001 100,2           5,5 24,2
1-2002 105,1           4,8 20,6
2-2002 105,6           5,2 22,4
3-2002 106,1           5,8  
4-2002 107,2           6,4 27,4
1-2003 106,1           6,8 22,1
2-2003             6,9 22,4
3-2003 103,4             25,4
4-2003 103,4             26,2
1-2004 103,9             22,6
2-2004 103,8           7,2 22,5
3-2004 103,8           7,3 25,1
4-2004 103,7           3,4 25,2

Варианты заданий

№ варианта Результативный признак Номера факторных признаков
  x0 x1, x2, x3, x4
  x0 x2, x3, x4, x5
  x0 x3, x4, x5, x6
  x0 x4, x5, x6, x7
  x5 x1, x2, x3, x4
  x5 x1, x2, x3, x7
  x5 x2, x3, x6, x7
  x7 x2, x3, x4, x5
  x7 x3, x4, x5, x6
  x7 x1, x2, x5, x6

Задание 2. Поскольку не все показатели экономического роста предприятия x1, x2,..., хn имеют тесную корреляционную связь с результирующим признаком Y (см. таблицу 12.1), по данным своего варианта построить многофакторную регрессионную модель нелинейной структуры, наиболее адекватно описывающую исходные данные. Использовать модуль Nonlinear Estimation.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: