Корреляция. А)Определение коэффициента корреляции

А)Определение коэффициента корреляции

  Премия Производительность
Премия Коэффициент корреляции   ,982**
Производительность Коэффициент корреляции ,982**  

Б)

 
  Затраты на содержание основныхс редств1ц/руб Урожайность пшеницы ц/га
Затраты на содержание основных средств 1ц/руб Коэффициент корреляции   -,113
Урожайность пшеницы ц/га Коэффициент корреляции -,113  

  Затраты на содержание основных средств1ц/руб Рентабельность
Затраты на содержание основных средств 1цр/уб Коэффициент корреляции   -,161
Рентабельность Коэффициент корреляции -,161  

В)

 
  ЗатратынаГСМ Рентабельность
Затраты на ГСМ Коэффициент корреляции   -,056
Рентабельность Коэффициент корреляции -,056  

Неленейная регрессия

Графически отобразим фактические значения прибыли в зависимости от премиальных выплат

Анализируя график можем сделать вывод: с увеличением премиальных выплат увеличилась средняя прибыль.

Рассчитать прогнозное значение прибыли, согласно полученной модели(полином второй степени)

Y=ao+a1*x+a2*x2^2

Премиальные выплаты Расчетная прибыль
  128,48
  137,72
  144,9
  150,01
  153,06
  154,04
  152,97
  149,83
  144,62
  137,36
  128,03

Представить графически уровень расчетной прибыли зависимости от премиальных выплат

Анализируя график можно сделать вывод: График имеет сглаженный характер. При увеличении премиальных выплатах увеличивалась средняя расчетная прибыль до отметки 725, после чего средняя расчетная прибыль уменьшалась.

Рассчитать прибыль при следующих значениях премиальных выплат: 890,810,745.

Премиальные выплаты Расчетная прибыль
  108,81
  97,22
  153,35

Линейная регрессия

Correlations
  численность промышленно-производственного персонала, чел. среднегодовая стоимость основных фондов, млн. руб. износ основных фондов, % электровооруженность техническая вооруженность одного рабочего, млн. руб. выработка товарной продукции на одного работающего, руб.
численность промышленно-производственного персонала, чел. Коэффициент корреляции   ,949** -,106 ,031 ,101 ,077
среднегодовая стоимость основных фондов, млн. руб. Коэффициент корреляции ,949**   -,153 ,129 ,214 ,135
износ основных фондов, % Коэффициент корреляции -,106 -,153   ,203 ,019 -,124
электровооруженность Коэффициент корреляции ,031 ,129 ,203   ,754** ,481*
техническая вооруженность одного рабочего, млн. руб. Коэффициент корреляции ,101 ,214 ,019 ,754**   ,667**
выработка товарной продукции на одного работающего, руб. Коэффициент корреляции ,077 ,135 -,124 ,481* ,667**  

Корреляционная связь есть только в двух случаях: у численности промышленно-производственного персонала и среднегодовой стоимости основных фондов, а так же между технической вооруженностью одного рабочего и электровооруженностью. Следовательно необходимо исключить

У= 21х1+0,06х2+797,5х3+207х4-690х5+21х6

Данное уравнение линейной регрессии использовать нельзя, почему? Так как факторы включенные в модель коррелируют между собой. Необходимо исключить следующие факторы:

Теперь составим уравнение с исключенными данными:

Модель Коэффициент корреляции Коэффициент детерминаци
  ,998a ,996

У= 21х1++797,5х3+207х4+21х6

Получаем следующие значения

Теоретический объем
 
 
 
 
 
 
 
 
 
 
-7053
 
 
 
 
 
 
-5839
-28043
 
 
 
 
 
 
 

Самостоятельная работа (вариант 2)

А)Расчитать матрицу парных коэффициентов корреляции

Б)Построить уравнение множественной регрессии(2). Дать описание полученным уравнениям.

В)Расчитать прогнозное значение y

Задание № 1

А)

  город области (1- Подольск, 2-Люберцы) общая площадь число комнат в квартире квартиры (м2) общая площадь квартиры (м2) жилая площадь квартиры (м2) этаж квартиры площадь кухни (м2)
город области (1- Подольск, 2-Люберцы) Коэффициент корреляции   ,101 ,069 ,100 -,194 -,023
общая площадь число комнат в квартире квартиры (м2) Коэффициент корреляции ,101   ,809** ,891** -,016 ,222*
общая площадь квартиры (м2) Коэффициент корреляции ,069 ,809**   ,955** ,084 ,633**
жилая площадь квартиры (м2) Коэффициент корреляции ,100 ,891** ,955**   ,002 ,506**
этаж квартиры Коэффициент корреляции -,194 -,016 ,084 ,002   ,150
площадь кухни (м2) Коэффициент корреляции -,023 ,222* ,633** ,506** ,150  

В ходе анализирования таблицы с помощью линейной регрессии получаем уравнение:

Б) Y=14.32x1-7.6x2+1.5x3+0.7x4-0.09x5-2.4x6

Но это уравнение использовать нельзя, потому что факторы, включенные в модель коррелируют между собой.

Коррелируют следующие признаки: Общая площадь квартиры с общей площадью числа комнат и жилая площадь квартиры с общей площадью квартиры. Исключим общую площадь квартиры. И получим

  город области (1- Подольск, 2-Люберцы) общая площадчисло комнат в квартиреь квартиры (м2) жилая площадь квартиры (м2) этаж квартиры площадь кухни (м2)
город области (1- Подольск, 2-Люберцы) Коэффициент корреляции   ,101 ,100 -,194 -,023
общая площадчисло комнат в квартиреь квартиры (м2) Коэффициент корреляции ,101   ,891** -,016 ,222*
жилая площадь квартиры (м2) Коэффициент корреляции ,100 ,891**   ,002 ,506**
этаж квартиры Коэффициент корреляции -,194 -,016 ,002   ,150
площадь кухни (м2) Коэффициент корреляции -,023 ,222* ,506** ,150  

В ходе анализирования таблицы с помощью линейной регрессии

Model Unstandardized Coefficients Standardized Coefficients t Sig.
B Std. Error Beta
  (Constant) -27,331 18,256   -1,497 ,139
город области (1- Подольск, 2-Люберцы) 14,073 6,414 ,130 2,194 ,031
общая площадь число комнат в квартире квартиры (м2) -6,722 7,603 -,139 -,884 ,379
жилая площадь квартиры (м2) 2,713 ,512 ,947 5,294 ,000
этаж квартиры ,517 ,831 ,037 ,622 ,536
площадь кухни (м2) ,634 1,555 ,034 ,408 ,684

Получаем уравнение

Y=14.32x1-7.6x2+0.7x3-0.09x4-2.4x5

Данное уранение может быть использовано:

Model Коэффициент корреляции Коэффициент детерминации
  ,867a ,752

Коэффициент корреляции равен 0,867 что указывает на сильную связь данных и результативных показателей. коэффициент детерминации равен 0, 752, что указывает на использование 75% данных.

В)находим прогнозное значение:

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Задание № 2

А)

  в том числе выручка по аудиторским проверкам (тыс. руб.) среднее число специалистов выручка на одного специалиста (тыс. руб.) число аттестованных аудиторов
в том числе выручка по аудиторским проверкам (тыс. руб.) Pearson Correlation   ,793** -,012 ,618**
среднее число специалистов Pearson Correlation ,793**   -,238 ,848**
выручка на одного специалиста (тыс. руб.) Pearson Correlation -,012 -,238   -,236
число аттестованных аудиторов Pearson Correlation ,618** ,848** -,236  

В ходе анализирования таблицы с помощью линейной регрессии получаем уравнение:

Б) Y= 1.3x1+893.9x2+9.9x3-497.11x4

Но это уравнение использовать нельзя, потому что факторы, включенные в модель коррелируют между собой.

Коррелируют следующие признаки: выручка от аудиторской проверки со средним числом специалистов и число аттестированных аудитов со средним числом специалистов. Исключим Среднее число специалистов. И получим

Correlations
  в том числе выручка по аудиторским проверкам (тыс. руб.) выручка на одного специалиста (тыс. руб.) число аттестованных аудиторов
в том числе выручка по аудиторским проверкам (тыс. руб.) Pearson Correlation   -,012 ,618**
Sig. (2-tailed)   ,940 ,000
N      
выручка на одного специалиста (тыс. руб.) Pearson Correlation -,012   -,236
Sig. (2-tailed) ,940   ,128
N      
число аттестованных аудиторов Pearson Correlation ,618** -,236  
Sig. (2-tailed) ,000 ,128  
N      
 

Получаем уравнение: Y= 1.3x1+9.9x2-497.11x3. Данное уранение может быть использовано:

Model Коэффициент корреляции Коэффициент детерминации
  ,635a ,651

Коэффициент корреляции равен 0,635 что указывает на сильную связь данных и результативных показателей. Коэффициент детерминации равен 0, 651, что указывает на использование 64% данных.

В) находим прогнозное значение:

 
 
588839,1
860733,5
550502,9
267767,2
587294,4
245673,7
423486,1
373289,2
424786,9
412248,6
524872,1
373253,8
397585,4
316965,6
365928,2
165657,3
179971,2
236695,3
230160,4
138979,6
 
297811,5
152662,3
209353,9
245826,2
162028,5
264712,1
140353,5
132382,1
136566,3
132816,6
97461,26
88191,04
128166,4
84600,37
103235,3
74487,06
75878,61
89412,87
79762,18
86018,27
 

группа Среднее Среднее по подмножеству  
 
1,00 Среднегодовая стоимость основных производственных фондов 168,9052 36,94950  
Среднесписочная численность персонала, тыс. чел. 14,0478 2,74393  
Балансовая прибыль, млн.ден. ед. 18,3325 5,70931  
2,00 Среднегодовая стоимость основных производственных фондов 45,7906 13,50191  
Среднесписочная численность персонала, тыс. чел. 4,7780 ,68171  
Балансовая прибыль, млн.ден. ед. 10,7580 2,68102  
Total Среднегодовая стоимость основных производственных фондов 100,5082 69,37913  
Среднесписочная численность персонала, тыс. чел. 8,8979 5,18891  
Балансовая прибыль, млн.ден. ед. 14,1244 5,63511  

В первом подмножестве среднее значение по подмножеству значительно превышает значения по второму подмножеству.

Tests of Equality of Group Means
  Wilks' Lambda F df1 df2 Sig.
Среднегодовая стоимость основных производственных фондов ,125 48,866     ,000
Среднесписочная численность персонала, тыс. чел. ,113 54,677     ,000
Балансовая прибыль, млн.ден. ед. ,498 7,053     ,033

В ходе анализирования таблицы мы можем прийти к выводу, что все признаки необходимы для дискриминации.

Определение коэффициента корреляции
  Среднегодовая стоимость основных производственных фондов Среднесписочная численность персонала, тыс. чел. Балансовая прибыль, млн.ден. ед.
Correlation Среднегодовая стоимость основных производственных фондов 1,000 ,552 ,570
Среднесписочная численность персонала, тыс. чел. ,552 1,000 ,733
Балансовая прибыль, млн.ден. ед. ,570 ,733 1,000

Данная таблица показывает взаимосвязь факторов между собой.

Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
  ,069 14,745   ,002

Согласно коэффициенту,связь можем считать адекватной (менее 0,05)

Structure Matrix
  Function
 
Среднесписочная численность персонала, тыс. чел. ,758
Среднегодовая стоимость основных производственных фондов ,716
Балансовая прибыль, млн.ден. ед. ,272

Наибольшее воздействии оказывает среднесписочная численность персонала, поменьше среднегодовая стоимость основных производственных фондов и самое меньшее воздействие оказывает балансовая прибыль.

Canonical Discriminant Function Coefficients
  Function
 
Среднегодовая стоимость основных производственных фондов ,024
Среднесписочная численность персонала, тыс. чел. ,549
Балансовая прибыль, млн.ден. ед. -,197
(Constant) -4,507
Unstandardized coefficients

С помощью таблицы получаем дискрименантное уравнение

D(x)=4.5+0.024x1+0.55x2-0.197x3

  Case Number Actual Group  
  Группа Вероятность
 
Original       1,000
      1,000
      1,000
      1,000
      1,000
      1,000
      1,000
      1,000
      1,000
  ungrouped   ,995
  ungrouped   ,926
  ungrouped   1,000

В ходе дискименантного анализа мы получили что, десятое предприятие попадет во вторую группу с вероятностью 99%, одиннадцатое предприятие с вероятностью в 92% попадет во первую группу и двенадцатое предприятие



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: