Тема 2: Множественная регрессия и корреляция

Задача 1. Имеются следующие данные по торговым предприятиям:

Валовой доход за год, млн. руб. Среднегодовая стои­мость основных фон­дов, млн. руб. Среднегодовая стоимость оборотных фондов, млн. руб.
  20,3 11,8 10,5
  6,3 2,8 5,6
  4,5 1,7 5,4
  11,3   6,3
  12,1 5,6 2,8
  8,8 10,2  
    11,6 5,4
  5,6 12,4 4,2
    11,4 3,6
  23,7 15,4 10,6
    11,5 8,8
  7,5 9,8 4,6

Задание:

1) определите параметры уравнения линейной множественной регрессии;

2) оцените тесноту связи изучаемых показателей;

3) оцените значимость полученного уравнения.

Решение:

1) Для определения параметров уравнения линейной множественной регрессии:

построим следующую систему уравнений:

Построим расчетную таблицу

x1 x2 y yx1 yx2 x21 x22 x1x2
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
итого                

Решим систему методом определителей матрицы

Рассчитаем частные определители путем замены соответствующего столбца матрицы данными левой части системы

=

       
   


Определим параметры уравнения по следующим формулам:

Уравнение линейной множественной регрессии имеет следующий вид:

Коэффициенты регрессии показывают, что

2) Оценим тесноту связи с помощью индекса множественной корреляции

Построим расчетную таблицу

x1 x2 y yxi
             
             
             
             
             
             
             
             
             
             
             
             
итого            

3) оценим статистическую значимость уравнения регрессии в целом

F табл. = 4,26 при заданных степенях свободы и уровне значимости (5%).

Задача 1. По 30 территориям России имеются следующие данные:

Признак Среднее значение Среднее квадратическое отклонение Линейный коэффициент парной корреляции
Среднедневной душевой доход, руб., у 86,8 11,44 -
Среднедневная заработная плата одного работающего, руб., х 1 54,9 5,86
Средний возраст безработного, лет, х 2 33,5 0,58

Задание:

1)постройте уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с и , пояснить различия между ними.

2) рассчитайте линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.

3) рассчитайте общий и частные F- критерии Фишера.

Решение:

1. Линейное уравнение множественной регрессии y от x 1 и x 2 имеет вид: . Для расчёта его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: .

Расчёт -коэффициентов выполним по формулам

Получим уравнение

.

Для построения уравнения в естественной форме рассчитаем b 1 и b 2 используя формулы для перехода от к bi:

;

Значение а0 определим из соотношения

тогда

Для характеристики относительной силы влияния x 1 и x 2 на y рассчитаем средние коэффициенты эластичности:

С увеличением средней заработной платы x 1 на 1% от ёё среднего уровня средний душевой доход у возрастает на ……..% от своего среднего уровня; при повышении среднего возраста безработного x 2 на …….% среднедушевой доход у снижается на ……..% от своего среднего уровня. Сила влияния средней заработной платы x 1 на средний душевой доход у оказалась ………, чем сила влияния среднего возраста безработного x 2.

Сравним модули значений β1 и β2:

Различия в силе влияния фактора на результат, полученные при сравнении и βj, объясняются тем, что коэффициент эластичности исходит из соотношения средних: , а β-коэффициент - из соотношения средних квадратических отклонений: .

2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:

Если сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи коэффициенты парной и частной корреляции отличаются …………………………………….............................................................................

…………………………………………………………………………………………………….., то есть

Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и βj:

Зависимость y от x 1 и x 2 характеризуется как …………., в которой …….% вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно ………..% от общей вариации у.

3.Общий F- критерий проверяет гипотезу H 0 о статистической значимости уравнения регрессии и показателя тесноты связи (R 2 =0):

Сравнивая и , приходим к выводу о необходимости ………… гипотезу H 0, так как …… . С вероятностью 1-α=0,95 делаем заключение о статистической …………….. уравнения в целом и показателя тесноты связи , которые сформировались под …………………… воздействием факторов x 1 и x 2.

Частные F- критерии - и оценивают статистическую значимость присутствия факторов x 1 и x 2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение единого фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора x 1 после того, как в него был включен фактор x 2. Соответственно указывает на целесообразность включения в модель фактора x 2 после фактора x 1:

Сравнивая и , приходит к выводу о ………………. включения в модель фактора x 1 после фактора x 2, так как Гипотезу H 0 о несущественности прироста за счет включения дополнительного фактора x 1 после фактора x 2………………..

Целесообразность включения в модель фактора x 2 после фактора x 1 проверяет

Значение свидетельствует о статистической ………….. прироста за счет включения в модель фактора x 2 после фактора x 1. Следовательно, ……………… нулевая гипотеза H 0 о нецелесообразности включения в модель фактора x 2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является статистически ………………., ………………….. и что ……………………………………, включая дополнительный фактор x 2 (средний возраст безработного).

Задача 3. Имеются следующие данные по с/х предприятиям:

Посевная площадь, тыс. га Валовой сбор, тыс. т Внесено мин. удобрений, кг/га
       
    4,6  
  3,1 4,4  
  3,2 4,5  
  3,4 5,5  
  3,5 4,8  
  3,7 5,1  
  3,2 5,2  
  3,9    
  3,5 5,3  
    7,5  
  3,7 7,7  
    7,3  
  3,8    
    6,7  

Задание:

1) охарактеризуйте зависимость представленных показателей;

2) постройте уравнение множественной регрессии и определите его параметры;

3) оцените тесноту связи изучаемых показателей;

4) оцените значимость уравнения множественной регрессии (самостоятельно).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: