Определение и взаимосвязь основных параметров множественной регрессии и корреляции

Цель занятия — изучение методологии построения моделей множественной регрессии и корреляции, вычисления и анализа их показателей, оценки значимости, интерпретации.

Данная тема предполагает детальный анализ и усвоение основных формул, взаимозависимостей между показателями, характеризующими рассматриваемые модели, умение анализировать результаты. Рассчитываются показатели направления и тесноты связи, параметры уравнения множественной регрессии, критерии проверки статистических гипотез о значимости параметров и уравнения в целом.   

Задача 1 Для изучения рынка жилья в городе по данным о 46 коттеджах было построено уравнение множественной регрессии:

                 (1,80) (0,54)    (0,83)

где у – цена объекта, тыс. долл.;

х1 – расстояние до центра города, км;

х2 – полезная площадь объекта, м2;

х3 – число этажей в доме, ед.;

R2 – коэффициент множественной детерминации.

В скобках указаны значения стандартных ошибок для коэффициентов множественной регрессии.

Задание:

1 Проверьте гипотезу о том, что коэффициент регрессии b1 в генеральной совокупности равен нулю.

2 Проверьте гипотезу о том, что коэффициент регрессии b2 в генеральной совокупности равен нулю.

3 Проверьте гипотезу о том, что коэффициент регрессии b3 в генеральной совокупности равен нулю.

4 Проверьте гипотезу о том, что коэффициенты регрессии b1, b2, b3 в генеральной совокупности одновременно равны нулю (или что коэффициент детерминации равен нулю).

5 Поясните причины расхождения результатов, полученных в п.1, 2 и 3 с результатами, полученными в п.4.

Задача 2 При изучении влияния стоимости основных и оборотных средств на величину валового дохода по 7 торговым предприятиям были получены следующие данные (Таблица 4.1):

Таблица 4.1 Исходные данные

Номер

предприятия

Валовой доход за год, млн.руб.

Среднегодовая стоимость, млн.руб.

основных фондов оборотных средств
1 4,9 12 10
2 5,3 19 14
3 5,1 17 10
4 7,4 27 11
5 6,7 21 6
6 6,9 22 7
7 4,2 10 12

Постройте линейное уравнение множественной регрессии.

 

Задача 3 В результате исследования факторов, определяющих экономический рост, по 73 странам получено следующее уравнение регрессии:

                   (-5,90)  (4,34)   (3,91) (-0,79) (-2,70)

где  темпы экономического роста (темпы роста среднедушевого ВВП в % к базисному периоду);

 реальный среднедушевой ВВП, %;

 бюджетный дефицит, % к ВВП;

 объем инвестиций, % к ВВП;

 внешний долг, % к ВВП;

 уровень инфляции, %.

В скобках указаны фактические значения t – критерия для коэффициентов множественной регрессии.

Задание:

1 Проверьте гипотезу о достоверности полученной модели в целом.

2 До получения результатов этого исследования ваш однокурсник заключил с вами пари, что эмпирические результаты по данной модели докажут наличие обратной связи между темпами экономического роста и объемом внешнего долга страны (% к ВВП). Выиграл ли это пари ваш однокурсник?

 

Задача 4 По 20 предприятиям легкой промышленности получена следующая информация, характеризующая зависимость объема выпуска продукции (млн.руб.) у от количества отработанных за год человеко-часов (тыс. чел.-ч) х1 и среднегодовой стоимости производственного оборудования (млн.руб.) х2:

Таблица 4.2 Исходные данные

Уравнение регрессии
Множественный коэффициент корреляции 0,900
Сумма квадратов отклонений расчетных значений результата от фактических 3000

 Задание:

1 Определите коэффициент детерминации в этой модели.

2 Составьте таблицу результатов дисперсионного анализа.

3 Проанализируйте полученные результаты регрессионного анализа.

 

Задача 5 В процессе изучения влияния климатических условий на урожайность зерновых (ц/га) у по 25 территориям страны были отобраны две объясняющие переменные:

х1 – количество осадков в период вегетации (мм);

х2 – средняя температура воздуха (°С).

Матрица парных коэффициентов корреляции этих показателей имеет следующий вид:

  у х1 х2
у 1,0    
х1 0,6 1,0  
х2 -0,5 -0,9 1,0

Задание:

1 Определите частные коэффициенты корреляции результата с каждым из факторов. Прокомментируйте различие полученных парных и частных коэффициентов корреляции.

2 Исследователь, анализирующий данную зависимость, намерен определить на основе приведенной матрицы, какое уравнение регрессии лучше строить:

а) парную линейную регрессию у от х1;

б) парную линейную регрессию у от х2;

в) множественную линейную регрессию.

Как бы вы ответили на эти вопросы?

3 Постройте уравнение регрессии в стандартизованном масштабе и сделайте выводы.

 

Задача 6 По 30 наблюдениям матрица парных коэффициентов корреляции оказалась следующей:

  у х1 х2 х3
у 1,00      
х1 0,30 1,00    
х2 0,60 0,10 1,00  
х3 0,40 0,15 0,80 1,00

Задание:

1 Постройте уравнение регрессии в стандартизованном виде и сделайте выводы.

2 Определите показатель множественной корреляции (нескорректированный и скорректированный).

3 Оцените целесообразность включения переменной х1 в модель после введения в нее переменных х2 и х3.

 

Задача 7  Имеются следующие результаты регрессионного анализа зависимости объема выпуска продукции (млн.руб.) у от численности занятых на предприятии (чел.) х1 и среднегодовой стоимости основных фондов (млн.руб.) х2 по 20 предприятиям отрасли:

Таблица 4.3 Исходные данные

Коэффициент детерминации 0,810
Множественный коэффициент корреляции ???
Уравнение регрессии
Стандартные ошибки параметров              2    0,06      ???
t – критерий для параметров             1,5  ???         5 

Задание:

1 Напишите уравнение регрессии, характеризующее зависимость у от х1   и х2.

2 Восстановите пропущенные характеристики.

3 С вероятностью 0,95 постройте доверительные интервалы для коэффициентов регрессии.

4 Проанализируйте результаты регрессионного анализа.

 

Задача 8 По 30 предприятиям отрасли были получены следующие результаты регрессионного анализа зависимости объема выпуска продукции (млн.руб.) у от численности занятых на предприятии (чел.) х1 и среднегодовой стоимости основных фондов (млн.руб.) х2:

Таблица 4.4 Исходные данные

Коэффициент детерминации ???
Множественный коэффициент корреляции 0,850
Уравнение регрессии
Стандартные ошибки параметров                 2    0,06 ???
t – критерий для параметров               1,5     ???    4 

Задание:

1 Восстановите пропущенные характеристики.

2 С вероятностью 0,95 постройте доверительные интервалы для коэффициентов регрессии.

3 Проанализируйте результаты регрессионного анализа.

 

Задача 9 При анализе деятельности 20 фермерских хозяйств выявлена зависимость объема выпуска продукции растениеводства (млн.руб.) у от трех факторов: 1) численности работников (чел.) L; 2) количества минеральных удобрений на 1 га посева (кг) М; 3) количества осадков в период вегетации (г) R. Получены следующие варианты уравнений регрессии и доверительные интервалы для коэффициентов регрессии с 95%-ой вероятностью (в таблицах):

1-ый вариант:

Таблица 4.5 Доверительные интервалы по 1-ому варианту

Граница

Доверительные интервалы для коэффициентов регрессии при факторе

L M
Нижняя 0,4 ???
Верхняя ??? 1,4

 

 2-ой вариант:

Таблица 4.6 Доверительные интервалы по 2-ому варианту

Граница

Доверительные интервалы для коэффициентов регрессии

при факторе

L M R
Нижняя 0,1 ??? ???
Верхняя ??? 2,3 1,5

 

Задание:

1 Восстановите пропущенные границы доверительных интервалов в каждом уравнении.

2 Выберите наилучшее уравнение регрессии. Дайте интерпретацию их параметров и доверительных интервалов для коэффициентов регрессии.

3 Определите t –критерий Стьюдента для коэффициента регрессии при факторе R по 2-ом уравнении.

Задача 10 По 30 наблюдениям получены следующие данные:

Таблица 4.7 Исходные данные

Уравнение регрессии
Коэффициент детерминации 0,650
200
150
20
100

Задание:

1 Найдите скорректированный коэффициент корреляции, оцените значимость уравнения регрессии в целом.

2 Определите частные коэффициенты эластичности.

3 Оцените параметр a.                                                                                                                                                                

Контрольные вопросы по разделу

«Корреляционный анализ. Регрессионный анализ»

1 Как выглядит линейная модель парной регрессии? Как называют переменные, участвующие в модели?

2 Каковы причины отклонений линии регрессии от теоретической прямой?

3 Выведите формулы для расчета коэффициентов прямой парной регрессии по МНК.

4 Сформулируйте условия Гаусса Маркова в методе наименьших квадратов (МНК).

5 Приведите формулу расчета коэффициента детерминации R2 и объясните его роль при определении качества построенного уравнения регрессии.

6 Как производится проверка значимости уравнения регрессии по F-критерию Фишера?

7 Выведите формулы, связывающие теоретические коэффициенты модели с МНК-коэффициентами a и b, и докажите несмещенность МНК-оценок.

8 Выведите формулы для дисперсий и стандартных отклонений МНК-оценок. Покажите, что из этих формул следует состоятельность МНК-оценок.

9 Опишите алгоритм проверки значимости коэффициентов a и b с использованием стандартных выборочных ошибок коэффициентов и критерия Стьюдента.

10 Как строятся доверительные интервалы для прогноза Y по линейному уравнению регрессии? Какой выбирается уровень надежности прогноза? От каких факторов зависит ширина интервала прогноза? Почему точечный прогноз всегда необходимо дополнять интервальным?

11 Напишите линейную модель регрессии с k -факторами.

12 Какая матрица называется ковариационной матрицей случайного вектора Х, а какая корреляционной? В чем их отличие?

13 Каково условие однородности (гомоскедастичности) наблюдений?

14 Как посредством МНК получают систему нормальных уравнений? С какой целью составляется и решается система нормальных уравнений МНК?

15 Приведите формулу расчета коэффициентов регрессионного уравнения в методе наименьших квадратов.

16 Докажите несмещенность МНК-оценок коэффициентов модели.

17 Выведите формулу расчета дисперсий и средних квадратических ошибок МНК-коэффициентов модели. Что собой представляет матрица дисперсий-ковариаций векторов-столбцов матрицы наблюдений?

18 Как оценивается качество уравнения регрессии с помощью абсолютной и относительной ошибки аппроксимации?

19 Дайте определение коэффициента детерминации.

20 Как проводится дисперсионный анализ качества модели в случае многих факторов?

21 Как проверяется значимость коэффициентов регрессии?

22 Приведите формулы для расчета доверительного интервала функции регрессии и для индивидуальных значений зависимой переменной.

23 Почему коэффициент детерминации во многих случаях не может помочь при определении числа включаемых в модель переменных?

24 Дайте определение частного коэффициента корреляции. Какова его роль в процедуре шаговой регрессии последовательного включения (исключения) переменных?

25 В чем заключается проблема мультиколлинеарности факторов?

26 Опишите способы устранения мультиколлинеарности.

27 Какие переменные называются фиктивными, манекенными? Чем вызвана необходимость использования фиктивных переменных?

28 Дайте определение гетероскедастичности наблюдений.

29 Расскажите о тестировании гетероскедастичности на основе теста Голдфелда  Кванта.

30 Опишите, как применяется для обнаружения гетероскедастичности тест ранговой корреляции Спирмена.

31 В чем сходство и в чем различие тестов Парка, Глейзера, Уайта?

32 Каковы последствия гетероскедастичности в случае использования МНК для построения модели?

33 Опишите подходы к устранению гетероскедастичности, основанные на преобразовании исходных данных.

34 Сформулируйте теорему Айткена о коэффициентах обобщенного МНК.

35 Опишите алгоритм обобщенного метода наименьших квадратов (ОМНК) для построения уравнения регрессии в случае гетероскедастических наблюдений.

36 Какой должна быть функция регрессии, чтобы применить к ней МНК?

37 Что означает понятие «линеаризация модели»? Как она может быть произведена?

38 Какие нелинейные виды зависимости Вы знаете? Напишите функции данных зависимостей.

39 Как рассчитываются коэффициенты эластичности для нелинейных видов зависимостей?

40 Какой показатель служит для оценки тесноты связи между переменными в нелинейных зависимостях?




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: