Цель: Изучить основные методы определения зависимости между двумя временными рядами. Научиться строить уравнение линейной регрессии рядов с включенным в него фактором времени.
Рассмотрим следующий пример.
ПРИМЕР. Имеются данные о экспорте х и внешнеторговом обороте у некоторого государства за 16 месяцев:
Месяц | ||||||||||||||||
х | ||||||||||||||||
у |
Необходимо определить, существует ли линейная связь между факторами х и у (взять уровень значимости a=0,05), и оценить величину этой связи. Если связь имеется, то нужно построить уравнение линейной регрессии с включенным в него фактором времени.
Вводим исходные данные вместе с подписями в первые три столбца электронной таблицы в ячейки A1-С17. Построем графики рядов. Выделяем уровни рядов (ячейки В2-С17) и вызываем мастер диаграмм. Выбираем тип «График» и вид «График с маркерами» (второй сверху левый), нажимаем «Готово». Видно, что оба ряда имеют ярко выраженную тенденцию. Вычисляем коэффициент парной корреляции между данными. Для этого в ячейку В19 вводим подпись «Rxy=», а в соседнюю С19 функцию «ПИРСОН» (категория «Статистические»), аргументы которой «Массив 1» и «Массив 2» есть ссылки на значения факторов в ячейках В2-В17 и С2-С17 соответственно. Видно, что результат 0,994 очень высок, но это не значит, что между показателями имеется столь сильная связь, т.к. коэффициент линейной корреляции может быть завышен из-за наличии тенденции в каждом ряду (ложная корреляция). Для исключения воздействия фактора времени на формирование уровней ряда используют два способа исключения тенденции.
|
|
1. Метод отклонений от тренда. Для его реализации строится трендовая составляющая каждого ряда Т и вычисляется разность между уровнями ряда и трендом. Вводим в D1 подпись «Тх», в а D2 вводим функцию ТЕНДЕНЦИЯ, категория «Статистические», которая вычисляет линейную трендовую составляющую. Аргументы функции «Изв_знач_у» – ссылка на В2-В17, «Изв_знач_х» – ссылка на А2-А17, «Нов_знач_у» – вновь ссылка на А2-А17, «Константа» – единица. Обводим курсором, выделяя ячейки D2-D17, нажимаем F2 и Ctrl+Shift+Enter. Для нахождения тенденции фактора х вводим в Е1 подпись «Ту», в а Е2 вводим функцию ТЕНДЕНЦИЯ с аргументами «Изв_знач_у» – ссылка на С2-С17, «Изв_знач_х» – ссылка на А2-А17, «Нов_знач_у» – ссылка на А2-А17, «Константа» – единица. Выделяем ячейки Е2-Е17, нажимаем F2 и Ctrl+Shift+Enter. В следующих двух столбцах вычисляем разницу между уровнями ряда и трендом. Вводим в F1 и G1 подписи «х-Тх» и «у-Ту» соответственно, а в «F2» вводим формулу «=B2-D2». Автозаполняем ячейку на F2-G17. Вычислим теперь коэффициент линейной корреляции между полученными данными, лишенными тренда . Вводим в F19 подпись «r1», а в G19 функцию ПИРСОН, аргументы которой – ссылки на столбцы F2-F17 и G2-G17. Результат 0,711 меньше, чем между данными с трендовой составляющей, но он объективно показывает степень связи между факторами х и у. Проверим, можно ли принять статистическую гипотезу о значимости коэффициента корреляции (и, соответственно о наличии связи между факторами). Вводим в F20 подпись «t-критерий», а в G20 формулу в виде «=ABS(G19)*КОРЕНЬ(14/(1-G19*G19))». Вычисляем критическое значение критерия, с которым сравнивается t-статистика . Ниже в F21 вводим «t-критическое», а в G21 функцию СТЬЮДРАСПОБР (категория «Статистические»). Аргументы: «Вероятность» - уровень значимости 0,05, «Степени свободы» – n -2=14. Видно, что t-статистика больше критического значения, значит, коэффициент линейной корреляции значим и между факторами имеется статистическая связь.
|
|
2. Метод последовательных разностей. Для его реализации вычисляются разности между последовательными уровнями рядов, которые при линейной тенденции не зависят от тренда. Вводим в Н1 подпись «dx», а в I1 – «dy». В Н3 вводим формулу «=B3-B2» и автозаполнением переносим ее на Н3-I17. Вычисляем коэффициент линейной корреляции между рассчитанными разностями . Для этого в Н19 подпись «r2», а в I19 функцию ПИРСОН с аргументами H3-H17 и I3-I17. Результат 0,894 также меньше, чем между данными с трендовой составляющей. Проверим, можно ли принять статистическую гипотезу о значимости коэффициента корреляции . Вводим в Н20 подпись «t-критерий», а в I20 формулу «=ABS(I19)*КОРЕНЬ(14/(1-I19*I19))». Вычисляем критическое значение критерия, с которым сравнивается t-статистика . Ниже в Н21 вводим «t-критическое», а в G21 функцию СТЬЮДРАСПОБР с аргументами: «Вероятность» - 0,05, «Степени свободы» – 13 (одна степень теряется при вычислении разности). Видно, что t-статистика больше критического значения, что еще раз подтверждает предположение о наличии связи между факторами.
Построим теперь уравнение множественной регрессии , с включением в него фактора времени. Для этого переводим курсор в ячейку А23 и вводим в нее функцию ЛИНЕЙН, аргументы которой «Изв_знач_у» – ссылка на С2-с17, «Изв_знач_х» – ссылка на два столбца х и «Месяц» - А2-В17, «Константа» – единица, «Стат» - единица. Обводим курсором, выделяя массив в 3 столбца и 5 строк в ячейках А23-С27, нажимаем F2 и Ctrl+Shift+Enter. Проанализировав первую строку полученной матрицы, найдем из ячеек С23-А23 коэффициенты уравнения регрессии, а именно .
Задание на самостоятельную работу
Промышленная компания выпускает телефоны с определителем номера. Производятся две модели телефонов: дешевая версия АОН-21 и дорогая многофункциональная версия АОН-31. Имеются данные о количествах продаж обоих версий за 16 недель (в тыс. шт.) Необходимо определить, существует ли линейная связь между продажами версии АОН-21 (фактор х) и АОН-31 (фактор у, взять уровень значимости a=0,01), и оценить величину этой связи. Если связь имеется, то нужно построить уравнение линейной регрессии с включенным в него фактором времени.
Количество продаж АОН-21 (фактор х): одинаково для всех вариантов | ||||||||||||||||
Вариант | ||||||||||||||||
Количество продаж версии АОН-31 (фактор у): по вариантам | ||||||||||||||||
1. | ||||||||||||||||
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | ||||||||||||||||
5. | ||||||||||||||||
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
10. | ||||||||||||||||
11. | ||||||||||||||||
12. | ||||||||||||||||
13. | ||||||||||||||||
14. | ||||||||||||||||
15. |
|
|