Множественная регрессия

6. Ответьте на следующие вопросы, касающиеся множественной регрессии.

a) Какие три цели множественной регрессии вы можете указать?

    Целями множественной рег­рессии являются: (1) описание и понимание соответствующей взаимосвязи, (2) прогнозирование (предсказание) нового наблюдения, (3) регулирование и управ­ление процессом.

b) Какого рода данные требуются для множественной регрессии?

       Имеется совокупность результатов наблюдений. В этой совокупности один столбец соответствует показателю, для которого необходимо установить функциональную зависимость с параметрами объекта и среды, представленными остальными столбцами. Требуется: установить количественную взаимосвязь между показателем и факторами. В таком случае задача регрессионного анализа понимается как задача выявления такой функциональной зависимости y = f (x2, x3, …, xт), которая наилучшим образом описывает имеющиеся экспериментальные данные. Допущения:

- количество наблюдений достаточно для проявления статистических закономерностей относительно факторов и их взаимосвязей;

- обрабатываемые данные содержат некоторые ошибки (помехи), обусловленные погрешностями измерений, воздействием неучтенных случайных факторов;

- матрица результатов наблюдений является единственной информацией об изучаемом объекте, имеющейся в распоряжении перед началом исследования.

 

7. Ответьте на следующие вопросы, касающиеся уравнения регрессии.

a) Для чего используется это уравнение?

    Уравнение регрессии используется для построения линии регрессии. Последняя позволяет без специальных измерений определить любую среднюю величину (у) одного признака, если меняется величина (х) другого признака.

b) Откуда берется уравнение регрессии?

    При наличии корреляционной связи между факторными и результативными признаками нередко приходится устанавливать, на какую величину может измениться значение одного признака при изменении другого на общепринятую или установленную самим исследователем единицу измерения. Регрессия — функция, позволяющая по средней величине одного признака определить среднюю величину другого признака, корреляционно связанного с первым.

c) Как интерпретируется постоянный член уравнения регрессии?

    Как сдвиг, который равен значению, которое принимает У при X, равном 0.

d) Как интерпретируется коэффициент регрессии?

    Как наклон линии регрессии, который выражается в единицах измерения У на одну единицу X и характеризует крутизну подъема или спуска линии.

8. Опишите два критерия, свидетельствующие о качестве анализа множественной регрессии.

Ответ:

1. t-критерий:

       t-статистика соизмеряет значение коэффициента с его стандартной ошибкой. Фактически же мы проверяем гипотезу о том, равен нулю коэффициент при рассматриваемой переменной или нет. Т.е:

Ho: коэффициент=0. Если эта гипотеза верна, то коэффициент не значим.

Ha: коэффициент не равен 0. Если эта гипотеза верна, то коэффициент значим.

       Выяснить, отвергается нулевая гипотеза или нет, можно следующим способом:

a) Находим фактическое значение t:

t= , где

SE – стандартная ошибка коэффициента.

b) Определяем число степеней свободы

df.=n-k=25-2=23

n – число наблюдений

k – число оцененных параметров

c) Выбираем уровень значимости (т.е. вероятность ошибки): 1% или 5%.

d) Находим критическое значение по таблице: в таблице выбираем клетку в строке, соответствующей числу степеней свободы и в столбце, соответствующем выбранному уровню значимости.

e) Сравниваем фактическое значение с табличным:

       Если t > t , то коэффициент значим на выбранном уровне значимости. Т.е. нулевая гипотеза отвергается.

       Если t < t , то коэффициент не значим. Нулевая гипотеза не отвергается.

2. F-статистика:

       F- статистика представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы).

       Фактически проверяем гипотезу:

Но: все коэффициенты при независимых переменных равны нулю ()

На: хотя бы один из них нулю не равен.

       Выяснить, отвергается нулевая гипотеза или нет, можно следующим способом:

a) Рассчитываем фактическое по формуле:

F(k-1,n-k)= , где k - число объясняющих переменных.

b) Находим табличное:

· Выбираем уровень значимости α (1% или 5%)

· Вычисляем число степеней свободы: 1 и (n -2 ).

· По таблицам F- распределения Фишера определяем критическое значение F α, 1, n- 2 (всегда одностороннее)

c) Если F статистика(фактическое) > F α ,1,n- 2, то уравнение в целом является значимым при выбранном уровне значимости α.

d) В противном случае уравнение в целом незначимо (на данном уровне α).

 

9. О чем свидетельствует результат F-теста? Какое значение R2 (высокое или низкое) требуется, чтобы F-тест оказался значимым?

Ответ:

       Если значение F оказывается меньше, чем критическое значение в F -таблице, значит, соответствующая модель не является значимой. Если значение F оказывается больше, чем критическое значение в F- таблице,- соответствующая модель является значимой.

       Для того, чтобы F-тест оказался значимым требуется высокое значение R2.

 

10. Если F-тест незначим, можно ли продолжать анализ и тестировать отдельные коэффициенты регрессии?

Ответ:

       Если F -тест не является значимым, то использовать t -тесты для отдель­ных коэффициентов регрессии нельзя. В редких случаях эти t -тесты могут быть значимыми даже тогда, когда F -тест не является значимым.

 

11. Какой тест – F-тест или t-тест для отдельных коэффициентов регрессии – считается более важным при проведении анализа значимости модели множественной регрессии?

Ответ:

       F -тест считается более важным.

 

 

Временные ряды

12. В чем отличие скользящего среднего от исходного ряда? Какие компоненты сохраняются в скользящем среднем? Какие уменьшаются или вообще исчезают?

Ответ:

       Скользящее среднее представляет собой новый ряд, полученный путем усреднения соседних наблюдений временного ряда и перехода к следующему периоду времени – в итоге получается более гладкий ряд.

       В скользящем среднем сохраняются тренд и цикличность. Уменьшается нерегулярный компонент и исчезает сезонность.

 

13. Как внести сезонную поправку в значение временного ряда? Как вы интерпретируете полученный результат?

Ответ:

       Чтобы найти некоторое значение с поправкой на сезонные колебания, достаточно разделить исходные данные на сезонный индекс для соответствующего месяца или квартала.

       Поправка на сезонные колебания устраняет из результатов измерения ожидаемый сезонный компонент, что позволяет нам непосредственно сравнивать один квартал или месяц с другим (после внесения поправки на сезон), выявляя те или иные скрытые тенденции.

 

14. Как получить прогноз на основе линейного тренда?

Ответ:

       Для прогнозирования ряда, в котором учитывается поправка на сезонные колебания (переменная Y), используется период времени (переменная x). Результирующее уравнение регрессии будет представлять долгосрочный тренд. Подставляя будущие временные периоды в качестве новых значений x, получаем возможность экстраполировать эту долгосрочную тенденцию на будущее.

 

15. В чем разница между двумя видами рядов динамики – интервальными и моментными?

Ответ:

       В моментных рядах уровни выражают состояние явления на критический момент времени – начало месяца, квартала, года и т.д.Например, численность населения, численность работающих и т.д. В такихрядах каждый последующий уровень полностью или частично содержитзначение предыдущего уровня, поэтому суммировать уровни нельзя, таккак это приводит к повторному счету.

       В интервальных – уровни отражают состояние явления за определенный период времени – сутки, месяц, год и т.д. Это рядыпоказателей объема производства, объема продаж по месяцам года,количества отработанных человеко-дней и т.д.

 

16. Какие задачи стоят перед статистикой при изучении рядов динамики?

Ответ:

       При изучении рядов динамики статистика решает ряд задач:

1) измеряет абсолютную и относительную скорость роста либо снижения уровня за отдельные промежутки времени;

2) дает обобщающие характеристики уровня и скорости его изменения за тот или иной период;

3) выявляет и численно характеризует основные тенденции развития явления на отдельных этапах;

4) дает сравнительную числовую характеристику развития данного явления в разных регионах или на разных этапах;

5) выявляет факторы, обусловливающие изменение изучаемого явления во времени;

6) делает прогнозы развития явления в будущем.

 

17. Какие показатели используются для изучения интенсивности изменения уровней ряда во времени, приведите соответствующие формулы.

Ответ:

       Коэффициент роста, темп прироста и абсолютное значение 1% прироста характеризуют интенсивность изменения уровней ряда.

       Коэффициент роста показывает, во сколько раз уровень отчетного периода больше или меньше уровня базисного и рассчитывается как с переменной, так и с постоянной базой сравнения.

       С переменной базой сравнения , с постоянной базой сравнения . Коэффициент роста может быть больше единицы, меньше единицы, равен единице. Коэффициенты роста, выраженные в процентах, носят название темпов роста:

, .

       Темп прироста показывает, на сколько процентов уровень отчетного периода больше или меньше уровня базисного.

       При переменной базе сравнения:

или или .

При постоянной базе сравнения:

или .

       Абсолютное значение 1% прироста (А1%):

или .

 

Дисперсионный анализ

18. Назовите и прокомментируйте два источника вариации в однофакторном дисперсионном анализе.

Ответ:

       Межгрупповая вариация  показывает, насколько выборочные средние отличаются между собой. Она равна нулю, если средние равны и тем больше, чем сильнее различаются средние. Межгрупповая вариация рассчитывается как сумма квадратов отклонений групповых средних от общей средней.

       Внутригрупповая вариация   показывает, насколько отличаются между собой значения внутри выборок, и рассчитывается как сумма внутригрупповых квадратов отклонений

 

19. Опишите и приведите формулу для каждой из указанных ниже величин, которые используются в однофакторном дисперсионном анализе.

Ответ:

a) Общий размер выборки, n.

b) Общее (главное) среднее, Xср.

c) Межгрупповая вариация и соответствующее число степеней свободы.

d) Внутригрупповая вариация и соответствующее число степеней свободы.

e) F-статистика и соответствующее число степеней свободы.

, где

и

 Степень свободы для межгрупповой вариации составляет «k – 1», а для внутригрупповой вариации «n – k».

 

20. Эквивалентны ли следующие утверждения, если значение F-статистики меньше критического значения из F-таблицы:

a) Принять нулевую гипотезу H0 как приемлемую возможность;

b) Не принимать альтернативную гипотезу H1.

c) Средние выборок незначимо отличаются друг от друга;

d) Результат является статистически значимым.

Ответ: Да, эквиваленты.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: