Глава 3. Методы прогнозирования в статистике населения.
Приведем данные среднегодовой численности занятого населения
год | Тыс.чел. |
1998 | 2301,3 |
1999 | 2341,4 |
2000 | 2329,8 |
2001 | 2351,6 |
2002 | 2367,8 |
2003 | 2372,3 |
2004 | 2382 |
2005 | 2380,2 |
Построим показательный тренд
Приведем массив данных
Обозначим ln(f)=y, ln(a)=alpha, ln(b)=beta
Получим
Для регрессии вида найдем коэффициенты по формулам
Вычислим
Тогда
Откуда . Тогда линейная регрессия будет иметь вид . Смысл коэффициента beta заключается в том, что при изменении значения X на 1 единицу Y меняется на 0,0045 единиц
Параметры показательной регрессии
Нарисуем точки и показательную регрессию:
Дисперсионный анализ для линейной регрессии
Среднее Y
Остаточная вариация (RSS)
Общая вариация (TSS)
Объясняемая вариация (ESS)
Правило сложения дисперсий выполняется
Подсчитаем оценку дисперсии ошибки, т.е.
Среднее X . Найдем оценки дисперсий коэффициентов регрессии по формулам
Получим
Доверительные интервалы для оцененных параметров
уровень доверия . Количество степеней свободы 6. Критическое значение статистики Стьюдента
Доверительный интервал для beta
равен
Не можем на данном уровне значимости принять гипотезу beta=0 т.к. не попадает в доверительный интервал. Доверительный интервал для alpha
равен . Мы не можем на данном уровне значимости принять гипотезу alpha=0 т.к. не попадает в доверительный интервал.
Коэффициент корреляции
где
показывает, что связь сильна. Коэффициент детерминации
показывает, что регрессия объясняет 99,65 процентов вариации признака.
Убедимся в значимости модели с помощью статистики Фишера которая больше критического значения
Следовательно, регрессия значима. Проверим значимость коэффициента корреляции.
поэтому выборочный коэффициент корреляции значимо отличается от нуля.
Средняя ошибка аппроксимации
Колеблемость - это отклонения уровней динамического ряда от тренда, т.е. остатки регрессии. Найдем остатки регрессии (т.е. очищаем признак от тренда)
Нарисуем график остатков
Среднее линейное отклонение уровней ряда от тренда описывается показателем
т.е. среднее абсолютное отклонение от тренда равно
Амплитуда колебаний есть разность максимального и минимального отклонения и показывает максимальный разброс отклонений.
3.2 Множественный регрессионный анализ
Будем моделировать среднегодовую численность занятого населения с помощью показателей общей численности населения и миграционного прироста
Среднегодовая численность занятого населения | Общая численность населения | миграц прирост тыс |
2301,3 | 4769 | 13,763 |
2341,4 | 4746 | 1,886 |
2329,8 | 4716 | 13,618 |
2351,6 | 4696 | 8,39 |
2367,8 | 4661 | 11,57 |
2372,3 | 4628 | 10,571 |
2382 | 4596 | 7,915 |
2380,2 | 4640,3 | 5,086 |
Для регрессии вида найдем коэффициенты
Найдем обратную матрицу
Дополнительные миноры
Их определители
Союзная матрица
Союзная транспонированная матрица
Делим каждый элемент на определитель, получаем
β=
Уравнение регрессии имеет вид
нарисуем график
E(Y) | E(X1) | E(X2) |
2353,3 | 4681,538 | 9,099875 |
Коэффициенты эластичности
равны
Стандартизованные коэффициенты
Тогда
Парные коэффициенты корреляции
Частные коэффициенты корреляции
Множественный коэффициент корреляции
или
Ошибка множественного коэффициента корреляции
Найдем коэффициент детерминации
Проведем F-тест.
Регрессия значима.
Заключение.
На основании проведенных анализов в данной курсовой работе можно сделать ряд выводов и предложить решения проблем, возникших при анализировании данной темы.
Основными источниками данных о населении являются переписи населения, текущий статистический учет естественного и механического движения, выборочные социально-демографические и специальные обследования, списки (учеты) и регистры населения. Эти источники не заменяют, а взаимодополняют друг друга и образуют единую систему информации о населении.
Также в данной курсовой работе было выявлено, что на основе данных о составе определяется структура населения, показатели соотношения (координации) разных групп населения. Например, удельный вес мужчин и женщин в общей численности населения, доля городского и сельского населения; сколько женщин приходится на 1000 мужчин, сколько человек нетрудоспособного возраста приходится на 1000 человек трудоспособного возраста и др.
Сравнив построенные модели пронозироания в статистике, результат можно отобразить в следующей таблице:
Модель | R^2 | Амплитуда остатков | F статистика | a(t) | At) |
Показательная | 0,996 | 0,012 | 1750 | 0,0046 | 0,00045 |
множественная | 0,973 | 20,20 | 51,5383 | 6,225 | 3,89083 |
Показательная модель самая лучшая по всем критериям: у нее самый высокий R^2 и F-статисика, а показатели ошибок самые малые. Поэтому для прогнозирования следует использовать показательную модель. Как видим, зависимость только от времени является наиболее качественной среди рассмотренных моделей.
Список используемой литературы:
1. Елисеева И.И. Общая теория статистики: Учебник для ВУЗов. – М.: Финансы и статистика, 2000.
2. Ефимова М.Р. Общая теория статистики: Учебник.- М.: Финансы и статистика, 2002.
3. Ефимова М.Р. Практикум по общей теории статистики: Учебн. пособие.- М.: Финансы и статистика, 2006.
4. Козлов В.С., Эрлих Я.М., Долгушевский Ф.Г. Общая теория статистики: Учебник.- М.: Статистика, 2001.
5. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности. Учебник для ВУЗов.- М.: Финансы и статистика, 2004.
6. Общая теория статистики: Учебник/ Под ред. А.А. Спирина, О.Э. Башиной. - М.: Финансы и статистика, 2006.
7. Общая теория статистики: Учебник/ Под ред. А.М. Гольдберга, В.С. Козлова.- М.: Финансы и статистика, 2005.
8. Ряузов Н.Н. Общий курс статистики.- М.: Статистика, 2007.
9. Региональная статистика / Под редакцией Рябиева В.М., Чудилина Г.И.- М.:»МИД»,2001.
10. Статистический ежегодник. – Санкт-Петербург, 2006.
11. Голуб Л.А. Социально-экономическая статистика. – М.: Гуманитарный издательский центр ВЛАДОС, 2003
12.Статистический анализ состава населения г. Санкт-Петербурга – Под редацией Аралбаева.И А., Анютин Н.В.,2007.
13. Города и районы Санкт-Петербургской области: Статистический сборник / облкомстат – Санкт-Петербрг,2004.