Федеральное агентство по образованию
Государственное образовательное учреждение высшего
профессионального образования
«НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»
Кафедра теории рынка
ОТЧЁТ ПО ПРАКТИЧЕСКОЙ РАБОТЕ № 1
По учебной дисциплине «Эконометрика»
Вариант № 21
Факультет: Бизнеса
Специальность: Менеджмент
Группа: ФБ - 81
Выполнили: Телендий Т.В. Чернышева Е.В.
Проверил: Щеколдин В. Ю.
Дата сдачи: 01. 03.2010
Новосибирск 2010
Цель: закрепить знания по теории вероятности и математической статистике, касающиеся первичной обработки экспериментальных данных.
Задание:
- По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициент асимметрии и эксцесса), сделать предварительные выводы о свойствах выборки.
- Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номер и значения.
- Провести разбиение выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
- Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и χ2-Пирсона.
- По результатам проведенного первичного эконометрического анализа сделать выводы и предложить рекомендации Робинзону.
Ситуация:
|
|
“Робинзон на охоте”. Каждый раз, отправляясь охотиться на уток, Робинзон берёт с собой флягу пива собственного приготовления, так как в условиях субтропиков ему постоянно хочется пить. При этом он отмечает, среднюю температуру в день охоты (в градусах Цельсия, Х3), количество убитых уток (в штуках, Х2) и сколько при этом было выпито пива (в процентах от объёма фляги, Х1).
Таблица 1
Исходные данные
x1 пиво | х2утки | х3температ | ||
N=25- объём выборок,
Х1- количество выпитого пива (в процентах от объёма фляги),
|
|
Х2- количество убитых уток (в штуках),
Х3- средняя температура в день охоты (в градусах Цельсия).
Ход работы:
- По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, смещённую и несмещённую дисперсии, коэффициент вариации, центральные и начальные моменты до четвёртого порядка включительно, коэффициенты асимметрии и эксцесса), сделать предварительные выводы о свойствах выборки.
Среднее значение выборки находится по формуле:
Оно равно: для 1= 49,76; 2= 5,16; 3 = 32,44 соответственно.
Рассчитаем отклонение i-ого наблюдения от среднего значения по формуле:
, где .
Полученные данные заносим в таблицу 2. Теперь мы знаем, отклонения от выборочного среднего, показателей Х1 X2 X3. Видно, что с увеличением показателя температуры, показатель объёма выпитого пива также увеличивается, при этом отрицательно влияя на показатель Х2 – количество убитых уток.
Таблица 2
d х1 | d х2 | d х3 |
-12,76 | -0,16 | -0,44 |
10,24 | 0,84 | 1,56 |
0,24 | -1,16 | -0,44 |
-37,76 | 5,84 | -4,44 |
17,24 | -2,16 | 2,56 |
-49,76 | 2,84 | -5,44 |
-19,76 | 2,84 | -0,44 |
-33,76 | 1,84 | -2,44 |
2,24 | -0,16 | 2,56 |
25,24 | -1,16 | 0,56 |
35,24 | -4,16 | 3,56 |
11,24 | -2,16 | 2,56 |
37,24 | -2,16 | 1,56 |
-29,76 | 1,84 | -4,44 |
-40,76 | 3,84 | -6,44 |
5,24 | 0,84 | -0,44 |
38,24 | -2,16 | 5,56 |
35,24 | -4,16 | 2,56 |
18,24 | -1,16 | 0,56 |
-2,76 | 0,84 | 0,56 |
16,24 | -2,16 | 3,56 |
11,24 | -1,16 | 2,56 |
4,24 | -2,16 | 0,56 |
-9,76 | 0,84 | -2,44 |
-30,76 | 3,84 | -3,44 |
Смещённая оценка дисперсии находится по формуле:
S21 | S22 | S23 | |
658,5024 | 6,2944 | 9,2064 |
Несмещённая оценка дисперсии находится по формуле:
S21 | S22 | S23 | |
685,94 | 6,56 | 9,59 |
Коэффициент вариации находится по формуле:
где - выборочное среднеквадратическое отклонение, которое равно:
S1 | S2 | S3 |
26,20 | 2,56 | 3,10 |
V1 | V2 | V3 |
0,53 | 0,50 | 0,10 |
Далее рассчитаем центральные и начальные моменты до четвертого порядка включительно, по формуле:
m21 центр | m22 центр | m23 центр |
658,5024 | 6,2944 | 9,2064 |
m31 центр | m32 центр | m33 центр |
-4746,344 | 6,494592 | -12,75763 |
m41 центр | m42 центр | m43 центр |
878207,13 | 99,595986 | 203,5218 |
Формула для расчета начальных моментов:
m11 нач | m12 нач | m13 нач |
49,76 | 5,16 | 32,44 |
m21 нач | m22 нач | m23 нач |
3134,56 | 32,92 | 1061,56 |
m31 нач | m32 нач | m33 нач |
216763,52 | 241,32 | 35021,56 |
m41 нач | m42 нач | m43 нач |
1948,12 | 1164126,5 |
Коэффициент асимметрии находим по формуле:
A1 | A2 | A3 |
-0,2808815 | 0,411264 | -0,4567 |
Так как коэффициент асимметрии для Х1 положительный, значит доля того, что объём выпитого пива больше среднего, превышает долю того, что объём выпитого пива меньше среднего. Симметричность относительно среднего составляет 0,14, следовательно, асимметрия находится правее среднего на 0,14. Аналогичный вывод можно сделать для показателя Х3, т.е. в данной выборке преобладает температура выше среднего. Для показателя Х2 коэффициент асимметрии положительный, значит в большинстве случаев количество убитых уток было выше среднего, асимметрия находится правее среднего на 0,14.
Коэффициент эксцесса находим по формуле:
Э1 | Э2 | Э3 |
-0,97473 | -0,48619 | -0,59878 |
Так как коэффициент эксцесса для всех показателей отрицательный, то кривая каждого из данных распределений имеет более плоскую вершину, чем кривая нормального распределения и:
· Вероятность того, что количество дней, когда будет выпито пива около среднего, уменьшается.
· Вероятность того, что количество дней, когда будет убито уток около среднего, уменьшается.
· Вероятность того, что количество дней, когда температура будет около среднего, уменьшается.
.
2. Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номера и значения.
Для выделения аномального значения в выборке вычислим статистику:
, где max , .
X1* | X2* | X3* |
=1,899929 | =2,280716 | =2,079584 |
Критическое значение из таблицы распределения Стьюдента t(α,N-2):
Рассчитаем критическое значение:
|
|
1,940608; 3,03
Далее проводим соотношение полученных данных с группами отклонений Для Х1:
;
1,899 < 1,940608;
Следовательно выполняется условие принадлежности ко 1 группе и наблюдение Х1* нельзя считать аномальным.
Проводим соотношение полученных данных с группами отклонений Для Х2
;
1,940608 < 2,280716 < 3,03
Следовательно выполняется условие принадлежности ко 2 группе и наблюдение Х2*=11 под № 5 может быть признано аномальным, но в пользу этого не имеется других соображений.
Проводим соотношение полученных данных с группами отклонений Для Х3
;
1,65 < 2,079584 < 3,03
Следовательно выполняется условие принадлежности ко 2 группе и наблюдение Х3*=26 под № 16 может быть признано аномальным, но в пользу этого не имеется других соображений.
- Провести разбиение выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
Количество классов было определено по формуле Штюргеса:
, целое число 5, следовательно выборка разбивается на 5 классов.
Размах вариации определяется по формуле:
∆ = max xi - min xi, где 1≤i≤n.
Получаем, что:
∆1 = 88 - 0 = 88.
∆2 = 11-1 = 10.
∆3 = 38-26=12.
Величина интервала определяется по формуле:
Получаем, что:
Таблица 3.
Таблица для вычисления значения статистики X2 пиво.
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[0;17,6) | 1,970334 | 2,090783 | |||||||||
[17,6;35,2) | 4,504165 | 0,502316 | |||||||||
[35,2;52,8) | 6,548169 | 0,36603 | |||||||||
[52,8;70,4) | 6,056104 | 0,623955 | |||||||||
[70,4;88] | 3,562918 | 0,579639 | |||||||||
22,64169 | 4,162723 | ||||||||||
Так как теоретические частоты 1 и 2 меньше 5 то проводим их объединение:
Таблица 3а.
| |||||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||||
[0;35,2) | 6,4745 | 0,042652 | |||||||||||
[35,2;52,8) | 6,548169 | 0,36603 | |||||||||||
[52,8;70,4) | 6,056104 | 0,623955 | |||||||||||
[70,4;88] | 3,562918 | 0,579639 | |||||||||||
| 22,64169 | 1,612275 | |||||||||||
Таблица 4.
Таблица для вычисления значения статистики X2 утки
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[1;3) | 3,649675 | 0,745663 | |||||||||
[3;5) | 6,99854 | 1,287234 | |||||||||
[5;7) | 7,344187 | 0,246023 | |||||||||
[7;9) | 4,217998 | 0,011267 | |||||||||
5 | [9;11] | 1,324367 | 2,120065 | ||||||||
23,53477 | 4,410252 | ||||||||||
Таблица 4а.
Так как теоретические частоты 5 и 4 меньше 5 то проводим их объединение.
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[1;3) | 3,649675 | 0,745663 | |||||||||
[3;5) | 6,99854 | 1,287234 | |||||||||
[5;7) | 7,344187 | 0,246023 | |||||||||
[7;11] | 5,542365 | 0,383356 | |||||||||
| 23,53477 | 2,662276 |
Таблица 5
Таблица для вычисления значения статистики X2 температура
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[26;28,4) | 1,865385 | 2,442704 | |||||||||
[28,4;30,8) | 5,072752 | 0,846937 | |||||||||
[30,8;33,2) | 7,611655 | 0,019813 | |||||||||
[33,2;35,6) | 6,306944 | 0,076158 | |||||||||
[35,6;38] | 2,88471 | 0,004608 | |||||||||
| 23,74145 | 3,390221 | |||||||||
Построим кумулятивные линии значений X1 X2 X3:
Таблица 6
Значения для кумулятивной линии | ||||||||||
x1 | ||||||||||
x2 | ||||||||||
x3 |
Рис.1 Кумулятивная линия по пиву
Рис. 2 Кумулятивная линия по уткам
Рис.3Кумулятивная линия по температуре
Далее строим гистограммы эмпирической функции распределения:
Таблица 7
Значения для гистограммы и полигона часот | ||||
X1 | X2 | X3 | ||
B1/N | 0,16 | 0,08 | 0,16 | |
B2/N | 0,12 | 0,4 | 0,12 | |
B3/N | 0,2 | 0,24 | 0,32 | |
B4/N | 0,32 | 0,16 | 0,28 | |
B5/N | 0,2 | 0,12 | 0,12 | |
B1/(N*h) | 0,009091 | 0,04 | 0,066667 | |
B2/(N*h) | 0,006818 | 0,2 | 0,05 | |
B3/(N*h) | 0,011364 | 0,12 | 0,133333 | |
B4/(N*h) | 0,018182 | 0,08 | 0,116667 | |
B5/(N*h) | 0,011364 | 0,06 | 0,05 | |
х1 | x2 | x3 | ||
R1 | 17,6 | 28,4 | ||
R2 | 35,2 | 30,8 | ||
R3 | 52,8 | 33,2 | ||
R4 | 70,4 | 35,6 | ||
R5 |
Рис.4 Гистограмма выборки Х1
Рис.5 Гистограмма выборки Х2
Рис.6 Гистограмма выборки Х3
Сейчас необходимо построить полигон частот:
Рис.7 Полигон частот для выборки Х1
Рис.8 Полигон частот для выборки Х2
Рис.9 Полигон частот для выборки Х3
- Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и эксцессов X2- Пирсона
Анализ показателей асимметрии и эксцесса.
Несмещённые оценки показателей ассиметрии и эксцесса находим по формулам:
Таблица 8
Несмещенные оценки | |||||||||||||||||
Асимметрии | Эксцесса | ||||||||||||||||
G11 | G12 | G13 | G21 | G22 | G23 | ||||||||||||
-0,2991376 | 0,437994 | -0,48639 | -0,91746 | -0,31498 | -0,45384 | ||||||||||||
Для проверки гипотезы о нормальности распределения следует также вычислить среднеквадратические отклонения для показателей ассиметрии и эксцесса:
Таблица 9
Среднеквадратические отклонения | ||||||||||
Асимметрии | Эксцесса | |||||||||
S(G1) | S(G2) | |||||||||
0,463683501 | 0,901721 | |||||||||
Проверим следующие условия:
,
Условия выполняются одновременно для каждого из показателей, следовательно, гипотеза о нормальности исследуемых распределений не отклоняется. Однако это не значит, что они достоверны. Для получения более точных результатов используем другой критерий.
Воспользуемся критерием -Пирсона для проверки той же гипотезы.
ε = 0, 05, число степеней свободы Þ = 5, 99
Значение статистики вычисляется по формуле:
=
где Вi - наблюдаемая абсолютная частота и Еi- ожидаемая частота, вычисляемая в предположении о нормальном распределении значений фактора x.
Ожидаемая частота попадания в i -ый интервал равна:
Ei = = - Ф ,
где Ф - значение функции нормального распределения, вычисленное в точке z.
Таблица 10
Х1
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[0;35,2) | 6,4745 | 0,042652 | |||||||||
[35,2;52,8) | 6,548169 | 0,36603 | |||||||||
[52,8;70,4) | 6,056104 | 0,623955 | |||||||||
[70,4;88] | 3,562918 | 0,579639 | |||||||||
22,64169 | 1,612275 | ||||||||||
χ 2 расч.= 1,612275
< , значит основная гипотеза не отвергается.
Таблица 11
Х2
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[1;3) | 3,649675 | 0,745663 | |||||||||
[3;5) | 6,99854 | 1,287234 | |||||||||
[5;7) | 7,344187 | 0,246023 | |||||||||
[7;11] | 5,542365 | 0,383356 | |||||||||
23,53477 | 2,662276 | ||||||||||
χ 2 расч.= 2,662276
< , значит основная гипотеза не отвергается.
Таблица 12
Х3
| |||||||||||
№ класса | Границы интервала | Наблюдаемая частота Bi | Теоретическая частота Ei | ||||||||
[26;28,4) | 1,865385 | 2,442704 | |||||||||
[28,4;30,8) | 5,072752 | 0,846937 | |||||||||
[30,8;33,2) | 7,611655 | 0,019813 | |||||||||
[33,2;35,6) | 6,306944 | 0,076158 | |||||||||
[35,6;38] | 2,88471 | 0,004608 | |||||||||
23,74145 | 3,390221 | ||||||||||
χ 2 расч.= 3,390221
< , значит основная гипотеза не отвергается.
1. По имеющимся результатам наблюдений для каждого показателя определили основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициент асимметрии и эксцесса).
Среднее значение выпиваемого Робинзоном пива составляет 49,76%
от объёма фляги. Разброс значений характеристики : (X1)=804,92 он в 252 раза больше разброса значений характеристики по уткам. (X2)=3,19 и в 73 раза большеразброса значений характеристики по температуре (X3)=10,94. Полученные результаты говорят о наибольшей нестабильности первой характеристики, так как она имеет наибольшие разбросы. Так как коэффициент асимметрии для Х1 положительный, значит доля того, что объём выпитого пива больше среднего, превышает долю того, что объём выпитого пива меньше среднего.
Среднее количество убиваемых Робинзоном уток составляет 5 штук в день. Коэффициент асимметрии положительный, значит, в большинстве случаев количество убитых уток было выше среднего. Кроме того, на количество убитых уток может температура.
Температура же в дни охоты в среднем составляла 32,20С. Этот показатель является сравнительно удобным и точным для прогнозирования.
2. Определили, присутствуют ли в выборке аномальные наблюдения. Указали их номер и значения.
3. Провели разбиение выборки на классы, построили кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
4. Сформулировали и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и χ2-Пирсона.
5. Для проверки гипотезы о нормальности распределения были использованы два критерия: коэффициентов асимметрии и эксцесса и χ2 – квадрат Пирсона. На основе расчетов первого критерия полученных, для всех 3-х характеристик был сделан вывод о том, что гипотезы не отвергаются. Второй показал что гипотезы о нормальности распределения X1 X2 отвергаются с вероятностью 95% а X3 отвергается с вероятностью 80%
Все возникающие противоречия можно объяснить, прежде всего, недостаточным количеством наблюдений выборки.