Отчёт по практической работе № 1

Федеральное агентство по образованию

Государственное образовательное учреждение высшего

профессионального образования

«НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

Кафедра теории рынка

ОТЧЁТ ПО ПРАКТИЧЕСКОЙ РАБОТЕ № 1

По учебной дисциплине «Эконометрика»

Вариант № 21

Факультет: Бизнеса

Специальность: Менеджмент

Группа: ФБ - 81

Выполнили: Телендий Т.В. Чернышева Е.В.

Проверил: Щеколдин В. Ю.

Дата сдачи: 01. 03.2010

Новосибирск 2010


Цель: закрепить знания по теории вероятности и математической статистике, касающиеся первичной обработки экспериментальных данных.

Задание:

  1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициент асимметрии и эксцесса), сделать предварительные выводы о свойствах выборки.
  2. Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номер и значения.
  3. Провести разбиение выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.
  4. Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и χ2-Пирсона.
  5. По результатам проведенного первичного эконометрического анализа сделать выводы и предложить рекомендации Робинзону.

Ситуация:

“Робинзон на охоте”. Каждый раз, отправляясь охотиться на уток, Робинзон берёт с собой флягу пива собственного приготовления, так как в условиях субтропиков ему постоянно хочется пить. При этом он отмечает, среднюю температуру в день охоты (в градусах Цельсия, Х3), количество убитых уток (в штуках, Х2) и сколько при этом было выпито пива (в процентах от объёма фляги, Х1).


Таблица 1

Исходные данные

x1 пиво х2утки   х3температ
       
       
       
       
       
       
       
       
       
       
       
         
       
         
         
         
         
         
         
         
         
         
         
         
         
         
         


N=25- объём выборок,

Х1- количество выпитого пива (в процентах от объёма фляги),

Х2- количество убитых уток (в штуках),

Х3- средняя температура в день охоты (в градусах Цельсия).

Ход работы:

  1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, смещённую и несмещённую дисперсии, коэффициент вариации, центральные и начальные моменты до четвёртого порядка включительно, коэффициенты асимметрии и эксцесса), сделать предварительные выводы о свойствах выборки.

Среднее значение выборки находится по формуле:

Оно равно: для 1= 49,76; 2= 5,16; 3 = 32,44 соответственно.

Рассчитаем отклонение i-ого наблюдения от среднего значения по формуле:

, где .

Полученные данные заносим в таблицу 2. Теперь мы знаем, отклонения от выборочного среднего, показателей Х1 X2 X3. Видно, что с увеличением показателя температуры, показатель объёма выпитого пива также увеличивается, при этом отрицательно влияя на показатель Х2 – количество убитых уток.

Таблица 2

d х1 d х2 d х3
-12,76 -0,16 -0,44
10,24 0,84 1,56
0,24 -1,16 -0,44
-37,76 5,84 -4,44
17,24 -2,16 2,56
-49,76 2,84 -5,44
-19,76 2,84 -0,44
-33,76 1,84 -2,44
2,24 -0,16 2,56
25,24 -1,16 0,56
35,24 -4,16 3,56
11,24 -2,16 2,56
37,24 -2,16 1,56
-29,76 1,84 -4,44
-40,76 3,84 -6,44
5,24 0,84 -0,44
38,24 -2,16 5,56
35,24 -4,16 2,56
18,24 -1,16 0,56
-2,76 0,84 0,56
16,24 -2,16 3,56
11,24 -1,16 2,56
4,24 -2,16 0,56
-9,76 0,84 -2,44
-30,76 3,84 -3,44

Смещённая оценка дисперсии находится по формуле:

S21   S22 S23
658,5024   6,2944 9,2064

Несмещённая оценка дисперсии находится по формуле:

S21   S22 S23
685,94   6,56 9,59


Коэффициент вариации находится по формуле:

где - выборочное среднеквадратическое отклонение, которое равно:

S1 S2 S3
26,20 2,56 3,10
V1 V2 V3
0,53 0,50 0,10

Далее рассчитаем центральные и начальные моменты до четвертого порядка включительно, по формуле:

m21 центр m22 центр m23 центр
658,5024 6,2944 9,2064
m31 центр m32 центр m33 центр
-4746,344 6,494592 -12,75763
m41 центр m42 центр m43 центр
878207,13 99,595986 203,5218

Формула для расчета начальных моментов:

m11 нач m12 нач m13 нач
49,76 5,16 32,44
m21 нач m22 нач m23 нач
3134,56 32,92 1061,56
m31 нач m32 нач m33 нач
     
216763,52 241,32 35021,56
m41 нач m42 нач m43 нач
  1948,12 1164126,5

Коэффициент асимметрии находим по формуле:

A1 A2 A3
-0,2808815 0,411264 -0,4567

Так как коэффициент асимметрии для Х1 положительный, значит доля того, что объём выпитого пива больше среднего, превышает долю того, что объём выпитого пива меньше среднего. Симметричность относительно среднего составляет 0,14, следовательно, асимметрия находится правее среднего на 0,14. Аналогичный вывод можно сделать для показателя Х3, т.е. в данной выборке преобладает температура выше среднего. Для показателя Х2 коэффициент асимметрии положительный, значит в большинстве случаев количество убитых уток было выше среднего, асимметрия находится правее среднего на 0,14.

Коэффициент эксцесса находим по формуле:

Э1 Э2 Э3
-0,97473 -0,48619 -0,59878


Так как коэффициент эксцесса для всех показателей отрицательный, то кривая каждого из данных распределений имеет более плоскую вершину, чем кривая нормального распределения и:

· Вероятность того, что количество дней, когда будет выпито пива около среднего, уменьшается.

· Вероятность того, что количество дней, когда будет убито уток около среднего, уменьшается.

· Вероятность того, что количество дней, когда температура будет около среднего, уменьшается.

.

2. Определить, присутствуют ли в выборке аномальные наблюдения. В случае обнаружения указать их номера и значения.

Для выделения аномального значения в выборке вычислим статистику:

, где max , .

X1* X2* X3*
     
     
=1,899929 =2,280716 =2,079584

Критическое значение из таблицы распределения Стьюдента t(α,N-2):

Рассчитаем критическое значение:

1,940608; 3,03

Далее проводим соотношение полученных данных с группами отклонений Для Х1:

;

1,899 < 1,940608;

Следовательно выполняется условие принадлежности ко 1 группе и наблюдение Х1* нельзя считать аномальным.

Проводим соотношение полученных данных с группами отклонений Для Х2

;

1,940608 < 2,280716 < 3,03

Следовательно выполняется условие принадлежности ко 2 группе и наблюдение Х2*=11 под № 5 может быть признано аномальным, но в пользу этого не имеется других соображений.

Проводим соотношение полученных данных с группами отклонений Для Х3

;

1,65 < 2,079584 < 3,03

Следовательно выполняется условие принадлежности ко 2 группе и наблюдение Х3*=26 под № 16 может быть признано аномальным, но в пользу этого не имеется других соображений.

  1. Провести разбиение выборки на классы, построить кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.

Количество классов было определено по формуле Штюргеса:

, целое число 5, следовательно выборка разбивается на 5 классов.

Размах вариации определяется по формуле:

∆ = max xi - min xi, где 1≤i≤n.

Получаем, что:

∆1 = 88 - 0 = 88.

∆2 = 11-1 = 10.

∆3 = 38-26=12.

Величина интервала определяется по формуле:

Получаем, что:

Таблица 3.

Таблица для вычисления значения статистики X2 пиво.

                 

 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [0;17,6)           1,970334   2,090783  
  [17,6;35,2)         4,504165   0,502316  
  [35,2;52,8)           6,548169   0,36603  
  [52,8;70,4)         6,056104   0,623955  
  [70,4;88]           3,562918   0,579639  
            22,64169   4,162723  
                     

Так как теоретические частоты 1 и 2 меньше 5 то проводим их объединение:

Таблица 3а.

                 

 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [0;35,2)           6,4745   0,042652  
  [35,2;52,8)           6,548169   0,36603  
  [52,8;70,4)         6,056104   0,623955  
  [70,4;88]           3,562918   0,579639  

 
            22,64169   1,612275  
                     

Таблица 4.

Таблица для вычисления значения статистики X2 утки

                 
 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [1;3)           3,649675   0,745663  
  [3;5)           6,99854   1,287234  
  [5;7)           7,344187   0,246023  
  [7;9)           4,217998   0,011267  
5 [9;11]           1,324367   2,120065  
              23,53477   4,410252  
                   

Таблица 4а.

Так как теоретические частоты 5 и 4 меньше 5 то проводим их объединение.

                 

 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [1;3)           3,649675   0,745663  
  [3;5)           6,99854   1,287234  
  [5;7)           7,344187   0,246023  
  [7;11]           5,542365   0,383356  
 
            23,53477   2,662276  

Таблица 5

Таблица для вычисления значения статистики X2 температура

                 
 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [26;28,4)           1,865385   2,442704  
  [28,4;30,8)         5,072752   0,846937  
  [30,8;33,2)           7,611655   0,019813  
  [33,2;35,6)         6,306944   0,076158  
  [35,6;38]           2,88471   0,004608  

 
            23,74145   3,390221  
                     

Построим кумулятивные линии значений X1 X2 X3:

Таблица 6

    Значения для кумулятивной линии  
x1                    
x2                    
x3                    

Рис.1 Кумулятивная линия по пиву

Рис. 2 Кумулятивная линия по уткам

Рис.3Кумулятивная линия по температуре


Далее строим гистограммы эмпирической функции распределения:

Таблица 7

Значения для гистограммы и полигона часот
  X1 X2 X3  
B1/N 0,16 0,08 0,16  
B2/N 0,12 0,4 0,12  
B3/N 0,2 0,24 0,32  
B4/N 0,32 0,16 0,28  
B5/N 0,2 0,12 0,12  
         
B1/(N*h) 0,009091 0,04 0,066667  
B2/(N*h) 0,006818 0,2 0,05  
B3/(N*h) 0,011364 0,12 0,133333  
B4/(N*h) 0,018182 0,08 0,116667  
B5/(N*h) 0,011364 0,06 0,05  
         
       
  х1 x2 x3  
R1 17,6   28,4  
R2 35,2   30,8  
R3 52,8   33,2  
R4 70,4   35,6  
R5        

Рис.4 Гистограмма выборки Х1

Рис.5 Гистограмма выборки Х2

Рис.6 Гистограмма выборки Х3


Сейчас необходимо построить полигон частот:

Рис.7 Полигон частот для выборки Х1

Рис.8 Полигон частот для выборки Х2

Рис.9 Полигон частот для выборки Х3

  1. Сформулировать и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и эксцессов X2- Пирсона

Анализ показателей асимметрии и эксцесса.

Несмещённые оценки показателей ассиметрии и эксцесса находим по формулам:

Таблица 8

Несмещенные оценки  
                 
                     
Асимметрии             Эксцесса      
G11   G12   G13     G21 G22   G23
-0,2991376   0,437994   -0,48639     -0,91746 -0,31498   -0,45384
                                   

Для проверки гипотезы о нормальности распределения следует также вычислить среднеквадратические отклонения для показателей ассиметрии и эксцесса:


Таблица 9

Среднеквадратические отклонения  
Асимметрии       Эксцесса  
S(G1)         S(G2)
0,463683501         0,901721
                     

Проверим следующие условия:

,

Условия выполняются одновременно для каждого из показателей, следовательно, гипотеза о нормальности исследуемых распределений не отклоняется. Однако это не значит, что они достоверны. Для получения более точных результатов используем другой критерий.

Воспользуемся критерием -Пирсона для проверки той же гипотезы.

ε = 0, 05, число степеней свободы Þ = 5, 99

Значение статистики вычисляется по формуле:

=

где Вi - наблюдаемая абсолютная частота и Еi- ожидаемая частота, вычисляемая в предположении о нормальном распределении значений фактора x.

Ожидаемая частота попадания в i -ый интервал равна:

Ei = = - Ф ,

где Ф - значение функции нормального распределения, вычисленное в точке z.


Таблица 10

Х1


                 
 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [0;35,2)           6,4745   0,042652  
  [35,2;52,8)           6,548169   0,36603  
  [52,8;70,4)         6,056104   0,623955  
  [70,4;88]           3,562918   0,579639  
            22,64169   1,612275  
                     

χ 2 расч.= 1,612275

< , значит основная гипотеза не отвергается.

Таблица 11

Х2

                 
 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [1;3)           3,649675   0,745663  
  [3;5)           6,99854   1,287234  
  [5;7)           7,344187   0,246023  
  [7;11]           5,542365   0,383356  
            23,53477   2,662276  
                     

χ 2 расч.= 2,662276

< , значит основная гипотеза не отвергается.


Таблица 12

Х3

                 

 
 
№ класса Границы интервала Наблюдаемая частота Bi Теоретическая частота Ei    
                     
  [26;28,4)           1,865385   2,442704  
  [28,4;30,8)         5,072752   0,846937  
  [30,8;33,2)           7,611655   0,019813  
  [33,2;35,6)         6,306944   0,076158  
  [35,6;38]           2,88471   0,004608  
            23,74145   3,390221  
                     

χ 2 расч.= 3,390221

< , значит основная гипотеза не отвергается.

1. По имеющимся результатам наблюдений для каждого показателя определили основные статистические характеристики (среднее, смещенную и несмещенную дисперсии, коэффициент вариации, центральные и начальные моменты до четвертого порядка включительно, коэффициент асимметрии и эксцесса).

Среднее значение выпиваемого Робинзоном пива составляет 49,76%

от объёма фляги. Разброс значений характеристики : (X1)=804,92 он в 252 раза больше разброса значений характеристики по уткам. (X2)=3,19 и в 73 раза большеразброса значений характеристики по температуре (X3)=10,94. Полученные результаты говорят о наибольшей нестабильности первой характеристики, так как она имеет наибольшие разбросы. Так как коэффициент асимметрии для Х1 положительный, значит доля того, что объём выпитого пива больше среднего, превышает долю того, что объём выпитого пива меньше среднего.

Среднее количество убиваемых Робинзоном уток составляет 5 штук в день. Коэффициент асимметрии положительный, значит, в большинстве случаев количество убитых уток было выше среднего. Кроме того, на количество убитых уток может температура.

Температура же в дни охоты в среднем составляла 32,20С. Этот показатель является сравнительно удобным и точным для прогнозирования.

2. Определили, присутствуют ли в выборке аномальные наблюдения. Указали их номер и значения.

3. Провели разбиение выборки на классы, построили кумулятивную линию эмпирического распределения, гистограмму и полигон частот выборки.

4. Сформулировали и проверить гипотезу о нормальном распределении выборочных данных на основе критериев коэффициентов асимметрии и χ2-Пирсона.

5. Для проверки гипотезы о нормальности распределения были использованы два критерия: коэффициентов асимметрии и эксцесса и χ2 – квадрат Пирсона. На основе расчетов первого критерия полученных, для всех 3-х характеристик был сделан вывод о том, что гипотезы не отвергаются. Второй показал что гипотезы о нормальности распределения X1 X2 отвергаются с вероятностью 95% а X3 отвергается с вероятностью 80%

Все возникающие противоречия можно объяснить, прежде всего, недостаточным количеством наблюдений выборки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: