Контрольная работа № 2

Контрольная работа № 1

Вариант 1.

Анализ данных как составляющая часть принятия решений

Задание № 1

Определить с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий и средних значений с использованием критерия Фишера и критерия Стьюдента.

Продолжительность рейса, дн.

Выборка:

1) 7,8,6,7,12,8,6,7,13,7,8,9,7,8,8

2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9

 

Уровень значимость для 1-го варианта = 0,01

 

Для оценки принадлежности резко выделяющихся значений общей выборке рассчитывается величина ν:

ν = (Χ – Χ) / S,

 

где Χ – максимальное значение в выборке;

  Χ– среднее значение;

  S – среднеквадратичное отклонение;

 

Среднее значение и среднее квадратичное отклонение рассчитываем по формулам:

 

Χ = Σ Χ / n,

S = Ö1/(n-1)* Σ (Χ – Χ)²,

 

Где n – объем выборки.

 

 

Χ1 = 13                Χ2  = 9

Χ1 = 121 / 15 = 8,07 Χ2  = 114/ 15 =7,6

S1 = Ö 1/14*54,93 = Ö 3,92 = 1,98

S2 = Ö 1/14*13,6= Ö0,9714 = 0,986

ν1= (13-8,07) / 1,98 = 2,49

ν2= (9-7,6) / 0,986 = 1,42

να= 3,07

ν1 < να, следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.

ν2 < να, следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.

 

 

Для сравнения дисперсий двух выборок по методу Фишера используется

F –распределение F (k1,k2), где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1.

Критерий Фишера рассчитывается по формуле:

 

F э = S²1 / S²2

 

Где S1> S2

F э = 3,92/0,972 = 4,03

F э таб = 2,4

При заначении F э, большим критерия Фишера, расхождение дисперсий существеенно, исследование необходимо прекратить и принять меры по корректировке данных.

Данные первой выборки можно откорректировать – заменив наибольшее значение выборки, на любое другое значение в данной выборке, например = 8.

Произведем расчеты для скорректированной выборки.

 

Х1 = 12

 

Продолжительность рейса, дн.

Выборка:

1) 7,8,6,7,12,8,6,7,8,7,8,9,7,8,8

2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9

 

Χ1 = 116 / 15 = 7,73  Χ2  = 114/ 15 =7,6

S1 = Ö 1/14*28,4 = Ö 2,02 = 1,42

S2 = Ö 1/14*13,6= Ö0,9714 = 0,986

 

ν1= (12 – 7,73) / 1,42 = 3,001

ν2= (9-7,6) / 0,986 = 1,42

να= 3,07

 

ν1 < να, следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.

 

ν2 < να, следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.

 

Для сравнения дисперсий двух выборок по методу Фишера используется

F –распределение F (k1,k2), где k1 и k2 степени свободы, k1 = n – 1 и

k2 = n – 1.

Критерий Фишера рассчитывается по формуле:

 

F э = S²1 / S²2

 

Где S1> S2

F э =2,02 /0,972 = 2,08

F э таб = 2,4

 

F э < F э таб, следовательно расхождение дисперсий носит случайный характер, выборки можно объединить в одну совокупность и приступить к оценке средних значений с помощью критерия Стьюдента.

Рассчитываем величину t:

t =(|Χ1 – Χ2| /Ö n1 * s1² + n2 * s2²)Ö n1 * n2 *(n1 + n2 – 2)/n1 + n2,

где s1²,s2² - смещенные оценки дисперсии

 

s² = 1/n Σ (Χi – Χ)²

s1² = 1/15 * 28,4 = 1,893

s2² = 1/15 * 13,6 = 0,906

t = 0.13/6,48 *√ 210 = 0,02*14.49 = 0.3

t таб = 1,32

t расч < t таб, следовательно, выборки данных являются непротиворечивыми и объединяются в одну совокупность.

Задание № 2

 

Сделать прогноз, используя метод наименьших квадратов и метод экспоненциального сглаживания. Произвести комбинированную оценку прогноза.

Объем перевозок автомобильным транспортом РФ, млн.т. = yt

Таблица 1

 

yt   100 129 168 153
t 1 2 3 4

 

 

Принимаем, что модель тренда является линейной.

y ٭ = a + b * t

a = ( Σ yi * Σ ti   - Σ ti * Σ (yi * ti  )) / n * Σ t²i    - (Σ ti  )²

b = (n * Σ(ti    * yi) - Σ ti   * Σ yi) / n * Σ t²i    - (Σ ti  )²

a = (550 * 30 – 10 * 1474) / 4 * 30 – 100  = 88

b = (4* 1474 – 10*550) / 4 * 30 – 100 = 19,8

a =88b = 19,8

y1 = 88 + 19,8*1 = 107,8

y2 = 88 + 19,8*2 = 127,6

y3 = 88 + 19,8*3 = 147,4

y4 = 88 + 19,8*4 = 167,2

 

 

Для определения основной ошибки прогноза используется зависимость:

 

 

st = √ Σ (y٭ – yt)² / n-1

st = √688,8/3 = 15,15

 

Для прогнозирования методом экспоненциального сглаживания  используется полученная ранее линейная модель тренда, определяется параметр сглаживания

(α) и начальные условия (S¹0, S²0):

 α = 2/ n+1

α = 0.4

S¹0 = a –((1- α )/ α) * b)

S²0 = a –((2*(1- α )/ α) * b)

S¹0 = 88 – 23,76=64,24

S²0 =88 – 59,4=28,6

Вычисляем экспоненциальные средние 1 и 2 порядка:

 

S¹t = α * yt +(1- α)* S¹t-1

S²t = α * S¹t + (1- α) * S²t-1,

а значения коэффициентов для «сглаженного» ряда:

 

a= 2* S¹t - S²t;

b= α / (1- α)*[ S¹t - S²t ]

Прогноз на t + l       год определяется по формуле:

y´t+l = a+ b* l  ,

где l   переменная «сглаженного» ряда.

 

 

Таблица 2

 

Период времени

Факт.

значение

Расчетные значения

S¹t S²t a b yt Δ y = yt- yt
1 100            
2 129 78,5 48,5 108,5 20 128,5 -0,5
3 168 98,7 68,6 128,8 20,07 148,9 -19,12
4 153 126,4 91,7 161,1 23,2 184,3 31,3
l =1 - 137,1 109,9 164,3 18,1 182,4 -

 

Ошибка прогноза рассчитывается по следующей формуле:

 

s=st√(α/(2-α)³)*[1+4*(1-α+5*(1-α)²)+2*α*(4-3*α)* l   +2* α²* l   ²]

s = 15,15* √1,285 = 17,17

yt+l =164,3+18,1* l                        

                                                                                                                                       

Расчет весовых коэффициентов прогнозов производится по формулам:

 

µ1 = s2² /(s1²+s2²)                                                                                           

µ2 = s1² /(s1²+s2²)

µ1 = 229,52/(294,8+229,52)=0,44

µ2 = 294,8/(294,8+229,52)=0,56

Среднее значение комбинированного прогноза определяется по формуле:

 

А٭ = Σ µi * Аi

А ٭= 0.44*167.2+0.56*182.4=175.71

Дисперсия комбинированного прогноза рассчитывается по формуле:

 

sА² = Σ µi * sAi²

sА² = 101+165.1=266.1

Контрольная работа № 2


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow