Контрольная работа № 1
Вариант 1.
Анализ данных как составляющая часть принятия решений
Задание № 1
Определить с помощью метода Романовского принадлежность максимальных значений к выборкам, оценить однородность дисперсий и средних значений с использованием критерия Фишера и критерия Стьюдента.
Продолжительность рейса, дн.
Выборка:
1) 7,8,6,7,12,8,6,7,13,7,8,9,7,8,8
2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
Уровень значимость для 1-го варианта = 0,01
Для оценки принадлежности резко выделяющихся значений общей выборке рассчитывается величина ν:
ν = (Χ – Χ) / S,
где Χ – максимальное значение в выборке;
Χ– среднее значение;
S – среднеквадратичное отклонение;
Среднее значение и среднее квадратичное отклонение рассчитываем по формулам:
Χ = Σ Χ / n,
S = Ö1/(n-1)* Σ (Χ – Χ)²,
Где n – объем выборки.
Χ1 = 13 Χ2 = 9
Χ1 = 121 / 15 = 8,07 Χ2 = 114/ 15 =7,6
S1 = Ö 1/14*54,93 = Ö 3,92 = 1,98
|
|
S2 = Ö 1/14*13,6= Ö0,9714 = 0,986
ν1= (13-8,07) / 1,98 = 2,49
ν2= (9-7,6) / 0,986 = 1,42
να= 3,07
ν1 < να, следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.
ν2 < να, следовательно, гипотезу о принадлежности резко выделяющихся значения к выборке, не отклоняем.
Для сравнения дисперсий двух выборок по методу Фишера используется
F –распределение F (k1,k2), где k1 и k2 степени свободы, k1 = n – 1 и
k2 = n – 1.
Критерий Фишера рассчитывается по формуле:
F э = S²1 / S²2
Где S1> S2
F э = 3,92/0,972 = 4,03
F э таб = 2,4
При заначении F э, большим критерия Фишера, расхождение дисперсий существеенно, исследование необходимо прекратить и принять меры по корректировке данных.
Данные первой выборки можно откорректировать – заменив наибольшее значение выборки, на любое другое значение в данной выборке, например = 8.
Произведем расчеты для скорректированной выборки.
Х1 = 12
Продолжительность рейса, дн.
Выборка:
1) 7,8,6,7,12,8,6,7,8,7,8,9,7,8,8
2) 7,7,8,9,6,6,7,8,8,8,9,8,7,7,9
Χ1 = 116 / 15 = 7,73 Χ2 = 114/ 15 =7,6
S1 = Ö 1/14*28,4 = Ö 2,02 = 1,42
S2 = Ö 1/14*13,6= Ö0,9714 = 0,986
ν1= (12 – 7,73) / 1,42 = 3,001
ν2= (9-7,6) / 0,986 = 1,42
να= 3,07
ν1 < να, следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.
ν2 < να, следовательно гипотезу о принадлежности резко выделяющихся значения к выборке не отклоняем.
Для сравнения дисперсий двух выборок по методу Фишера используется
F –распределение F (k1,k2), где k1 и k2 степени свободы, k1 = n – 1 и
k2 = n – 1.
Критерий Фишера рассчитывается по формуле:
F э = S²1 / S²2
|
|
Где S1> S2
F э =2,02 /0,972 = 2,08
F э таб = 2,4
F э < F э таб, следовательно расхождение дисперсий носит случайный характер, выборки можно объединить в одну совокупность и приступить к оценке средних значений с помощью критерия Стьюдента.
Рассчитываем величину t:
t =(|Χ1 – Χ2| /Ö n1 * s1² + n2 * s2²)Ö n1 * n2 *(n1 + n2 – 2)/n1 + n2,
где s1²,s2² - смещенные оценки дисперсии
s² = 1/n Σ (Χi – Χ)²
s1² = 1/15 * 28,4 = 1,893
s2² = 1/15 * 13,6 = 0,906
t = 0.13/6,48 *√ 210 = 0,02*14.49 = 0.3
t таб = 1,32
t расч < t таб, следовательно, выборки данных являются непротиворечивыми и объединяются в одну совокупность.
Задание № 2
Сделать прогноз, используя метод наименьших квадратов и метод экспоненциального сглаживания. Произвести комбинированную оценку прогноза.
Объем перевозок автомобильным транспортом РФ, млн.т. = yt
Таблица 1
yt | 100 | 129 | 168 | 153 |
t | 1 | 2 | 3 | 4 |
Принимаем, что модель тренда является линейной.
y ٭ = a + b * t
a = ( Σ yi * Σ ti - Σ ti * Σ (yi * ti )) / n * Σ t²i - (Σ ti )²
b = (n * Σ(ti * yi) - Σ ti * Σ yi) / n * Σ t²i - (Σ ti )²
a = (550 * 30 – 10 * 1474) / 4 * 30 – 100 = 88
b = (4* 1474 – 10*550) / 4 * 30 – 100 = 19,8
a =88b = 19,8
y1 = 88 + 19,8*1 = 107,8
y2 = 88 + 19,8*2 = 127,6
y3 = 88 + 19,8*3 = 147,4
y4 = 88 + 19,8*4 = 167,2
Для определения основной ошибки прогноза используется зависимость:
st = √ Σ (y٭ – yt)² / n-1
st = √688,8/3 = 15,15
Для прогнозирования методом экспоненциального сглаживания используется полученная ранее линейная модель тренда, определяется параметр сглаживания
(α) и начальные условия (S¹0, S²0):
α = 2/ n+1
α = 0.4
S¹0 = a –((1- α )/ α) * b)
S²0 = a –((2*(1- α )/ α) * b)
S¹0 = 88 – 23,76=64,24
S²0 =88 – 59,4=28,6
Вычисляем экспоненциальные средние 1 и 2 порядка:
S¹t = α * yt +(1- α)* S¹t-1
S²t = α * S¹t + (1- α) * S²t-1,
а значения коэффициентов для «сглаженного» ряда:
a= 2* S¹t - S²t;
b= α / (1- α)*[ S¹t - S²t ]
Прогноз на t + l год определяется по формуле:
y´t+l = a+ b* l ,
где l – переменная «сглаженного» ряда.
Таблица 2
Период времени | Факт. значение | Расчетные значения | |||||
S¹t | S²t | a | b | yt | Δ y = yt- yt | ||
1 | 100 | ||||||
2 | 129 | 78,5 | 48,5 | 108,5 | 20 | 128,5 | -0,5 |
3 | 168 | 98,7 | 68,6 | 128,8 | 20,07 | 148,9 | -19,12 |
4 | 153 | 126,4 | 91,7 | 161,1 | 23,2 | 184,3 | 31,3 |
l =1 | - | 137,1 | 109,9 | 164,3 | 18,1 | 182,4 | - |
Ошибка прогноза рассчитывается по следующей формуле:
s=st√(α/(2-α)³)*[1+4*(1-α+5*(1-α)²)+2*α*(4-3*α)* l +2* α²* l ²]
s = 15,15* √1,285 = 17,17
yt+l =164,3+18,1* l
Расчет весовых коэффициентов прогнозов производится по формулам:
µ1 = s2² /(s1²+s2²)
µ2 = s1² /(s1²+s2²)
µ1 = 229,52/(294,8+229,52)=0,44
µ2 = 294,8/(294,8+229,52)=0,56
Среднее значение комбинированного прогноза определяется по формуле:
А٭ = Σ µi * Аi
А ٭= 0.44*167.2+0.56*182.4=175.71
Дисперсия комбинированного прогноза рассчитывается по формуле:
sА² = Σ µi * sAi²
sА² = 101+165.1=266.1
Контрольная работа № 2