БАЛТИЙСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ РЫБОПРОМЫСЛОВОГО ФЛОТА
Транспортный факультет
Кафедра: «Эксплуатация транспортно-технологических машин и комплексов»
КУРСОВАЯ РАБОТА
По дисциплине «Спец. главы математики»
Тема: «Методы анализа экспериментальных данных и методы классического регрессивного анализа в инженерном эксперименте»
(БГАРФ. 23.03.03 – ЭТМбз-2.)
Выполнил: Специальность: Курс: Шифр: Проверил | Шустов М.В. Эксплуатация транспортно-технологических машин и комплексов Корнева И.П. |
Калининград
Задача 1. По данным выборки:
1) построить статистический ряд распределения;
2) изобразить гистограмму;
3 ) вычислить выборочное среднее;
4) вычислить выборочную дисперсию.
Решение:
- Выборка размером 100 чисел. Для начала найдем минимальное и максимальное числа в этой выборке. Минимум – 0,2, максимум – 5,4. Тогда размах выборки R = 5,4-0,2 = 5,2. Определим число интервалов, на которые будем разбивать выборку: Длина одного интервала определяется по формуле h = R/k = 5,2/8 = 0,65.
Зная на сколько интервалов (8) какой длины (0,65) нужно разбивать выборку, сделаем это.
Номер инт | Интервал | Частоты | Середины | Относит. Частоты |
0,2-0,85 | 0,525 | 0,03 | ||
0,85-1,5 | 1,175 | 0,03 | ||
1,5-2,15 | 1,825 | 0,12 | ||
2,15-2,8 | 2,475 | 0,25 | ||
2,8-3,45 | 3,125 | 0,29 | ||
3,45-4,1 | 3,775 | 0,16 | ||
4,1-4,75 | 4,425 | 0,08 | ||
4,75-5,4 | 5,075 | 0,04 | ||
Всего |
Итак – сгруппировали выборку и записали ряды частот – построили статистический ряд распределения.
Гистограмма – это график, представленный в виде диаграммы со столбцами вместо точек, высоты которых равны cответствующим частотам:
- Далее найдем некоторые числовые характеристики.
Номер инт | Интервал | Частоты | Середины | Относит. Частоты | mi*xi | mi*(xi-xср)^2 |
0,2-0,85 | 0,525 | 0,03 | 1,575 | 17,729 | ||
0,85-1,5 | 1,175 | 0,03 | 3,525 | 4,142 | ||
1,5-2,15 | 1,825 | 0,12 | 21,9 | 39,968 | ||
2,15-2,8 | 2,475 | 0,25 | 61,875 | 153,141 | ||
2,8-3,45 | 3,125 | 0,29 | 90,625 | 283,203 | ||
3,45-4,1 | 3,775 | 0,16 | 60,4 | 228,010 | ||
4,1-4,75 | 4,425 | 0,08 | 35,4 | 156,645 | ||
4,75-5,4 | 5,075 | 0,04 | 20,3 | 1041,420 | ||
Всего | 2,956 | 19,243 |
Задача 2. Используя метод наименьших квадратов, найти параметры зависимости
1) в предположении, что эта зависимость линейна;
2) в предположении, что зависимость нелинейная, выбрав по форме данных ее наиболее вероятный вид;
а) указать а и в для линейной зависимости;
б) форму нелинейной зависимости;
в) а и в для нелинейной зависимости;
г) величины средних квадартических отклонений для линейного и нелинейного случаев.
Решение:
Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.
Совокупность точек результативного и факторного признаков называется полем корреляции.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Здесь ε - случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Для оценки параметров α и β - используют МНК (метод наименьших квадратов).
Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии. Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (ε) и независимой переменной (x).
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x | y | x2 | y2 | x • y |
16.9 | 285.61 | 33.8 | ||
19.5 | 380.25 | 58.5 | ||
24.5 | 600.25 | |||
35.2 | 1239.04 | 211.2 | ||
41.3 | 1705.69 | 289.1 | ||
48.2 | 2323.24 | 385.6 | ||
64.6 | 4173.16 | |||
72.3 | 5227.29 | 795.3 | ||
410.5 | 20144.53 | 3185.5 |
Для наших данных система уравнений имеет вид
10a + 65 b = 410.5
65 a + 505 b = 3185.5
Домножим уравнение (1) системы на (-6.5), получим систему, которую решим методом алгебраического сложения.
-65a -422.5 b = -2668.25
65 a + 505 b = 3185.5
Получаем:
82.5 b = 517.25
Откуда b = 6.2697
Теперь найдем коэффициент «a» из уравнения (1):
10a + 65 b = 410.5
10a + 65 • 6.2697 = 410.5
10a = 2.97
a = 0.297
Получаем эмпирические коэффициенты регрессии: b = 6.2697, a = 0.297
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 6.2697 x + 0.297
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
1. Параметры уравнения регрессии.
Выборочные средние.
x ср – 6,5;
У ср – 41,05;
Среднеквадратическое отклонение
S(x) – 2.872;
S(y) – 18.148.
Нелинейная зависимость:
СистемауравненийМНК:
a0n + a1∑x + a2∑x2 = ∑y
a0∑x + a1∑x2 + a2∑x3 = ∑yx
a0∑x2 + a1∑x3 + a2∑x4 = ∑yx2
x | y | x2 | y2 | x y | x3 | x4 | x2 y |
16.9 | 285.61 | 33.8 | 67.6 | ||||
19.5 | 380.25 | 58.5 | 175.5 | ||||
24.5 | 600.25 | ||||||
35.2 | 1239.04 | 211.2 | 1267.2 | ||||
41.3 | 1705.69 | 289.1 | 2023.7 | ||||
48.2 | 2323.24 | 385.6 | 3084.8 | ||||
64.6 | 4173.16 | ||||||
72.3 | 5227.29 | 795.3 | 8748.3 | ||||
410.5 | 20144.53 | 3185.5 | 27611.1 |
Для наших данных система уравнений имеет вид
10a0 + 65a1 + 505a2 = 410.5
65a0 + 505a1 + 4355a2 = 3185.5
505a0 + 4355a1 + 39973a2 = 27611.1
Получаем a2 = 0.297, a1 = 2.414, a0 = 10.381
Уравнение регрессии:
y = 0.297x2+2.414x+10.381.
Задача 3. По данным выборки, удовлетворяющей нормальному закону распределения, вычислить:
1) выборочное среднее;
2) исправленное выборочное среднее квадратическое отклонение;
3) доверительный интервал для математического ожидания для доверительной вероятности гамма;
4) доверительный интервал для среднего квадратического отклонения для того же значения гамма.
Решение:
18,3 |
15,5 |
24,5 |
24,7 |
13,3 |
15,4 |
10,1 |
23,1 |
19,3 |
5,7 |
11,6 |
14,3 |
4,5 |
20,3 |
32,3 |
Дисперсия D = σ2 = 4.62 = 21.16
Доверительный интервал для генерального среднего.
Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента
По таблице Стьюдента находим:
Tтабл (n-1;α/2) = (16;0.025) = 2.131
С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала (14,45;19,35).
Доверительный интервал для среднеквадратического отклонения.
S(1-q) < σ < S(1+q)
Найдем доверительный интервал для среднеквадратического отклонения с надежностью γ = 0.95 и объему выборки n = 16
По таблице q=q(γ; n) определяем параметр q(0.95;16) = 0.37
4.6(1-0.37) < σ < 4.6(1+0.37)
2.898 < σ < 6.302
Таким образом, интервал (2.898;6.302) покрывает параметр σ с надежностью γ = 0.95
Задача 4. По данным выборки, удовлетворяющей нормальному закону распределения со средним квадратическим отклонением, вычислить:
1) выборочное среднее;
2) доверительный интервал для математического ожидания для доверительной вероятности гамма.
Решение:
38,3 | 27,8 | 26,3 | 19,6 |
26,1 | 23,8 | 40,8 | |
10,5 | 19,8 | 37,3 | 18,4 |
26,9 | 24,7 | 25,1 | 30,1 |
25,4 | 29,2 | 17,4 | 26,1 |
12,1 | 24,4 | 37,1 | |
12,3 | 5,6 | 29,6 | 40,3 |
15,1 | 19,4 | 27,9 | 27,4 |
30,1 | 30,1 | 20,1 | |
21,6 | 15,3 | 6,2 | 29,2 |
23,5 | 8,4 | 20,8 | |
14,2 | 31,5 | ||
21,4 | 22,8 | 19,2 | 34,7 |
24,1 | 30,8 | 20,9 | 5,1 |
26,6 | 36,2 | 24,6 | |
25,8 | 22,2 | 8,1 | |
12,7 | 20,5 | 12,7 | 33,7 |
15,2 | 14,1 | 15,5 | 32,2 |
32,9 | 18,6 | 19,6 | 10,3 |
22,1 | 14,7 | 24,5 | |
25,7 | 24,1 | 24,2 | 12,6 |
13,6 | 26,9 | 35,4 | |
27,8 | 26,2 | 34,7 | 28,4 |
22,8 | 8,8 | 25,1 | 11,1 |
10,1 | 22,5 | 14,1 | 33,4 |
Доверительный интервал для генерального среднего.
Поскольку n>30, то определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.99/2 = 0.495
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.495
tkp(γ) = (0.495) = 2.58
(20.78;25.42)
С вероятностью 0.99 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Задача 5. По данным выборки двумерной случайной величины определить:
1) вектор математического ожидания;
2) вектор дисперсии;
3) выборочный коэффициент корреляции;
4) выборочное уравнение прямой оинии регрессии у на х.
Решение:
x | y |
41,2 | 116,5 |
48,1 | 124,6 |
53,2 | 153,9 |
39,1 | |
50,2 | 191,6 |
94,9 | |
39,4 | 100,2 |
50,2 | 178,6 |
48,3 | 118,7 |
39,6 | |
41,3 | 81,7 |
35,2 | |
47,9 | 159,4 |
34,6 | 124,4 |
33,2 | 103,4 |
35,7 | 94,9 |
36,8 | 90,8 |
50,8 | 180,5 |
44,5 | |
46,3 | 167,6 |
34,8 | 84,6 |
39,2 | 124,5 |
36,8 | 131,7 |
99,8 | |
40,4 | 144,8 |
41,5 | 120,6 |
44,5 | 109,7 |
38,9 | 93,5 |
49,8 | 136,8 |
45,6 | 107,6 |
102,9 | |
47,6 | 102,9 |
32,5 | 116,7 |
54,1 | 157,9 |
35,4 | 109,1 |
37,9 | 92,4 |
38,6 | 120,7 |
35,6 | 96,1 |
33,6 | 73,2 |
27,7 | 61,5 |
47,1 | |
29,9 | 82,8 |
50,1 | 110,5 |
Составим вспомогательную таблицу:
x | y | x^2 | y^2 | x*y |
41,2 | 116,5 | 1697,44 | 13572,25 | 4799,8 |
48,1 | 124,6 | 2313,61 | 15525,16 | 5993,26 |
53,2 | 153,9 | 2830,24 | 23685,21 | 8187,48 |
39,1 | 1528,81 | 3870,9 | ||
50,2 | 191,6 | 2520,04 | 36710,56 | 9618,32 |
94,9 | 9006,01 | 3701,1 | ||
39,4 | 100,2 | 1552,36 | 10040,04 | 3947,88 |
50,2 | 178,6 | 2520,04 | 31897,96 | 8965,72 |
48,3 | 118,7 | 2332,89 | 14089,69 | 5733,21 |
39,6 | 1568,16 | 4633,2 | ||
41,3 | 81,7 | 1705,69 | 6674,89 | 3374,21 |
35,2 | 1239,04 | 3097,6 | ||
47,9 | 159,4 | 2294,41 | 25408,36 | 7635,26 |
34,6 | 124,4 | 1197,16 | 15475,36 | 4304,24 |
33,2 | 103,4 | 1102,24 | 10691,56 | 3432,88 |
35,7 | 94,9 | 1274,49 | 9006,01 | 3387,93 |
36,8 | 90,8 | 1354,24 | 8244,64 | 3341,44 |
50,8 | 180,5 | 2580,64 | 32580,25 | 9169,4 |
44,5 | 1980,25 | |||
46,3 | 167,6 | 2143,69 | 28089,76 | 7759,88 |
34,8 | 84,6 | 1211,04 | 7157,16 | 2944,08 |
39,2 | 124,5 | 1536,64 | 15500,25 | 4880,4 |
36,8 | 131,7 | 1354,24 | 17344,89 | 4846,56 |
99,8 | 9960,04 | 4590,8 | ||
40,4 | 144,8 | 1632,16 | 20967,04 | 5849,92 |
41,5 | 120,6 | 1722,25 | 14544,36 | 5004,9 |
44,5 | 109,7 | 1980,25 | 12034,09 | 4881,65 |
38,9 | 93,5 | 1513,21 | 8742,25 | 3637,15 |
49,8 | 136,8 | 2480,04 | 18714,24 | 6812,64 |
45,6 | 107,6 | 2079,36 | 11577,76 | 4906,56 |
102,9 | 10588,41 | 3395,7 | ||
47,6 | 102,9 | 2265,76 | 10588,41 | 4898,04 |
32,5 | 116,7 | 1056,25 | 13618,89 | 3792,75 |
54,1 | 157,9 | 2926,81 | 24932,41 | 8542,39 |
35,4 | 109,1 | 1253,16 | 11902,81 | 3862,14 |
37,9 | 92,4 | 1436,41 | 8537,76 | 3501,96 |
38,6 | 120,7 | 1489,96 | 14568,49 | 4659,02 |
35,6 | 96,1 | 1267,36 | 9235,21 | 3421,16 |
33,6 | 73,2 | 1128,96 | 5358,24 | 2459,52 |
27,7 | 61,5 | 767,29 | 3782,25 | 1703,55 |
47,1 | 2218,41 | 4474,5 | ||
29,9 | 82,8 | 894,01 | 6855,84 | 2475,72 |
50,1 | 110,5 | 2510,01 | 12210,25 | 5536,05 |
41,3 | 116,98 | 1748,841 | 14562,22 | 4964,156 |
Уравнение регрессии:
Задача 6. По данным 2 выборок вычислить коэффициенты ранговой корреляции Спирмена и Кендалла.
Решение:
Присвоим ранги признаку Y и фактору X.
X | Y | ранг X, dx | ранг Y, dy |
Матрица рангов.
ранг X, dx | ранг Y, dy | (dx - dy)2 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X умеренная и обратная
Коэффициент Кендэла.
Упорядочим данные по X.
В ряду Y справа от 1 расположено 17 рангов, превосходящих 1, следовательно, 1 породит в Р слагаемое 17.
Справа от 2 стоят 16 ранга, превосходящих 2 (это 14, 12, 10, 11, 7, 18, 15, 17, 16, 13, 8, 5, 9, 6, 3, 4), т.е. в Р войдет 16 и т.д. В итоге Р = 66 и с использованием формул имеем:
X | Y | ранг X, dx | ранг Y, dy | P | Q |
По упрощенным формулам: