БАЛТИЙСКАЯ ГОСУДАРСТВЕННАЯ АКАДЕМИЯ РЫБОПРОМЫСЛОВОГО ФЛОТА
Транспортный факультет
Кафедра: «Эксплуатация транспортно-технологических машин и комплексов»
КУРСОВАЯ РАБОТА
По дисциплине «Спец. главы математики»
Тема: «Методы анализа экспериментальных данных и методы классического регрессивного анализа в инженерном эксперименте»
(БГАРФ. 23.03.03 – ЭТМбз-2.)
| Выполнил: Специальность: Курс: Шифр: Проверил | Шустов М.В. Эксплуатация транспортно-технологических машин и комплексов Корнева И.П. |
Калининград
Задача 1. По данным выборки:
1) построить статистический ряд распределения;
2) изобразить гистограмму;
3 ) вычислить выборочное среднее;
4) вычислить выборочную дисперсию.
Решение:
- Выборка размером 100 чисел. Для начала найдем минимальное и максимальное числа в этой выборке. Минимум – 0,2, максимум – 5,4. Тогда размах выборки R = 5,4-0,2 = 5,2. Определим число интервалов, на которые будем разбивать выборку:
Длина одного интервала определяется по формуле h = R/k = 5,2/8 = 0,65.
Зная на сколько интервалов (8) какой длины (0,65) нужно разбивать выборку, сделаем это.
| Номер инт | Интервал | Частоты | Середины | Относит. Частоты |
| 0,2-0,85 | 0,525 | 0,03 | ||
| 0,85-1,5 | 1,175 | 0,03 | ||
| 1,5-2,15 | 1,825 | 0,12 | ||
| 2,15-2,8 | 2,475 | 0,25 | ||
| 2,8-3,45 | 3,125 | 0,29 | ||
| 3,45-4,1 | 3,775 | 0,16 | ||
| 4,1-4,75 | 4,425 | 0,08 | ||
| 4,75-5,4 | 5,075 | 0,04 | ||
| Всего |
Итак – сгруппировали выборку и записали ряды частот – построили статистический ряд распределения.
Гистограмма – это график, представленный в виде диаграммы со столбцами вместо точек, высоты которых равны cответствующим частотам:

- Далее найдем некоторые числовые характеристики.

| Номер инт | Интервал | Частоты | Середины | Относит. Частоты | mi*xi | mi*(xi-xср)^2 |
| 0,2-0,85 | 0,525 | 0,03 | 1,575 | 17,729 | ||
| 0,85-1,5 | 1,175 | 0,03 | 3,525 | 4,142 | ||
| 1,5-2,15 | 1,825 | 0,12 | 21,9 | 39,968 | ||
| 2,15-2,8 | 2,475 | 0,25 | 61,875 | 153,141 | ||
| 2,8-3,45 | 3,125 | 0,29 | 90,625 | 283,203 | ||
| 3,45-4,1 | 3,775 | 0,16 | 60,4 | 228,010 | ||
| 4,1-4,75 | 4,425 | 0,08 | 35,4 | 156,645 | ||
| 4,75-5,4 | 5,075 | 0,04 | 20,3 | 1041,420 | ||
| Всего | 2,956 | 19,243 |


Задача 2. Используя метод наименьших квадратов, найти параметры зависимости 
1) в предположении, что эта зависимость линейна;
2) в предположении, что зависимость нелинейная, выбрав по форме данных ее наиболее вероятный вид;
а) указать а и в для линейной зависимости;
б) форму нелинейной зависимости;
в) а и в для нелинейной зависимости;
г) величины средних квадартических отклонений для линейного и нелинейного случаев.
Решение:
Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.
Совокупность точек результативного и факторного признаков называется полем корреляции.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ε, где ei – наблюдаемые значения (оценки) ошибок εi, а и b соответственно оценки параметров α и β регрессионной модели, которые следует найти.
Здесь ε - случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления – это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Для оценки параметров α и β - используют МНК (метод наименьших квадратов).
Метод наименьших квадратов дает наилучшие (состоятельные, эффективные и несмещенные) оценки параметров уравнения регрессии. Но только в том случае, если выполняются определенные предпосылки относительно случайного члена (ε) и независимой переменной (x).
Формально критерий МНК можно записать так:
S = ∑(yi - y*i)2 → min
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
| x | y | x2 | y2 | x • y |
| 16.9 | 285.61 | 33.8 | ||
| 19.5 | 380.25 | 58.5 | ||
| 24.5 | 600.25 | |||
| 35.2 | 1239.04 | 211.2 | ||
| 41.3 | 1705.69 | 289.1 | ||
| 48.2 | 2323.24 | 385.6 | ||
| 64.6 | 4173.16 | |||
| 72.3 | 5227.29 | 795.3 | ||
| 410.5 | 20144.53 | 3185.5 |
Для наших данных система уравнений имеет вид
10a + 65 b = 410.5
65 a + 505 b = 3185.5
Домножим уравнение (1) системы на (-6.5), получим систему, которую решим методом алгебраического сложения.
-65a -422.5 b = -2668.25
65 a + 505 b = 3185.5
Получаем:
82.5 b = 517.25
Откуда b = 6.2697
Теперь найдем коэффициент «a» из уравнения (1):
10a + 65 b = 410.5
10a + 65 • 6.2697 = 410.5
10a = 2.97
a = 0.297
Получаем эмпирические коэффициенты регрессии: b = 6.2697, a = 0.297
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 6.2697 x + 0.297
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
1. Параметры уравнения регрессии.
Выборочные средние.
x ср – 6,5;
У ср – 41,05;
Среднеквадратическое отклонение
S(x) – 2.872;
S(y) – 18.148.
Нелинейная зависимость:



СистемауравненийМНК:
a0n + a1∑x + a2∑x2 = ∑y
a0∑x + a1∑x2 + a2∑x3 = ∑yx
a0∑x2 + a1∑x3 + a2∑x4 = ∑yx2
| x | y | x2 | y2 | x y | x3 | x4 | x2 y |
| 16.9 | 285.61 | 33.8 | 67.6 | ||||
| 19.5 | 380.25 | 58.5 | 175.5 | ||||
| 24.5 | 600.25 | ||||||
| 35.2 | 1239.04 | 211.2 | 1267.2 | ||||
| 41.3 | 1705.69 | 289.1 | 2023.7 | ||||
| 48.2 | 2323.24 | 385.6 | 3084.8 | ||||
| 64.6 | 4173.16 | ||||||
| 72.3 | 5227.29 | 795.3 | 8748.3 | ||||
| 410.5 | 20144.53 | 3185.5 | 27611.1 |
Для наших данных система уравнений имеет вид
10a0 + 65a1 + 505a2 = 410.5
65a0 + 505a1 + 4355a2 = 3185.5
505a0 + 4355a1 + 39973a2 = 27611.1
Получаем a2 = 0.297, a1 = 2.414, a0 = 10.381
Уравнение регрессии:
y = 0.297x2+2.414x+10.381.
Задача 3. По данным выборки, удовлетворяющей нормальному закону распределения, вычислить:
1) выборочное среднее;
2) исправленное выборочное среднее квадратическое отклонение;
3) доверительный интервал для математического ожидания для доверительной вероятности гамма;
4) доверительный интервал для среднего квадратического отклонения для того же значения гамма.
Решение:
| 18,3 |
| 15,5 |
| 24,5 |
| 24,7 |
| 13,3 |
| 15,4 |
| 10,1 |
| 23,1 |
| 19,3 |
| 5,7 |
| 11,6 |
| 14,3 |
| 4,5 |
| 20,3 |
| 32,3 |


Дисперсия D = σ2 = 4.62 = 21.16
Доверительный интервал для генерального среднего.

Поскольку n ≤ 30, то определяем значение tkp по таблице распределения Стьюдента
По таблице Стьюдента находим:
Tтабл (n-1;α/2) = (16;0.025) = 2.131


С вероятностью 0.95 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала (14,45;19,35).
Доверительный интервал для среднеквадратического отклонения.
S(1-q) < σ < S(1+q)
Найдем доверительный интервал для среднеквадратического отклонения с надежностью γ = 0.95 и объему выборки n = 16
По таблице q=q(γ; n) определяем параметр q(0.95;16) = 0.37
4.6(1-0.37) < σ < 4.6(1+0.37)
2.898 < σ < 6.302
Таким образом, интервал (2.898;6.302) покрывает параметр σ с надежностью γ = 0.95
Задача 4. По данным выборки, удовлетворяющей нормальному закону распределения со средним квадратическим отклонением, вычислить:
1) выборочное среднее;
2) доверительный интервал для математического ожидания для доверительной вероятности гамма.
Решение:
| 38,3 | 27,8 | 26,3 | 19,6 |
| 26,1 | 23,8 | 40,8 | |
| 10,5 | 19,8 | 37,3 | 18,4 |
| 26,9 | 24,7 | 25,1 | 30,1 |
| 25,4 | 29,2 | 17,4 | 26,1 |
| 12,1 | 24,4 | 37,1 | |
| 12,3 | 5,6 | 29,6 | 40,3 |
| 15,1 | 19,4 | 27,9 | 27,4 |
| 30,1 | 30,1 | 20,1 | |
| 21,6 | 15,3 | 6,2 | 29,2 |
| 23,5 | 8,4 | 20,8 | |
| 14,2 | 31,5 | ||
| 21,4 | 22,8 | 19,2 | 34,7 |
| 24,1 | 30,8 | 20,9 | 5,1 |
| 26,6 | 36,2 | 24,6 | |
| 25,8 | 22,2 | 8,1 | |
| 12,7 | 20,5 | 12,7 | 33,7 |
| 15,2 | 14,1 | 15,5 | 32,2 |
| 32,9 | 18,6 | 19,6 | 10,3 |
| 22,1 | 14,7 | 24,5 | |
| 25,7 | 24,1 | 24,2 | 12,6 |
| 13,6 | 26,9 | 35,4 | |
| 27,8 | 26,2 | 34,7 | 28,4 |
| 22,8 | 8,8 | 25,1 | 11,1 |
| 10,1 | 22,5 | 14,1 | 33,4 |


Доверительный интервал для генерального среднего.

Поскольку n>30, то определяем значение tkp по таблицам функции Лапласа.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.99/2 = 0.495
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.495
tkp(γ) = (0.495) = 2.58


(20.78;25.42)
С вероятностью 0.99 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
Задача 5. По данным выборки двумерной случайной величины определить:
1) вектор математического ожидания;
2) вектор дисперсии;
3) выборочный коэффициент корреляции;
4) выборочное уравнение прямой оинии регрессии у на х.
Решение:
| x | y |
| 41,2 | 116,5 |
| 48,1 | 124,6 |
| 53,2 | 153,9 |
| 39,1 | |
| 50,2 | 191,6 |
| 94,9 | |
| 39,4 | 100,2 |
| 50,2 | 178,6 |
| 48,3 | 118,7 |
| 39,6 | |
| 41,3 | 81,7 |
| 35,2 | |
| 47,9 | 159,4 |
| 34,6 | 124,4 |
| 33,2 | 103,4 |
| 35,7 | 94,9 |
| 36,8 | 90,8 |
| 50,8 | 180,5 |
| 44,5 | |
| 46,3 | 167,6 |
| 34,8 | 84,6 |
| 39,2 | 124,5 |
| 36,8 | 131,7 |
| 99,8 | |
| 40,4 | 144,8 |
| 41,5 | 120,6 |
| 44,5 | 109,7 |
| 38,9 | 93,5 |
| 49,8 | 136,8 |
| 45,6 | 107,6 |
| 102,9 | |
| 47,6 | 102,9 |
| 32,5 | 116,7 |
| 54,1 | 157,9 |
| 35,4 | 109,1 |
| 37,9 | 92,4 |
| 38,6 | 120,7 |
| 35,6 | 96,1 |
| 33,6 | 73,2 |
| 27,7 | 61,5 |
| 47,1 | |
| 29,9 | 82,8 |
| 50,1 | 110,5 |
Составим вспомогательную таблицу:
| x | y | x^2 | y^2 | x*y |
| 41,2 | 116,5 | 1697,44 | 13572,25 | 4799,8 |
| 48,1 | 124,6 | 2313,61 | 15525,16 | 5993,26 |
| 53,2 | 153,9 | 2830,24 | 23685,21 | 8187,48 |
| 39,1 | 1528,81 | 3870,9 | ||
| 50,2 | 191,6 | 2520,04 | 36710,56 | 9618,32 |
| 94,9 | 9006,01 | 3701,1 | ||
| 39,4 | 100,2 | 1552,36 | 10040,04 | 3947,88 |
| 50,2 | 178,6 | 2520,04 | 31897,96 | 8965,72 |
| 48,3 | 118,7 | 2332,89 | 14089,69 | 5733,21 |
| 39,6 | 1568,16 | 4633,2 | ||
| 41,3 | 81,7 | 1705,69 | 6674,89 | 3374,21 |
| 35,2 | 1239,04 | 3097,6 | ||
| 47,9 | 159,4 | 2294,41 | 25408,36 | 7635,26 |
| 34,6 | 124,4 | 1197,16 | 15475,36 | 4304,24 |
| 33,2 | 103,4 | 1102,24 | 10691,56 | 3432,88 |
| 35,7 | 94,9 | 1274,49 | 9006,01 | 3387,93 |
| 36,8 | 90,8 | 1354,24 | 8244,64 | 3341,44 |
| 50,8 | 180,5 | 2580,64 | 32580,25 | 9169,4 |
| 44,5 | 1980,25 | |||
| 46,3 | 167,6 | 2143,69 | 28089,76 | 7759,88 |
| 34,8 | 84,6 | 1211,04 | 7157,16 | 2944,08 |
| 39,2 | 124,5 | 1536,64 | 15500,25 | 4880,4 |
| 36,8 | 131,7 | 1354,24 | 17344,89 | 4846,56 |
| 99,8 | 9960,04 | 4590,8 | ||
| 40,4 | 144,8 | 1632,16 | 20967,04 | 5849,92 |
| 41,5 | 120,6 | 1722,25 | 14544,36 | 5004,9 |
| 44,5 | 109,7 | 1980,25 | 12034,09 | 4881,65 |
| 38,9 | 93,5 | 1513,21 | 8742,25 | 3637,15 |
| 49,8 | 136,8 | 2480,04 | 18714,24 | 6812,64 |
| 45,6 | 107,6 | 2079,36 | 11577,76 | 4906,56 |
| 102,9 | 10588,41 | 3395,7 | ||
| 47,6 | 102,9 | 2265,76 | 10588,41 | 4898,04 |
| 32,5 | 116,7 | 1056,25 | 13618,89 | 3792,75 |
| 54,1 | 157,9 | 2926,81 | 24932,41 | 8542,39 |
| 35,4 | 109,1 | 1253,16 | 11902,81 | 3862,14 |
| 37,9 | 92,4 | 1436,41 | 8537,76 | 3501,96 |
| 38,6 | 120,7 | 1489,96 | 14568,49 | 4659,02 |
| 35,6 | 96,1 | 1267,36 | 9235,21 | 3421,16 |
| 33,6 | 73,2 | 1128,96 | 5358,24 | 2459,52 |
| 27,7 | 61,5 | 767,29 | 3782,25 | 1703,55 |
| 47,1 | 2218,41 | 4474,5 | ||
| 29,9 | 82,8 | 894,01 | 6855,84 | 2475,72 |
| 50,1 | 110,5 | 2510,01 | 12210,25 | 5536,05 |
| 41,3 | 116,98 | 1748,841 | 14562,22 | 4964,156 |










Задача 6. По данным 2 выборок вычислить коэффициенты ранговой корреляции Спирмена и Кендалла.
Решение:
Присвоим ранги признаку Y и фактору X.
| X | Y | ранг X, dx | ранг Y, dy |
Матрица рангов.
| ранг X, dx | ранг Y, dy | (dx - dy)2 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X умеренная и обратная
Коэффициент Кендэла.
Упорядочим данные по X.
В ряду Y справа от 1 расположено 17 рангов, превосходящих 1, следовательно, 1 породит в Р слагаемое 17.
Справа от 2 стоят 16 ранга, превосходящих 2 (это 14, 12, 10, 11, 7, 18, 15, 17, 16, 13, 8, 5, 9, 6, 3, 4), т.е. в Р войдет 16 и т.д. В итоге Р = 66 и с использованием формул имеем:
| X | Y | ранг X, dx | ранг Y, dy | P | Q |
По упрощенным формулам:

