Теоретические сведения

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

По выполнению лабораторных работ

По дисциплине (модулю)

 «Математическая статистика»

 

Основной профессиональной образовательной программы

Высшего образования – программы бакалавриата

по направлению подготовки

09.03.01 «Информатика и вычислительная техника»

 

с профилем

«Электронно-вычислительные машины, комплексы, системы и сети»

 

 

Форма обучения: очная, заочная

 

Идентификационный номер образовательной программы: 090301-02-18

 

 

Тула 2019 год
Разработчик(и) методических указаний

 

____ Набродова И.Н., доцент, к.т.н. ________            _______________

(ФИО, должность, ученая степень, ученое звание)                                  (подпись)


 



Оглавление

Лабораторная работа №1. 4

СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ.. 4

Лабораторная работа №2. 11

ОСНОВНЫЕ РАСПРЕДЕЛЕНИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.. 11

Лабораторная работа №3. 19

ОПРЕДЕЛЕНИЕ ИНТЕРВАЛЬНЫХ ОЦЕНОК НЕИЗВЕСТНЫХ.. 19

ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ.. 19

Лабораторная работа №4. 22

КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ. 22

Лабораторная работа №5. 31

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. 31

 



Лабораторная работа №1

СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ

Цель и задачи работы

Научиться основным методам обработки данных, представленных выборкой, путем построения гистограммы, определения выборочного среднего, выборочной дисперсии, выборочной медианы и моды.

 

Порядок выполнения работы

- ознакомится с теоретическими сведениями;

- выполнить задание;

- оформить отчет;

- ответить на контрольные вопросы, заданные преподавателем.

 

Оформление отчета

Отчет должен содержать: титульный лист, цель работы, описание пунктов выполнения лабораторной работы в соответствии с заданием, ответы на контрольные вопросы и выводы по работе.

 

Теоретические сведения

Вероятностная модель ставит в соответствие результатам наблюдений

x1, x2,..., xn                                                    (1)

последовательность случайных величин

X1, X2,..., Xn.                                       (2)

Предполагается, что случайные величины X1, X2,..., Xn независимы и имеют одно и то же распределение с функцией распределения F(x).

Полагают, что наблюдения (1) являются значениями величин (2) при осуществлении вероятностного эксперимента. Несмотря на различие объектов (1) и (2), в математической статистике принято называть и то и другое выборкой из генеральной совокупности.

Количество наблюдений n называется объемом выборки.

Произвольная случайная величина X характеризуется своей функцией распределения вероятностей F(x). Если эта функция неизвестна, но известна выборка (1), числовые данные которой являются значениями случайной величины X, то возможно построить эмпирическую функцию распределения вероятностей Fn (x), которая служит оценкой теоретической функции распределения вероятностей F(x). Если обозначить через μn(x) число тех значений x1, x2,..., xn, которые меньше или равны x, то

                                 (3)

Если объем выборки n большой, то для представления о виде ее распределения строится гистограмма.

Вводим в первый столбец (ячейки А1…) исходные данные. Для элементов выборки находим минимальный и максимальный элементы, которые ограничивают интервал, содержащий все элементы выборки. Для этого запишем в первую строку второго столбца (В1) слово Максимум, а во вторую строку второго столбца (В2) слово Минимум. В соседних ячейках С1 и С2 определим функции МАХ и MIN. Для этого ставим курсор в С1 и вызываем мастер функций, нажав на кнопку fx, в открывшемся окне в поле «Категория» выбираем СТАТИСТИЧЕСКИЕ, и ниже ищем функцию МАКС и вызываем ее двойным щелчком по названию. В качестве аргумента функции (в графе «Число 1») обведем область данных (ячейки А1…). Поле «Число 2» оставляем пустым. Нажимаем «ОК». Ставим курсор в ячейку С2 и аналогично вводим функцию МИН. В некоторых случаях для удобства обработки интервал расширяется, но не существенно.

Следующим шагом является разбиение построенного интервала на 5-10 более мелких интервалов. Если разбиение построено удачно, то гистограмма будет напоминать график плотности (если она существует) распределения вероятностей случайной величины, значениями которой являются элементы выборки. Если разбиение мелкое, то гистограмма не дает представления о плотности распределения вероятностей из-за случайных флуктуаций. Если разбиение крупное, то гистограмма также не дает представления о плотности распределения вероятностей из-за того, что теряется много информации.

Чтобы построить интервалы разбиения (группировки), нужно от максимального значения выборки вычесть минимальное значение и полученный результат разделить на число интервалов. Полученное значение называется шагом разбиения. Чтобы получить верхние границы интервалов группировки, нужно последовательно прибавлять шаг разбиения, начиная от минимального значения выборки.

В ячейки D1… вводим верхние границы интервалов группировки. Для вычисления частот ni используется функция ЧАСТОТА, находящаяся в категории СТАТИСТИЧЕСКИЕ. Введем ее в ячейку Е1. В строке «Массив данных» введем диапазон выборки (ячейки А1…). В строке «Массив интервалов» введем диапазон верхних границ интервалов группировки (ячейки D1…). Результат функции является массивом и выводится в ячейках Е1... Для полного вывода (не только первого числа в Е1) нужно выделить ячейки Е1…, обведя их мышью, и нажать F2, а далее одновременно CTRL+SHIFT+ENTER. Результат – частоты ni, которые показывают, сколько элементов выборки попало в каждый из интервалов разбиения.

При использовании EXCEL 2007 для создания диаграммы необходимо выделить блок данных, на основании которых строится диаграмма. В выделяемый блок данных включить не только числовые данные, но и заголовки строк (столбцов), в которых они расположены.

Заголовки будут использованы в качестве подписей по осям (меток) и для формирования условных обозначений (легенды). При выделении блоков с данными для построения диаграмм необходимо соблюдать два правила:

1. Выделенный фрагмент должен состоять из равновеликих столбцов.

2. В выделенном фрагменте не должно быть объединенных ячеек.

Для построения гистограммы необходимо перейти на вкладку ВСТАВКА, открыть список ГИСТОГРАММА выбрать нужную гистограмму. Гистограмма строится сразу. Иногда необходимо выделить построенную диаграмму и провести изменение размера шрифта или растянуть диаграмму для лучшего чтения данных в поле диаграммы. Если вызвать контекстное меню в поле всей диаграммы, то меню предлагает три отдельных шага в построении диаграммы (в предыдущих версиях было четыре шага): Изменить тип диаграммы; выбрать данные; переместить диаграмму.

В мастере функций fx существуют специальные функции, позволяющие вычислять выборочные характеристики.

Функция СРЗНАЧ вычисляет выборочное среднее (оценку теоретического математического ожидания)

Функция ДИСП вычисляет выборочную дисперсию (оценку теоретической дисперсии)

Функция СТАНДОТКЛОН вычисляет квадратный корень из выборочной дисперсии.

Функция МЕДИАНА вычисляет выборочную медиану (оценку медианы) заданной выборки. Медианой случайной величины называется то ее значение, которое делит распределение на две равновероятные половины. В качестве выборочной медианы в выборке объема 2n+1 берут значение x(n+1) в вариационном ряде. Если объем выборки равен 2n, то в качестве выборочной медианы  берут

Функция МОДА вычисляет выборочную моду (оценку моды). Модой случайной величины называется ее наиболее вероятное значение. В Excel можно генерировать случайные числа, имеющие разные законы распределения. Для этого можно использовать надстройку АНАЛИЗ ДАННЫХ и пункт ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ЧИСЕЛ.

Если вы хотите сгенерировать, например, 100 случайных чисел из нормального распределения, то в поле ЧИСЛО ПЕРЕМЕННЫХ введите 1; в поле ЧИСЛО СЛУЧАЙНЫХ ЧИСЕЛ введите 100; в списке РАСПРЕДЕЛЕНИЕ выберите НОРМАЛЬНОЕ; введите параметры нормального распределения – СРЕДНЕЕ и СТАНДАРТНОЕ ОТКЛОНЕНИЕ. В качестве типа распределения можно выбрать, например, РАВНОМЕРНОЕ, БИНОМИАЛЬНОЕ или РАСПРЕДЕЛЕНИЕ ПУАССОНА. Введя для каждого распределения соответствующие параметры, получим сгенерированные случайные числа.

 

Оборудование

Персональный компьютер с установленной операционной системой Windows XP/7/8, браузер (Например, Internet Explorer, Google Chrome, Opera), OOo Writer (MS Word), Ооо Calc (MS Excel) пакет офисных приложений «Мой офис».

 

Задание на работу

Выборка состоит из 50 значений некоторой случайной величины. Построить гистограмму, вычислить выборочное среднее, выборочную дисперсию (исправленную), выборочные медиану и моду.

Вариант 1.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 0.865 0.932 2.303 1.51 0.605 3.181 2.547 0.773 2.982 1.64 3.248  

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 1.711 4.801 4.085 1.802 1.592 3.519 2.284 2.514 3.276 3.999 2.859 2.182 0.056  

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х 2.717 0.029 1.132 1.816 3.004 1.464 1.656 4.096 1.81 2.349 3.015 0.878 2.741

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 4.867 4.43 1.916 2.415 2.407 4.284 0.706 3.098 0.283 0.616 3.594 2.088 0.641

 

Вариант 2.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 0.122 -0.359 0.053 -0.903 -2.371 1.087 0.759 2.113 5.384 2.617 2.97

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 2.724 2.831 2.346 -1.089 1.138 -0.511 2.393 0.636 -0.289 -0.446 -0.033 2.116 0.51

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х 1.179 3.524 -0.411 1.004 3.215 2.785 -4.802 -3.314 1.412 -0.232 -1.395 1.198 2.542

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 1.612 1.023 -0.529 0.182 -0.348 0.736 3.036 1.361 2.027 2.48 0.967 1.558 1.324

 

Вариант 3.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х -1.338 0.122 -2.625 -1.733 0.682 -2.196 0.223 -0.831 -4.894 -2.761 0.11

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х -0.527 -0.979 0.068 0.391 -1.359 -1.921 0.794 1.937 -1.249 1.354 0.054 -1.774 -1.149

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х 1.343 1.939 1.278 -0.372 -0.721 -0.731 -0.679 -1.327 3.126 -0.854 -0.937 -2.778 0.337

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х -2.081 0.282 3.309 0.862 0.342 1.774 3.885 1.307 0.905 0.85 0.046 -0.691 1.918

Вариант 4.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х -0.263 -1.213 -2.124 -0.824 -1.833 1.022 -0.107 -0.018 -0.664 3.053 1.798

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х -0.672 2.504 1.565 2.29 1.544 0.726 -1.365 1.687 -0.571 0.656 -0.852 0.448 -4.465

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х -0.33 -2.262 -1.523 -0.758 -2.043 0.66 -1.859 -2.738 0.02 -2.133 -0.143 -0.384 1.611

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 2.055 -2.704 -1.776 -0.471 -0.488 0.679 4.905 -3.749 0.98 -2.49 -0.751 1.8 -2.027

Вариант 5.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 0.253 3.468 -2.413 3.27 0.683 -1.509 -0.294 -0.682 -0.648 -2.21 2.707

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х -2.01 2.848 0.168 -2.001 -1.058 -0.927 -1.063 0.527 -0.563 -2.016 -0.886 -0.658 1.427

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х -0.911 -0.806 1.243 -1.039 3.053 -0.205 -1.037 -0.107 -2.193 -1.681 -2.199 2.263 2.131

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х -0.239 -0.241 -1.711 0.065 -0.102 0.576 2.813 -0.128 3.4 1.69 -2.676 3.568 0.129

Вариант 6.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х -5.65 2.492 -1.634 4.298 -2.39 3.629 2.128 3.072 -0.626 3.484 -0.011

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 3.968 -1.269 -1.432 -3.21 -4.115 2.53 0.829 2.146 0.891 0.368 -9.371 -4.943 -0.417

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х -4.854 -1.304 -0.948 -2.528 -5.092 1.429 2.047 0.366 -4.127 -0.101 1.016 4.364 0.802

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х -1.595 0.583 2.488 1.578 -4.117 1.013 -1.65 -0.89 0.21 -3.219 -0.576 -0.91 1.773

Вариант 7.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 4.848 2.896 2.26 -0.985 1.096 5.162 2.655 2.437 5.242 3.461 3.066

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 1.883 3.825 1.658 1.06 4.475 -0.217 2.094 1.834 2.429 4.285 4.333 1.378 0.577

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х 1.759 0.816 4.409 3.157 4.032 5.137 2.924 4.108 6.047 -0.296 2.047 3.438 2.516

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 3.412 4.349 3.462 2.136 2.181 5.722 1.031 2.254 0.554 2.202 -1.089 5.441 0.93

Вариант 8.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х -4.267 -2.319 -3.054 -1.187 -2.417 -1.588 1.494 1.209 -1.066 -3.996 0.949

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х -5.813 -0.886 -3.126 -1.994 -1.615 -0.888 0.259 1.868 -1.616 -1.624 -2.581 -1.453 -1.014

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х -0.696 -2.353 -0.969 -1.113 -2.688 -0.591 -0.934 -3.471 0.142 0.428 -5.595 -2.793 -2.209

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 1.241 1.726 -2.003 -1.004 -0.658 -0.042 -0.458 -1.338 -0.895 -2.11 0.215 -2.095 -1.4

Вариант 9.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 2.316 2.249 1.829 1.547 2.294 2.151 1.066 2.793 2.716 3.044 2.811

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 2.617 1.755 1.914 2.685 2.791 2.358 1.789 1.844 2.136 2.864 3.958 2.069 2.565

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х 2.557 3.891 3.479 -0.294 2.662 1.559 1.526 2.089 1.301 2.347 1.125 3.9 -0.726

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х 2.87 4.179 3.085 3.176 1.029 0.424 2.464 3.474 3.165 1.237 2.509 2.496 1.198

Вариант 10.

№ наблюдения 1 2 3 4 5 6 7 8 9 10 11  
Значение Х 0.643 -0.713 -1.043 4.572 -0.43 -1.92 1.139 -0.589 -1.805 -1.555 -0.029

 

12 13 14 15 16 17 18 19 20 21 22 23 24  
Х 0.048 0.397 0.737 0.357 -1.027 -2.422 2.117 1.457 -1.734 0.216 2.546 -0.48 -3.047

 

25 26 27 28 29 30 31 32 33 34 35 36 37
Х -2.117 -1.988 -0.776 0.093 -0.894 -0.496 0.809 0.328 0.608 -1.734 -1.658 -1.655 -0.611

 

38 39 40 41 42 43 44 45 46 47 48 49 50
Х -1.97 -4.261 1.914 1.187 0.214 -1.509 -1.39 -1.317 0.417 -0.603 1.953 -2.067 0.57

Контрольные вопросы

1. Что называется объемом выборки?

2. Чем характеризуется произвольная случайная величина X?

3. Для чего строится эмпирическая функция распределения?

4. Что такое гистограмма и для чего она строится?


 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: