Теоретические сведения

При статических исследованиях широко используются случайные величины, имеющие нормальное распределение, распределение χ2 (хи-квадрат), распределения Стьюдента и Фишера.

Случайная величина X имеет нормальное распределение с параметрами m (математическое ожидание) и σ2 (дисперсия), если плотность распределения имеет вид:

В качестве примера на рис. 1 изображены два графика плотности нормального распределения с одинаковым математическим ожиданием и разными дисперсиями.

Рисунок 1 – Графики плотностей нормального распределения с одинаковым математическим ожиданием m и разными дисперсиями σ12, σ22

Нормальное распределение с параметрами 0 и 1 называют стандартным нормальным распределением и обозначают N (0,1).

Нормально распределенная случайная величина с большой вероятностью принимает значения, близкие к своему математическому ожиданию, что выражается правилом сигм:

Чаще всего используется правило трех сигм, т.е. k = 3.

Построим график плотности нормального распределения и исследуем влияние параметров m (математическое распределение) и σ (среднеквадратическое отклонение) на него.

Запускаем программу Excel и задаем значения параметров m и σ.

Для этого в ячейки первой строки первого столбца (А1) и второй строки первого столбца (А2) вводим подписи m= и sig=, а в первую строку второго столбца (В1) и во вторую строку второго столбца (В2) вводим их числовые значения. Для построения графика протабулируем в третьем и четвертом столбцах (соответственно С и D) функцию плотности нормального распределения на интервале (a,b) с некоторым выбранным шагом h (интервал (a,b) лучше выбрать так, чтобы его серединой было значение m). Для этого вводим в С1 надпись Х=, а в D1 надпись f=. Вводим в С2 значение a, а в С3 значение a+h. После этого обводим, выделяя, ячейки С2 и С3 и захватив за нижний правый угол рамки вокруг ячеек С2 и С3, перетягиваем его вниз до ячейки С(2+ (b−a)/h), что позволит автоматически занести в столбец значения от a до b с шагом h. Ставим курсор в ячейку D2 и вызываем функцию плотности нормального распределения. Для этого нажимаем кнопку мастера функций fx и выбираем категорию СТАТИСТИЧЕСКИЕ и функцию НОРМРАСП.

Вводим ссылкой на переменную Х: «С2» (для ввода ссылки достаточно щелкнуть мышью по ячейке с данной адресацией), ссылкой на m и σ -«$B$1» и «$B$2». Эти ссылки абсолютные, так как ячейки со значениями m и σ всегда В1 и В2, поэтому пишется знак $ (чтобы быстро относительную ссылку сделать абсолютной нужно после ввода ссылки нажать F4). В поле «Интегральное» ставим 0 или «ложь», нажимаем «ОК».

В ячейке D2 появляется результат f (a) – значение плотности нормального распределения, а в строке формул – запись =НОРМРАСП(C2;$B$1;$B$2;ложь). За нижний правый угол ячейки D2 автозаполняем результат на ячейки D2-D(2+(b−a)/h). Если требуется построить функцию распределения вероятностей нормального распределения, то в поле «Интегральное» нужно поставить a или «истина».

Строим график плотности нормального распределения по данным. Ставим курсор в любой свободной ячейке. При использовании EXCEL 2007 установите курсор на ячейку, где хотите расположить график и вверху в меню переключитесь на вкладку ВСТАВКА. Затем нажмите на кнопку ГРАФИК, выпадет несколько их видов. Выбрать можно любой, например, первый – классический график. На листе появится новый объект – чистый график. Когда он выделен, то верхняя панель с иконками действий имеет другой вид, специально для работы с графиками. Чтобы заполнить график, нажмите на кнопку ВЫБРАТЬ ДАННЫЕ. Отобразится окно выбора данных для графика. В нем имеется поле ВЫБОР ДАННЫХ ДЛЯ ДИАГРАММЫ. В конце поля необходимо нажать на кнопку выбора диапазона. Далее следует выделить мышкой таблицу с данными и подписями строк и столбцов и снова кликнуть на кнопку выбора диапазона данных. Нажимаем «Ок». График построен.

Следующим шагом является исследование влияния параметров m и σ на вид графика. Для этого увеличиваем значение математического ожидания m в ячейке В1 и нажимаем «Enter». График плотности нормального распределения должен сместиться вправо. Теперь уменьшаем значение математического ожидания m в ячейке В1 и нажимаем «Enter». График плотности нормального распределения должен сместиться влево. Возвращаем в В1 первоначальное значение m и начинаем изучать влияние среднеквадратического отклонения σ (или дисперсии σ2) на график плотности. Увеличивая значение σ в ячейке В2, можно наблюдать растяжение графика. Уменьшая значение σ, можно наблюдать сжатие графика.

После такого исследования можно сделать соответствующие выводы о влиянии параметров m и σ на вид графика плотности нормального распределения.

Пусть X1, X2,..., Xn – независимые случайные величины с общим распределением N(0,1) (нормальное распределение с нулевым математическим ожиданием и единичной дисперсией). Тогда случайная величина

имеет распределение χ2 с n степенями свободы или распределение χn2.

Плотность распределения вероятностей χn2 имеет вид:

где

Графики плотности распределения χ2 с n степенями свободы асимметричны и, начиная с n = 2, имеют по одному максимуму в точке x=n−2 (рис. 2). Причем с ростом n кривая плотности приближается к симметричной функции.

 

Рисунок 2 – Графики плотности распределения χ 2 с n степенями свободы

 

Интервал для построения необходимо выбрать с нулевой левой границей и произвести его разбиение. Пусть точки разбиения занимают, например, ячейки В1-В15. Для того, чтобы найти значение функции распределения вероятностей χ2 с n степенями свободы, нужно нажать кнопку мастера функций fx, выбрать категорию СТАТИСТИЧЕСКИЕ и функцию ХИ2РАСП. Вызванная функция находит значения вероятностей P(X>x), которые заполняют, например, ячейки С1-С15. Поскольку нам нужна функция распределения вероятностей F(x)=P(X≤x)=1−P(X>x), то ее значения мы получим в ячейках D1-D15 следующим образом: D1=1-C1,…,D15=1-C15. Для определения значений плотности распределения χ2 с n степенями свободы необходимо воспользоваться формулой для приближенного вычисления первой производной от функции распределения. Если шаг разбиения равен h, а функция распределения вероятностей в соседних точках разбиения имеет значения соответственно g((i−1)h) и g(ih), то значение плотности распределения вероятностей в точке разбиения ih равна (g (ih) − g((i −1)h))/h. Значения плотности распределения вероятностей получаем в ячейках, например, начиная с Е2 по формуле Е2=(D2-D1)/h. Остальные ячейки автозаполняем. Таким образом, можно найти значения плотности χ2 с n степенями свободы на выбранном отрезке, кроме нуля (левой границы отрезка).

Действуя аналогично построению графика плотности нормального распределения, строим график плотности распределения χ 2 с n степенями свободы и изучаем влияние степени свободы на вид графика, уменьшая или увеличивая n.

После исследования делаем соответствующие выводы.

Пусть случайная величина Y имеет распределение N(0,1), а независимая от Y случайная величина Z принадлежит  χn2 (имеет распределение χ 2 с n степенями свободы). Тогда случайная величина

имеет распределение Стьюдента с n степенями свободы (tn – распределение) и плотностью распределения вероятностей:

Графики плотности случайной величины, имеющей распределение Стьюдента, при любом n=1,2,.... симметричны относительно оси ординат (рис.3), поэтому при любом n=1,2,..... математическое ожидание равно нулю.

Рисунок 3 – Графики плотности распределения Стьюдента

 

С ростом n распределение Стьюдента приближается к N(0,1).

Интервал для построения функции распределения Стьюдента tn необходимо выбрать симметричным относительно нуля. Разбиение построить так, чтобы среди точек разбиения был нуль. Пусть точки разбиения занимают, например, ячейки В1-В15, среди них ячейки В1-В7 содержат отрицательные значения, ячейка В8 содержит нуль и ячейки В9-В15 содержат положительные значения.

Для того, чтобы найти значения функции распределения Стьюдента n t с n степенями свободы, нужно нажать кнопку мастера функций fx, выбрать категорию СТАТИСТИЧЕСКИЕ и функцию СТЬЮДРАСП. Функция имеет дополнительный чисто вычислительный параметр «Хвосты», который не связан с распределением Стьюдента, а связан с выводом полученных результатов программой EXCEL. Его всегда задаем равным 1. В этом случае вызванная функция находит значения вероятностей P(X>x) при неотрицательном x, которые заполняют, например, соответственно ячейки С9-С15. В ячейке С9 обязательно должно быть значение 0.5, поскольку это вероятность P(X>0) = 0.5. Поскольку нам нужна функция распределения вероятностей F(x) = P(X ≤ x) =1− P(X > x), то ее значения мы получим в ячейках D9-D15 следующим образом: D9=1-C9,…,D15=1-C15. Значения функции распределения в ячейках D1-D7 получим по формуле: D1=C15, D2=C14,….D7=C9, поскольку функция распределения Стьюдента из-за симметричности распределения обладает свойством P(X ≤ −x) = P(X > x).

Для нахождения значений плотности распределения Стьюдента tn необходимо воспользоваться формулой для приближенного вычисления значений первой производной (по аналогии с распределением χ2).

Далее строим плотность распределения вероятностей tn с n степенями свободы (значение берется произвольно) и изучаем влияние степени свободы на вид графика, уменьшая или увеличивая значение n.

После исследования делаем соответствующие выводы.

Пусть U и V - независимые случайные величины, распределенные по закону χ2 с n1 и n2 степенями свободы соответственно. Тогда случайная величина

имеет распределение Фишера с n1 и n2 степенями свободы (Fn1,n2 – распределение) и плотностью распределения вероятностей

Графики плотности распределения случайной величины асимметричны, имеют длинные «хвосты» и достигают максимума вблизи точки x=1 (рис.4).

Рисунок 4 – Графики плотности распределения Фишера

 

Интервал для построения необходимо выбрать с нулевой левой границей. Пусть точки разбиения занимают, например, ячейки В1-В15. Для того, чтобы найти значения функции распределения Фишера Fn1,n2 с n1и n2 степенями свободы, нужно нажать кнопку мастера функций fx, выбрать категорию СТАТИСТИЧЕСКИЕ и функцию FРАСП. Вызванная функция находит значения вероятностей P(X>x), которые заполняют, например, ячейки С1-С15. Поскольку нам нужна функция распределения вероятностей F(x)=P(X≤x)=1−P(X>x), то ее значения мы получим в ячейках D1-D15 следующим образом: D1=1-C1,…,D15=1-C15.

Для определения значений плотности распределения вероятностей необходимо воспользоваться формулой для приближенного вычисления значений первой производной.

Далее строим график плотности распределения Fn1,n2 и изучаем влияние степеней свободы n1и n2 на вид графика. Для этого фиксируем значение n1 и уменьшаем или увеличиваем значение n2. После этого фиксируем значение n2 и уменьшаем или увеличиваем значение n1. После исследования делаем соответствующие выводы.

 

Оборудование

Персональный компьютер с установленной операционной системой Windows XP/7/8, браузер (Например, Internet Explorer, Google Chrome, Opera), OOo Writer (MS Word), Ооо Calc (MS Excel) пакет офисных приложений «Мой офис».

 

Задание на работу

1. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25 мм, Согласно ТУ трубы признаются годными, если диаметр находится в пределах 20,00+/-0,40 мм. Какая доля изготовленных труб соответствует ТУ? Обработать данные, построить график плотности нормального распределения. Сделать выводы.

2. Директор школы хочет узнать, действительно ли то, что учителя более предвзято относятся к мальчикам, чем к девочкам, т.е. более склонны хвалить девочек. Для этого им были проанализированы характеристики учеников, написанные учителями, на предмет частоты встречаемости трех слов: «пассивный», «активный», «старательный», «дисциплинированный», синонимы слов так же подсчитывались. Данные о частоте встречаемости слов были занесены в таблицу:

  Пассивный Активный Старательный Дисциплинированный
Мальчики 10 5 6 9
Девочки 6 12 8 7

Обработать данные с использованием критерия хи-квадрат. Сделать выводы.

3. Необходимо сравнить между собой результаты выполнения логических задач до и после курса обучения дисциплины «Математическая статистика». Чтобы узнать различаются ли результаты до курса обучения и после необходимо вычислить критерий Стьюдента, построить график и сделать выводы по этой задаче

Результаты выполнения логических задач до курса (мин.) Результаты выполнения логических задач после курса (мин.)
1 10 9
2 7 8
3 8 7
4 10 9
5 11 12
6 9 9
7 9 8
8 10 7
9 7 7

4. В двух третьих классах проводилось тестирование умственного развития по тесту ТУРМШ десяти учащихся. Полученные значения величин средних достоверно не различались, однако психолога интересует вопрос – есть ли различия в степени однородности показателей умственного развития между классами. Обработать данные с использованием критерия Фишера. Сделать выводы.

№ учащегося Первый класс А Второй класс Б
1 90 41
2 29 49
3 39 56
4 79 64
5 88 72
6 53 65
7 34 63
8 40 87
9 75 77
10 79 62

 

Контрольные вопросы

1. Что такое плотность нормального распределения и в каких случаях она используется?

2. Критерий хи-квадрат: дать определение и рассказать в каких случаях он используется.

3. Критерий Стьюдента: дать определение и рассказать в каких случаях он используется.

4. Критерий Фишера: дать определение и рассказать в каких случаях он используется.


 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: