Де-Муавр вывел нормальный закон распределения вероятностей. В разработку этого закона внесли существенный вклад К.Гаусс и А.Лаплас. Гаусс исходил из признания наиболее значимым вероятным значением случайной величины–средней арифметической. Общее условие возникновения нормального закона распределения установил А.М.Ляпунов.
Нормальная кривая описывается следующей формулой:
У= 1 / σ√ 2π * е-(х-хср)2 /2 σ2
где –х- случайная величина; хср- средняя арифметическая или математическое ожидание; σ- среднее квадратическое отклонение
Существенными факторами, определяющими центр группировки и форму нормальной кривой, являются параметры хср и σ. Графически изображение нормальной кривой напоминает колокол.
При хср =0 и σ=1 нормальную кривую называют нормированной кривой или распределением нормальным в каноническом виде. Описывается она следующей формулой:
У =1/√ 2π * е-х2 /2
Нормальное распределение признака наблюдается в тех случаях, когда на величину признака явления действует множество случайных независимых или слабо зависимых факторов, каждый из которых играет в общем итоге относительно незначительную роль (отсутствуют доминирующие факторы).
Ляпунов доказал, что если изучаемый признак представляет собой результат суммарного действия многих факторов, каждый из которых мало связан с большинством остальных, и влияние каждого фактора на конечный результат намного перекрывается суммарным влиянием всех остальных факторов, то распределение становится близким к нормальному. В математической статистике нормальное распределение играет роль некоторого стандарта, с которым сравнивают другие распределения.
При построении нормальной кривой по эмпирическим данным, используют следующую формулу:
У = h*∑ni/n/ σ *1/√ 2π * е-t2 /2
где h –величина интервала
∑ ni –сумма всех частот, равная объему совокупности
σ – среднее квадратическое отклонение
t – центрированное и нормировано отклонение, равное (х-хср) / σ
величина 1/√ 2π * е-t2 /2 – табулирована и может быть определена из соответствующих математико-статистических таблиц.(прилож.2)
табулирование –нахождение значений функции и построение таблиц по аналитическому выражению, связывающему переменные х и у.
Если у = f (х), то уо = f (хо), у1= f (х1), … у i= f (хi). Обычно значения аргумента (х) следуют друг за другом через одно и то же число h -называемое шагом таблицы. Тогда х i +1=х i +h (i = 0,1,…) Для табулирования функций заданных аналитически, часто применяют разложение в ряды.
Пример:
Построим нормальную кривую по данным о распределении 200 деталей по весу
Вес детали,h (интервал) | Число деталей - n | Середина интервала.х | (х-х0)/к =х1 | х1*n | (х1)2 | (х1)2* n | (х-хср) | t= (х-хср)/σ Гр.8 | f (t) Гр.9 | Теоретическая счастота h∑ n / f(t) Гр.10 | Уточнтеоретчастота-n1 | |||||||
306-311 | 308,5 | -4 | -76 | -14,7 | -1,5 | 0,1295 | ||||||||||||
311-316 | 313,5 | -3 | -102 | -9,7 | -0,99 | 0,2444 | ||||||||||||
316-321 | 318,5 | -2 | -76 | -4,7 | -0,48 | 0,3555 | ||||||||||||
321-326 | 323,5 | -1 | -33 | 0,3 | 0,03 | 0,3988 | ||||||||||||
326-331 | 328,5 | 5,3 | 0,54 | 0,3448 | ||||||||||||||
331-336 | 333,5 | 10,3 | 1,05 | 0,2299 | ||||||||||||||
336-341 | 338,5 | 15,3 | 1,56 | 0,1182 | ||||||||||||||
341-346 | 343,5 | 20,3 | 2,07 | 0,0468 | ||||||||||||||
346-351 | 348,5 | 25,3 | 2,58 | 0,0143 | ||||||||||||||
351-356 | 353,5 | 30,3 | 3,10 | 0,0034 | - | - | ||||||||||||
итого | - | - | -212 | - | - | - | - | |||||||||||
Находим среднюю по формуле: хср.= х1ср.*h +х0 . За х0 принимаем центр интервала, равный 328,5 и h= 5
В графах 3,4 проводим подготовительные расчеты и получаем:
Х ср. = -212/2500*5+328,5=323,2
Находим среднеквадратическое отклонение:
σ = √ (х1)2* n/ Σ n*h2 – (хср-х0)2 = √ 992/200*25 – 5,32= √ 95,91~ 9,79
Находим t в каждой строке по формуле t=(х-хср)/σ (графа 9)и затем по приложению 2 (таблица значений функции f (t)=1/√ 2π * е-х2 /2 (плотность нормального распределения)
находим f(t). Для вычисления теоретических частот (т.е. ординат нормальной кривой, гр.10) находим множитель h∑ n / * σ =5*200/9,79~102,14 и все найденные в графе 9 величины f (t) умножаем на 102,14
Так для первого интервала получим 102,14*0,1295=13 и т.д.
Учитывая, что полученные теоретические частоты могут быть только целыми числами, округляем их и находим сумму, она равна 192. Т.о. видим несовпадение суммы теоретических частот (192) с суммой фактических частот (200). Такие расхождение бывает в тех случаях, когда крайние теоретические частоты значительно отличаются от нуля. В этих случаях теоретическую кривую надо продлевать. В нашем примере нормальная кривая должна быть продолжена в сторону отрицательных отклонений от средней, т.к. первая не уточненная частота равна 13.
Производим такой расчет теоретических частот для двух предшествующих интервалов, в которых фактические частоты равны нулю и получаем для интервалов 296-301 и 301-306 теоретические частоты, равные 2 и 6.Для наглядности строим график, на который наносим фактическое распределение в виде гистограммы и нормальную кривую.