Моделирование рядов распределения

Все рассмотренные нами показатели характеризуют отдельные свойства совокупности. Общую характеристику ряда распределения можно представить аналитически, в виде функции, характеризующей зависимость между изменениями варьирующего признака и частотами. Каждому ряду свойственна определенная закономерность, выражением которой является кривая распределения, представляющая собой функцию распределения. Если имеется эмпирический ряд распределения, то необходимо найти функцию распределения, т.е. подобрать такую теоретическую кривую распределения, которая наиболее полно отражала бы закономерность распределения. Нахождение функции кривой, распределения называется моделированием. Моделирование имеет большое познавательное значение, функции кривой распределения дают в компактной форме характеристику изучаемой совокупности, ее закономерности, сглаживают различные «неправильности» эмпирического ряда, возникшие вследствие случайных обстоятельств, дают возможность находить частоты интервалов, которые не встречались в эмпирическом распределении. Уравнения кривых распределения позволяют при помощи двух-трех, а иногда и одной сводной характеристики получить представление о характере распределения, они весьма важны для прогнозирования будущих распределений.

Для аппроксимации (выравнивания) эмпирических кривых распределения и сопоставления их с теоретическими в статистике частью пользуются нормальным распределением, функции которого

где F₍_x₎ — интегральная функция распределения;

- нормированное отклонение;

е — основание натуральных логарифмов;

dt — разность между смежными значениями F₍_x₎, т.е. величина интервала. В этом уравнении F₍_x₎ рассматривается как функция переменной t: каждому значению t соответствует определенное значение F₍_x₎. Таким образом, кривую нормального распределения можно построить по двум параметрам и а. Исчислив по ним нормированное отклонение t, можно по специальной таблице получить готовые значения F₍_x₎ при условии, что t > 0. Например, если х = 115, = 100, а σ = 12, то . По таблице данному значению t соответствует F (+1,25) = 0,894. Так как кривая нормального распределения симметрична, то F_(-_t₎ = 1 - F₍_t₎ и F (-1,25) = 1 - - 0,894 = 0,106. Следовательно вероятность того, что признак примет значение в интервале от х_i - до х_i₊₁, равна F₍_xi₊₁₎ - F₍_xi₎.

Важное значение в анализе имеет проверка того, насколько фактическое распределение признака соответствует теоретическому, например нормальному распределению. Задача состоит в том, чтобы по фактическим данным вычислить теоретические частоты кривой распределения и сравнить их с эмпирическим рядом. Теоретические частоты f¹ для нормального распределения рассчитываются по формуле