Закономерные изменения частот за счёт изменения варьирующего признака в вариационных рядах называются закономерностями распределения.
Главной задачей анализа вариационных рядов является выявление закономерностей распределения и характера распределения, определение и построение (получение) некой теоретической (вероятностной) формы распределения. Например, распределение рабочих по уровню заработной платы зависит от условий:
- квалификации;
- нормы выработки;
- расценок;
- условий труда – это общее условие.
Тип закономерности распределения – это отражение в вариационных рядах общих условий, определяющих распределение в однородной совокупности. Общие условия, определяющие тип закономерностей, познаются анализом сущности явления тех его свойств и условий, которые определяют изменчивость вариационного признака. Характер распределения лучше всего проявляется при большом числе наблюдений и малых интервалах. Следовательно, должна быть построена кривая распределения.
Кривая распределения – это графическое изображение частот варьирующего ряда в виде непрерывной линии, где частоты связаны с вариантами функционально. Кривая распределения может рассматриваться как некая теоретическая (вероятностная) форма распределения, свойственная определенной совокупности в конкретных условиях. Существует теоретическая кривая распределения и фактическая.
Теоретическая кривая выражает общую закономерность данного распределения, в чистом виде исключающую влияния случайных условий. Теоретическое распределение случайной величины – это математическое выражение функциональной зависимости значений случайной величины x и вероятности её попадания в соответствующий интервал.
Таким образом, анализируя частоты в эмпирическом распределении, можно описать его с помощью математической модели – закона распределения, установить по исходным данным параметры теоретической кривой и проверить правильность выдвинутой гипотезы и типе распределения данного ряда.
Полигон распределения – непрерывная линия, характеризующая фактическую кривую распределения, поскольку в нём отражаются как общие, так и случайные условия, определяющие распределение. Сглаживание эмпирического полигона распределения приводит к теоретической кривой распределения.
Теоретическое распределение получается при полном погашении всех случайных причин, влияющих на основную закономерность.
Для построения функции теоретического распределения необходимо знать и s и обосновать вид кривой из сведений об экономическом явлении или процессе.
В статистике наиболее часто для сопоставления фактических и теоретических кривых используют нормальный тип распределения. Распределение непрерывной случайной величины x называют нормальным, если соответствующая ей плотность распределения выражается следующим уравнением:
где – ордината кривой нормального распределения (частость);
– нормированное распределение ;
x – значение изучаемого признака;
– средняя арифметическая ряда;
s – среднее квадратическое отклонение изучаемого признака;
.
Эта функция выражает закон нормального распределения. Нормальное распределение полностью определяется двумя параметрами – средней арифметической и средним квадратическим отклонением.
В экономической статистике кривая нормального распределения (рис. 2) встречается достаточно редко, но нормальное распределение может служить моделью для выяснения степени и характера отклонения от неё фактического распределения. Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин. Действие этих причин независимо, и ни одна из причин не имеет преобладающего влияния над другими.
Рис. 2. Кривая нормального распределения
Кривая нормального распределения (рис. 3) симметрична относительно вертикальной прямой , поэтому среднюю арифметическую ряда называют центром распределения.
Случайные величины, распределенные по нормальному закону, различаются значениями параметров и s, поэтому важно выяснить, как эти параметры влияют на вид кривой нормального распределения.
Если не меняется, а изменяется только s, то:
1) чем меньше s, тем более вытянута кривая (рис. 3, а), а так как площадь, ограниченная осью и данной кривой, равна 1, то вытягивание вверх компенсируется сжатием около центра распределения и более быстрым приближением кривой к оси абсцисс;
2) чем больше s, тем более плоской и растянутой вдоль оси абсцисс становится кривая.
Если s остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (рис 3, б).
| |||
Рис. 3. Кривые нормального распределения
Особенности кривой нормального распределения:
1). Кривая симметрична относительно максимальной ординате, она имеет максимум в точке, соответствующей значению , её величина равна
2). Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Чем больше отдельные значения x отклоняются от , тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку отклонения величин переменной x от равновероятны.
3). Кривая имеет две точки перегиба, находящиеся на расстоянии одного стандартного (нормированного) отклонения ±s от .
4). Площадь между ординатами, проведёнными на расстоянии ±s (заштрихованная область на рис 3, б), составляет 0,683. Это означает, что 68,3% всех исследуемых единиц (частот) отклоняется от средней арифметической не более, чем на s, т. е. находится в пределах ±s. В промежутке ±2s находится 95,4%, а в промежутке ±3s соответственно, 99,7% всех единиц исследуемой совокупности. Отклонение 3s может считаться максимально возможной – правило трёх сигм.
5). Коэффициенты асимметрии и эксцесса равны нулю.
Вероятность попадания случайной величины, распределённой по нормальному закону, в интервал () определяется по формуле:
где: ; ; ;
Ф(t) – нормированная функция Лапласа, характеризует площадь под функцией в интервале от 0 до t.
Выравнивание фактического распределения по кривой нормального распределения состоит из нескольких этапов:
1) по фактическим данным определяют теоретические частоты кривой нормального распределения, которая является функцией нормированного отклонения;
2) сравнивают фактические и теоретические частоты;
3) проверяют, насколько распределение признака соответствует нормальному.