Кривые распределений

Графическое изображение интервальных рядов распределения облегчает их анализ и позволяет выявлять закономерности распределения вариант. Этого можно достичь, если увеличивать объем исследуемой совокупности, что соответственно приведет к уменьшению величины интервала и увеличению их числа. При графическом изображении этих данных мы получим некоторую плавную кривую линию, которая для гистограммы относительных частот будет являться некоторым пределом. Эту линию называют кривой распределения, т.е. гистограмма позволяет получить приближенное представление о кривой распределения. Эта кривая характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри совокупности. Иными словами, кривая распределения есть графическое изображение в виде непрерывной линии изменения частот в интервальном вариационном ряду, которое функционально связано с изменением вариант. Известно много форм кривых распределений, но наиболее известной и чаще всего применяемой в практике статистических исследований является кривая нормального распределения.

Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением

,

где - ордината кривой нормального распределения; е и - математические постоянные; - средняя величина; - среднее квадратическое отклонение.

График кривой нормального распределения имеет вид (рис. 13).

Подавляющему числу явлений и процессов, изучаемых правовой статистикой, присущ нормальный закон распределения, кривая которого на графике зависимости y от x (см. рис. 13) характеризуется рядом особенностей, которые применительно к статистической совокупности можно сформулировать следующим образом:

1. Куполообразная форма, симметричная относительно значения , где - значение средней арифметической среди имеющихся вариантов изучаемого признака, Mo - мода, Me - медиана.

2. Асимптотическое приближение к оси абсцисс в обе стороны от . Чем больше конкретный вариант отличается от , тем меньше его частота. При этом, в интервале ( - среднее квадратическое отклонение) находится приблизительно 68,3% всех единиц изучаемой совокупности, в интервале - 95,4% единиц, в интервале - 99,7%.

Если нужно получить теоретические частоты при выравнивании интервального вариационного ряда по кривой нормального распределения, то можно воспользоваться приближенной формулой:

,

где - сумма всех частот интервального вариационного ряда; - величина i-го интервала; - среднее квадратическое отклонение; - нормированное отклонение серединных значений интервалов от средней арифметической показателя; - серединные значения интервалов вариационного ряда; - средняя величина показателя. Значения для нормированных отклонений находят по статистическим таблицам (табл. 1 приложения 2). При этом следует иметь в виду, что функция - четная, т.е. , поэтому в таблице приведены значения функции только для положительных значений аргумента.

При помощи этой формулы мы получаем теоретическое распределение, заменяя им наблюдаемое распределение. Объективная характеристика соответствия теоретического и наблюдаемого распределений может быть получена при помощи специальных статистических показателей, которые называют критериями согласия. Для оценки близости наблюдаемых и теоретических частот применяются критерии согласия Пирсона, Романовского, Колмогорова и др. Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между и к теоретическим частотам:

.

Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по статистической таблице (табл. 3 приложения 2). Оно зависит от принятой доверительной вероятности p и числа степеней свободы k (при этом k = m - 3, где m - число интервалов в вариационном ряду распределения). Если , то расхождения между наблюдаемыми и теоретическими частотами распределения могут быть случайными и предположение о близости наблюдаемого распределения к нормальному не может быть отвергнуто.

Пример. Статистическая совокупность данных о длительности нахождения дела в производстве суда представлена в виде следующего интервального вариационного ряда:

Длительность нахождения дела в производстве суда (в днях) 14-35 35-56 56-77 77-98 98-119 119-140 140-161
Количество дел              

При помощи критерия согласия Пирсона проверить предположение о близости наблюдаемого распределения длительности нахождения дела в производстве суда к нормальному распределению.

Решение. Прежде всего найдем среднюю арифметическую и среднее квадратическое отклонение а. Для того чтобы определить среднее значение на основе интервального вариационного ряда, необходимо сначала найти серединные значения интервалов:

Теперь находим среднее значение по формуле средней арифметической взвешенной:

Далее по формуле для взвешенной дисперсии находим:

Тогда среднее квадратическое отклонение равно:

Таким образом, нам нужно проверить предположение о близости наблюдаемого распределения к нормальному со средней арифметической, равной 85 и средним квадратическим отклонением .

Вычислим теоретические частоты, воспользовавшись приведенной выше формулой. Получим:


Находим значение критерия Пирсона:


Табличное значение определяется по статистической табл. 3 приложения 2. Оно зависит от принятой доверительной вероятности p и числа степеней свободы к = m - 3, где m - число групп в ряду распределения. Выбираем доверительную вероятность p = 0,95. Так как табл. 3 составлена для уровня значимости = 1 - p, то при выбранной доверительной вероятности p = 0,95 = 1 - 0,95 = 0,05. Число групп в ряду распределения m = 7, следовательно, число степеней свободы к = m - 3 = 7 - 3 = 4. Из табл. 3 . Так как , то расхождения между наблюдаемыми и теоретическими частотами распределения могут быть случайными, и предположение о близости наблюдаемого распределения длительности нахождения дела в производстве суда к нормальному распределению не может быть отвергнуто.

Замечание. Необходимые табличные значения можно находить, используя приложение MS Excel. Для этого на "панели инструментов" нажимаем кнопку далее в "категории" выбрать "статистические" и в них выбираем функцию ХИ2ОБР из списка функций. Появляется окно ввода значений. В строку окна ввода "Вероятность" вводим уровень значимости = 1 - p, где p - доверительная вероятность, а в строку окна ввода "Степени_свободы" - число степеней свободы к = m - 3, где m - число групп в ряду распределения, ОК. Получаем нужное табличное значение .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: