Показатели вариации признака

Вариация - это различие в значениях какого-либо признака, либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, работники фирмы различаются по доходам, затратам времени на работу, на любимые занятия в свободное время, росту и т.д.

Причиной вариации являются разные условия существования разных единиц совокупности. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта, объективна.

Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выявление ее причин, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом эти отличия велики. Одним словом, в одном случае вариация признака мала, а в другом - велика. А это имеет весьма важное значение для характеристики надежности средней величины..

Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и, наоборот, чем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны еще показатели, которые характеризовали бы отклонения отдельных значений от общей средней.

Это можно показать на таком простом примере. Предположим, что одинаковую работу выполняют две бригады, каждая из трех человек. Пусть количество деталей, изготовленных за смену отдельными рабочими составляло:

в 1 бригаде 95, 100, 105 шт. шт.

во 2 бригаде 75, 100, 125 шт. шт.

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет шт., однако колеблемость выработки отдельных рабочих около средней выработки в первой бригаде значительно меньше, чем во второй. Возможно, что этому способствовал ряд факторов: квалификация рабочих, их производственный стаж, возраст, интенсивность труда и т.д.

Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.

К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.

Самым элементарным показателем вариации признака является размах вариации (R), представляющий собой разность между максимальным и минимальным значениями признака, т.е.

R =. (5.15)

В нашем примере размах вариации сменной выработки составляет: в 1 бригаде: = 10 деталей (105 - 95); во 2 бригаде: = 50 деталей (125 - 75), т.е. в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более “устойчива”, в смысле возможного изменения ее размеров. С другой стороны, размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 375 деталей (3 х 125), а в первой - только 315 деталей (3 х 105).

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. Поэтому, не умоляя значение этого показателя, в изучении вариации нельзя ограничиваться определением одного лишь ее размаха. Для анализа вариации необходим и показатель, который отражает все колебания варьирующего признака, дающий обобщенную характеристику. Простейший показатель такого типа - среднее линейное отклонение.

Среднее линейное отклонение () представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта:).

Формула среднего линейного отклонения

для несгруппированных данных:, (5.16)

где - число членов ряда;

для сгруппированных данных:, (5.17)

где - сумма частот вариационного ряда.

В формулах 5.16 и 5.17 разности в числителе берутся по модулю, т.е без учета их знаков (иначе в числителе всегда будет число “ 0 “- алгебраическая сумма отклонений вариантов от их средней арифметической).Поэтому среднее линейное отклонение, как меру вариации признака, применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли и т.п.

Чаще отклонения от средней возводят в квадрат и из квадратов отклонений, которые будут все с положительными значениями, исчисляют среднюю величину. Полученный показатель вариации называют дисперсией признака и обозначают греческой буквой (сигма в квадрате).

Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины и вычисляется по формулам простой и взвешенной дисперсии (в зависимости от исходных данных):

для несгруппированных данных простая дисперсия, (5.18)

для вариационного ряда - взвешенная дисперсия. (5.19)

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

Формулу (5.18) для расчета дисперсии можно преобразовать следующим образом, учитывая при этом, что:

или (5.20)

т.е. дисперсия равна разности средней из квадратов вариантов и квадрата их средней.

Техника вычисления дисперсии по формулам 5.18, 5.19, 5.20 достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой. Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике).

Приведем некоторые из них:

1)если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;

2)если все значения признака уменьшить или увеличить в одно и то же число раз (раз), то дисперсия соответственно уменьшится или увеличится в раз.

Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу “моментов”:

, (5.21)

где - дисперсия, исчисленная по способу моментов;

- величина интервала;

- новые (преобразованные) значения вариантов;

А - условный нуль, в качестве которого удобно использовать

середину интервала, обладающего наибольшей частотой;

- так называемый момент второго порядка;

- квадрат момента первого порядка.

Расчет дисперсии по формуле (5.21) менее трудоемок, что будет проиллюстрировано ниже.

Дисперсия имеет большое значение в экономическом анализе. На дисперсии основаны практически все методы математической статистики. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака; использование дисперсии для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений.

Однако, применение дисперсии, как меры вариации, в ряде отдельных случаев с точки зрения ее экономической интерпретации бывает не совсем удобным, потому что размерность дисперсии равна квадрату размерности изучаемого явления. Поэтому в таких случаях вычисляют среднееквадратическое отклонение.

Среднее квадратическое отклонение () равно корню квадратному из дисперсии:

для несгруппированных данных, (5.22)

для вариационного ряда. (5.23)

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Оно показывает, на сколько в среднем отклоняются конкретные варианты от среднего их значения. Оно является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, и поэтому экономически хорошо интерпретируется.

Особый интерес представляет нахождение дисперсии альтернативного признака, т.е. признака, которым единицы изучаемой совокупности могут либо обладать, либо не обладать. Обозначив наличие интересующего нас признака через 1, а его отсутствие - через 0; долю единиц, обладающих данным признаком, - через, не обладающих - через; исчислим среднее значение альтернативного признака и его дисперсию.

Среднее значение альтернативного признака равно:

, (5.24)

так как (сумма долей, обладающих и не обладающих данным признаком, равна единице).

Дисперсия альтернативного признака:

. (5.25)

Подставив в формулу дисперсии вместо значение, получим:

Таким образом, дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком на долю единиц, не обладающих данным признаком.

Например, если на 10 000 человек населения района приходится 4500 мужчин и 5500 женщин, то:

Дисперсия альтернативного признака будет равна:

Предельное значение дисперсии альтернативного признака равно. Оно получается при.

Среднее квадратическое отклонение альтернативного признака:

. (5.26)

Если, например, всех деталей бракованные, то - годные.

Для этого случая дисперсия доли брака будет равна:

Среднее квадратичное отклонение для доли брака составит:

, или.

При вычислении средних величин и дисперсии для интервальных рядов распределений интервальные значения признака заменяются центральными (серединными) значениями интервалов, которые более или менее отличаются от средней арифметической значений, включенных в интервал. Это приводит к появлению систематической погрешности при расчете дисперсии. В.Ф. Шеппард установил, что ошибка в дисперсии, вызванная применением при расчете сгруппированных данных, составляет 1/12 квадрата величины интервала, т.е. скорректированная дисперсия равна.

Поправка Шеппарда должна применяться, если распределение близко к нормальному, относится к признаку с непрерывным характером вариации, построено по большому количеству исходных данных (>500).

Чем меньше дисперсия и среднее квадратическое отклонение, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости в почву удобрений и урожайности отдельных культур и т.д. Для подобных сопоставлений показатели абсолютнойколеблемости признаков не пригодны. Так, нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.

Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используют относительный показатель вариации - коэффициент вариации.

Коэффициент вариации представляет собой выраженное в процентах отношение среднегоквадратического отклонения к средней арифметической:

. (5.27)

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %.

Покажем расчет различными способами показателей вариации на примере данных о сменной выработке рабочими бригады, представленных интервальным рядом распределения (табл5.8).

Таблица 5.8

1 2 3

Подборка статей по вашей теме: