Любое статистическое исследование начинается со сбора информации в соответствии с поставленной задачей. Далее результаты статистического наблюдения необходимо систематизировать и рассчитать обобщающие показатели, характеризующие ряд распределения (средние, показатели вариации и др.), для выявления закономерностей, присущих анализируемой совокупности единиц.
Средними величинами в статистике называют обобщающие показатели, выражающие типичные, характерные для определенных условий места и времени размеры и количественные соотношения явлений общественной жизни.
В статистике различают несколько видов средних величин: средние степенные (арифметическую, гармоническую, геометрическую и др.) и структурные средние (мода, медиана, квартили, квинтили, децили и перцентили).
В зависимости от частоты повторения вариант средние исчисляются как простые не взвешенные, так и взвешенные.
Среднюю арифметическую не взвешенную рассчитывают по формуле:
,
а среднюю арифметическую взвешенную –
|
|
где - значение осредняемого признака,
- частота,
n- число единиц совокупности.
Средняя гармоническая не взвешенная определяется по формуле
,
а средняя гармоническая взвешенная -
,
где - сумма значений осредняемого признака по группе.
Средняя гармоническая вычисляется в тех случаях, когда средняя предназначается для расчёта сумм слагаемых, обратно пропорциональных величине заданного признака, т.е. когда суммированию подлежат не сами варианты, а обратные им величины.
Средняя геометрическая определяется по формуле
Наиболее широкое применение средняя геометрическая получила для определения среднегодовых темпов роста в рядах динамики.
При выборе вида средней следует исходить из реального экономического смысла поставленной задачи.
Структурными средними являются мода, медиана, квартили и др. Эти величины также используются в качестве характеристики вариационного ряда.
Мода (М0) - варианта, встречающаяся в изучаемой совокупности чаще всего, т.е. варианта, которой соответствует наибольшая частота.
Для дискретного ряда распределения мода определяется наиболее просто: варианта, против которой располагается наибольшая частота, и будет модой.
В интервальном ряду наибольшая частота указывает не на модальную варианту, а на содержащий моду интервал. Поэтому в модальном интервале необходимо определить модальную варианту. При этом надо иметь в виду, что при расчетах будет получено не точное, а некоторое условное значение моды, так как неизвестен характер распределения частоты внутри модального интервала.
Вычисление моды в интервальном ряду с равными интервалами производится по следующей формуле:
|
|
,
где хМо - начало (нижняя граница) модального интервала (15);
i - величина интервала (2);
fМо - частота модального интервала (30);
f Мо-1 - частота интервала, предшествующего модальному (20);
f М0+1 - частота интервала, следующего за модальным (25).
Воспользуемся данными табл. 1.1. и рассчитаем моду:
Медиана (Ме)- варианта, находящаяся в средине ряда распределения. Для ее определения достаточно расположить в порядке возрастания или убывания все варианты. Срединная варианта и будет являться медианой. Расчет медианы для интервального ряда производится по формуле
,
где хМе - начало (нижняя граница) медианного интервала (15);
i - величина интервала (2);
- сумма накопленных частот ряда (100);
sМе-1 - накопленная частота вариант, предшествующих медианному (35);
fМе - частота медианного интервала (30).
Воспользуемся данными табл. 1.1. и рассчитаем медиану. В табл. 1.1. Ме лежит между 50 и 51 частотами, а они находятся в сумме накопленных частот, равной 65, поэтому интервал 15-17 является медианным. Определяем медиану
Для характеристики размеров колеблемости признаков в статистике применяется следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации и др.
Размах вариации представляет собой разность между наибольшим (хmax) и наименьшим (xmin) значениями вариант, т.е.
R = хmax - хmin
Например, размах вариации производительности труда рабочих в бригаде (см.табл.1.1) равен: 21-9 = 12 шт. в смену. Среднее линейное отклонение определяется из отношения суммы, взятой по абсолютной величине (без учёта знака) отклонения всех вариант от средней арифметической, к объёму всей совокупности. Оно бывает не взвешенное и взвешенное и определяется соответственно по формулам:
,
.
Дисперсия - это средняя из квадратов отклонений значений признака от его средней арифметической величины. Она определяется по формуле средней арифметической простой:
или средней арифметической взвешенной
Если имеются два взаимоисключающих друг друга варианта, то вариация признака называется альтернативной. Обозначая наличие признака - 1, а отсутствие - 0, и долю вариантов обладающих данным признаком - p, а долю вариантов, не обладающих им - q и замечая, что p+q=1, получаем среднюю:
Дисперсию альтернативного признака определяем по формуле:
Следовательно, дисперсия альтернативного признака
Среднее квадратичное отклонение - это корень квадратный из дисперсии - определяется по формулам средней арифметической простой:
или средней арифметической взвешенной
Среднее квадратическое отклонение альтернативного признака:
Мерой сравнения степеней колеблемости для двух, трех и более вариационных рядов служит показатель, который носит название коэффициента вариации и определятся по формуле:
Коэффициент вариации показывает однородность выбранной совокупности: чем он меньше, тем более однородна совокупность. Для однородной совокупности он не превышает 33%.
Для характеристики социально-экономического явления, отражённого рядом распределения, следует рассчитать первый и третий квартиль (второй равен медиане) по следующим формулам, аналогичным медиане:
Расчёт квартилей позволяет отметить, что 25% рабочих за смену изготовляют до 14 деталей, а 25% - свыше 17,8 деталей, т.е. в 1,27 раз больше первой группы. Остальные 50% делают от 14 до 17,8 деталей за смену.
Сравнивая среднее значение признака с модой и медианой можно отметить, что их значения довольно близки, но не равны между собой. Следовательно ряд распределения имеет некоторую асимметрию, которая может быть определена по формуле: . Тогда , т.е. коэффициент асимметрии меньше 0, Мо больше среднего значения признака и это говорит о небольшой левосторонней асимметрии. Если коэффициент асимметрии больше 0 и Мо меньше среднего значения признака, то наблюдается правосторонняя асимметрия.
|
|
Результаты расчета средней и показателей вариации студент должен представить в таблице по форме табл. 1.1.
Таблица 1.1.
Пример определения средней и показателей вариации.
Прцент зольности угля | Число проб | Накопленные частоты | Центральная варианта хi | ||||||
9-11 11-13 13-15 15-17 17-19 19-21 | -5,8 -3,8 -1,8 +0,2 +2,2 +4,2 | 5,8 3,8 1,8 0,2 2,2 4,2 | 29,0 38,0 36,0 6,0 55,0 42,0 | 33,64 14,44 3,24 0,04 4,84 17,64 | 168,20 144,40 64,8 1,2 121,0 176,4 | ||||
– | – | – | – | – | |||||
– | – |
Задание2.