К выполнению задания 1

Любое статистическое исследование начинается со сбора информации в соответствии с поставленной задачей. Далее результаты статистического наблюдения необходимо систематизировать и рассчитать обобщающие показатели, характеризующие ряд распределения (средние, показатели вариации и др.), для выявления закономерностей, присущих анализируемой совокупности единиц.

Средними величинами в статистике называют обобщающие показатели, выражающие типичные, характерные для определенных условий места и времени размеры и количественные соотношения явлений общественной жизни.

В статистике различают несколько видов средних величин: средние степенные (арифметическую, гармоническую, геометрическую и др.) и структурные средние (мода, медиана, квартили, квинтили, децили и перцентили).

В зависимости от частоты повторения вариант средние исчисляются как простые не взвешенные, так и взвешенные.

Среднюю арифметическую не взвешенную рассчитывают по формуле:

,

а среднюю арифметическую взвешенную –

где - значение осредняемого признака,

- частота,

n- число единиц совокупности.

Средняя гармоническая не взвешенная определяется по формуле

,

а средняя гармоническая взвешенная -

,

где - сумма значений осредняемого признака по группе.

Средняя гармоническая вычисляется в тех случаях, когда средняя предназначается для расчёта сумм слагаемых, обратно пропорциональных величине заданного признака, т.е. когда суммированию подлежат не сами варианты, а обратные им величины.

Средняя геометрическая определяется по формуле

Наиболее широкое применение средняя геометрическая получила для определения среднегодовых темпов роста в рядах динамики.

При выборе вида средней следует исходить из реального экономического смысла поставленной задачи.

Структурными средними являются мода, медиана, квартили и др. Эти величины также используются в качестве характеристики вариационного ряда.

Мода (М0) - варианта, встречающаяся в изучаемой совокупности чаще всего, т.е. варианта, которой соответствует наибольшая частота.

Для дискретного ряда распределения мода определяется наиболее просто: варианта, против которой располагается наибольшая частота, и будет модой.

В интервальном ряду наибольшая частота указывает не на модальную варианту, а на содержащий моду интервал. Поэтому в модальном интервале необходимо определить модальную варианту. При этом надо иметь в виду, что при расчетах будет получено не точное, а некоторое условное значение моды, так как неизвестен характер распределения частоты внутри модального интервала.

Вычисление моды в интервальном ряду с равными интервалами производится по следующей формуле:

,

где хМо - начало (нижняя граница) модального интервала (15);

i - величина интервала (2);

fМо - частота модального интервала (30);

f Мо-1 - частота интервала, предшествующего модальному (20);

f М0+1 - частота интервала, следующего за модальным (25).

Воспользуемся данными табл. 1.1. и рассчитаем моду:

Медиана (Ме)- варианта, находящаяся в средине ряда распределения. Для ее определения достаточно расположить в порядке возрастания или убывания все варианты. Срединная варианта и будет являться медианой. Расчет медианы для интервального ряда производится по формуле

,

где хМе - начало (нижняя граница) медианного интервала (15);

i - величина интервала (2);

- сумма накопленных частот ряда (100);

sМе-1 - накопленная частота вариант, предшествующих медианному (35);

fМе - частота медианного интервала (30).

Воспользуемся данными табл. 1.1. и рассчитаем медиану. В табл. 1.1. Ме лежит между 50 и 51 частотами, а они находятся в сумме накопленных частот, равной 65, поэтому интервал 15-17 является медианным. Определяем медиану

Для характеристики размеров колеблемости признаков в статистике применяется следующие показатели: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратичное отклонение, коэффициент вариации и др.

Размах вариации представляет собой разность между наибольшим (хmax) и наименьшим (xmin) значениями вариант, т.е.

R = хmax - хmin

Например, размах вариации производительности труда рабочих в бригаде (см.табл.1.1) равен: 21-9 = 12 шт. в смену. Среднее линейное отклонение определяется из отношения суммы, взятой по абсолютной величине (без учёта знака) отклонения всех вариант от средней арифметической, к объёму всей совокупности. Оно бывает не взвешенное и взвешенное и определяется соответственно по формулам:

,

.

Дисперсия - это средняя из квадратов отклонений значений признака от его средней арифметической величины. Она определяется по формуле средней арифметической простой:

или средней арифметической взвешенной

Если имеются два взаимоисключающих друг друга варианта, то вариация признака называется альтернативной. Обозначая наличие признака - 1, а отсутствие - 0, и долю вариантов обладающих данным признаком - p, а долю вариантов, не обладающих им - q и замечая, что p+q=1, получаем среднюю:

Дисперсию альтернативного признака определяем по формуле:

Следовательно, дисперсия альтернативного признака

Среднее квадратичное отклонение - это корень квадратный из дисперсии - определяется по формулам средней арифметической простой:

или средней арифметической взвешенной

Среднее квадратическое отклонение альтернативного признака:

Мерой сравнения степеней колеблемости для двух, трех и более вариационных рядов служит показатель, который носит название коэффициента вариации и определятся по формуле:

Коэффициент вариации показывает однородность выбранной совокупности: чем он меньше, тем более однородна совокупность. Для однородной совокупности он не превышает 33%.

Для характеристики социально-экономического явления, отражённого рядом распределения, следует рассчитать первый и третий квартиль (второй равен медиане) по следующим формулам, аналогичным медиане:

Расчёт квартилей позволяет отметить, что 25% рабочих за смену изготовляют до 14 деталей, а 25% - свыше 17,8 деталей, т.е. в 1,27 раз больше первой группы. Остальные 50% делают от 14 до 17,8 деталей за смену.

Сравнивая среднее значение признака с модой и медианой можно отметить, что их значения довольно близки, но не равны между собой. Следовательно ряд распределения имеет некоторую асимметрию, которая может быть определена по формуле: . Тогда , т.е. коэффициент асимметрии меньше 0, Мо больше среднего значения признака и это говорит о небольшой левосторонней асимметрии. Если коэффициент асимметрии больше 0 и Мо меньше среднего значения признака, то наблюдается правосторонняя асимметрия.

Результаты расчета средней и показателей вариации студент должен представить в таблице по форме табл. 1.1.


Таблица 1.1.

Пример определения средней и показателей вариации.

Прцент зольности угля Число проб Накопленные частоты Центральная варианта хi
                   
9-11 11-13 13-15 15-17 17-19 19-21         -5,8 -3,8 -1,8 +0,2 +2,2 +4,2 5,8 3,8 1,8 0,2 2,2 4,2 29,0 38,0 36,0 6,0 55,0 42,0 33,64 14,44 3,24 0,04 4,84 17,64 168,20 144,40 64,8 1,2 121,0 176,4

Задание2.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: