Показатели центра распределения, мода и медиана
Интервальные ряды распределения
Ряды распределения, признаки рядов распределения
ТЕМА №5
Тема: РЯДЫ РАСПРЕДЕЛЕНИЯ
1. Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному группировочному признаку, который изменяется количественно и качественно от одной единицы к другой или от одного периода времени к другому.
Ряды распределения могут быть:
1) атрибутивные, т.е. ряды распределения, построенные по качественным признакам.
2) вариационные, т.е. ряды распределения, построенные по количественным признакам:
· дискретные признаки, отличаются друг от друга на некоторую конечную величину, т.е. даны в виде прерывных чисел; (н/р число детей в семье, число работников)
· непрерывные признаки, могут отличаться друг от друга на сколь угодно малую величину; (н/р зарплата рабочих, размер среднедушевого денежного дохода)
|
|
Способы построения вариационного ряда для этих видов признаков различны.
Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака, обозначаемые через Хi, а затем подсчитать частоту повторений каждого варианта Fi (например, распределение рабочих по разрядам, студентов по успеваемости и так далее).
Ряд распределения принято оформлять в виде таблиц, например:
Тарифный разряд рабочего, хi | Число рабочих, имеющих этот разряд, fi | Частота, Wi | Накопленная частота, Si |
итого | 0,05 0,25 0,40 0,20 0,10 1,00 |
Т.о., ряд первичных данных, характеризующих квалификацию 20 рабочих, заменен коротким рядом, состоящим из 5 групп. Вместо абсолютного числа рабочих, имеющих определенный разряд можно установить долю рабочих этого разряда.
Вариационные ряды состоят из вариантов и частот (частостей).
Варианты – отдельные значения признака, которые он принимает в вариационном ряду распределения.
Частоты – числа, показывающие, как часто встречаются те или иные варианты в вариационном ряду распределения.
Частости – частоты, выраженные в долях единицы или в процентах к итогу.
2. В тех случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значение признака у отдельных единиц может вообще не повторяться, строятся интервальные ряды распределения.
Интервал указывает определенные пределы значений варьирующегося признака и обозначается верхней и нижней границами интервала.
При построении интервальных рядов распределения необходимо прежде всего установить число групп (интервалов), на которые будут разбиты все единицы изучаемой совокупности.
|
|
Определение величины интервала (h) для построения вариационного ряда с равными интервалами производится следующим образом:
· вычисляется разность между максимальным и минимальным значением признака первичного ряда (определяется размах вариации R):
R =X max – Xmin;
· размах вариации делится на число групп k, то есть h = R / k..
Число групп приближенно определяется по формуле Стэрджесса:
K = 1+ 3,322 lg n,
где n – общее число изучаемых единиц совокупности, оно обычно дробное и его следует округлить.
3. Для характеристики среднего значения признака в вариационном ряду используются: средняя арифметическая, мода и медиана.
Средняя арифметическая для дискретного ряда распределения рассчитывается по формуле:
Хсред. = S хi fi / S fi; где хi – варианта значений признака;
fi – частота повторения данного варианта.
В вариационном интервальном ряду средняя арифметическая определяется по формуле:
Хсред. = S хki fi / S fi;; где хki - середина соответствующего интервала.
В отличии от средней арифметической, рассчитываемой на основе использования всех вариантов значений признака, мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.
Медиана (Ме) соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется ее номером NMe =(n + 1) / 2, где n – число единиц в совокупности.
Например:
№ группы | Заработная плата, тыс.тенге | Число работников, чел. | Сумма накопленных частот |
I II III IV V VI | 50-60 60-70 70-80 80-90 90-100 Свыше 100 | - - - |
Мода - наиболее часто встречающееся значение признака совокупности. Для указанного в примере ряда распределения она также …..(максимальная частота).
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода и медиана.
Для определения медианы в интервальном ряду используют следующую формулу:
М= x+ h=
;где Х Ме – нижняя граница медианного интервала;
h – величина интервала;
S(-1) – накопленная частота интервала, предшествовавшего медианному;
fMe – частота медианного интервала.
НАПРИМЕР:
Размер прибыли, млн.тг | Число банков | Накопленная частота |
3,7 - 4,6 | ||
4,6 – 5,5 | ||
5,5 – 6,4 | ||
6,4 – 7,3 | ||
7,3 – 8,1 | ||
Итого |
В нашем примере рассчитаем медиану. По накопленным частотам определяем, что медиана находится в интервале 5,5 – 6,4.
Тогда:
Ме = 5,5+0,9* 0,5*20 – 6 = 6,175млн. тг
Т.о. 50% банков имеют прибыль менее 6,175 млн. тг, а 50% банков – более 6,175 млн. тг.
Теперь определиммоду. Наибольшая частота также соответствует интервалу 5,5 – 6,4,то есть мода должна находиться в этом интервале. Ее величину определяем по формуле:
М= xh;
где:
Хмо – начало модального интервала;
fMo - частота, соответствующая модальному интервалу;
f(-1) - предмодальная частота;
f(+1) -послемодальная частота.
Приведенная формула может быть использована в вариационных рядах с равными интервалами:
Мо = 5,5 + 0,9 (6 – 4) / ((6 – 4) + (6 - 5)) = 6,10 млн. тг
Т.о., в данной совокупности наиболее часто встречается размер прибыли 6,10 млн. тг
4. Д ля измерения степени колеблемости отдельных значений признака от средней исчисляются основные обобщающие показатели вариации: дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Дисперсия (s2) – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической.
В зависимости от исходных данных дисперсия вычисляется по формуле средней арифметической простой или взвешенной:
_
s2 = S (х - х)2 / n - простая
_
s2 = S (х - х)2 f / S f - взвешенная
|
|
Среднее квадратическое отклонение (s) представляет собой корень квадратный из дисперсии и равно
s = ÖS (х - х)2 / n - невзвешенное
_
s = ÖS (х - х)2 f / S f - взвешенное.
В отличие от дисперсии среднее квадратическое отклонение является абсолютной мерой вариации признака в совокупности и выражается в единицах измерения варьирующего признака (тенге, тоннах, процентах и т.д.).
Для сравнения размеров вариации различных признаков, а также для сравнения степени вариации одноименных признаков в нескольких совокупностях исчисляется относительный показатель вариации – коэффициент вариации (V), который представляет собой процентное отношение среднего квадратического отклонения к средней арифметической:
V = s *100/ xсред
По величине коэффициента можно судить о степени вариации признаков, а следовательно, об однородности состава совокупности. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по составу.
НАПРИМЕР:
Стаж, лет | Среднесписочная численность работников, чел., f | Середина интервала, хi | xi f | xi - xcp | (xi -xcp)2 | (xi -xcp)2 f |
До 3 3-5 5-7 7-9 свыше 9 | -3 -1 | |||||
Итого | - | - | - |
Определить:
1) средний стаж работников;
2) дисперсию;
3) среднее квадратическое отклонение;
4) коэффициент вариации.
Решение: 1. Хсред. = 500/100=5 лет
2. дисперсия
s2= 356/100=3,56=3,6
3. среднее квадратическое отклонение
s = Ö356/100 = Ö 3,6 = 1,8867
4. коэффициент вариации
V = 1,8867/5 * 100 =37,7 %
Правило сложения дисперсий (вариаций). Для статистической совокупности, сгруппированной по изучаемому признаку, возможно вычисление трех видов дисперсий: общей (s2), частных (внутригрупповых) – (si2) и межгрупповой (d2). Общая дисперсия характеризует вариацию всех единиц совокупности от общей средней, частные – вариацию признака в группах от групповой средней и межгрупповая - вариацию групповых средних от общей средней. Между указанными видами дисперсий существует соотношение, которое называют правилом сложения дисперсий: общая дисперсия равна сумме средней из частных дисперсий и межгрупповой:
|
|
s2 =`si2 + d2
Если основанием группировки является факторный признак, то с помощью правила сложения дисперсий можно измерить силу его влияния на результативный признак. Вычислив коэффициент детерминации и эмпирическое корреляционное отношение.
Коэффициент детерминации равен отношению межгрупповой дисперсии к общей:
h2 = d2х / s2
Показывает долю общей вариации результативного признака, обусловленную вариацией группировочного признака.
Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением:
h = Öd2х / s2
По абсолютной величине он может изменяться от 0 до 1. Если h = 0, группировочный признак не оказывает влияния на результативный. Если h = 1, изменение результативного признака полностью обусловлено группировочным признаком, т. е. между ними существует функциональная связь.
ТЕМА №9 Тема: ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ