Определение 12.1

Вариационные ряды

Лекция 12.

План:

1. Вариационные ряды.

2. Числовые характеристики вариационного ряда.

Выборочные данные используются для анализа всей ге­неральной совокупности, но для этого требуется предста­вить их в виде, удобном для обработки. Экономические данные, записанные в порядке их регистрации, обычно труд­нообозримы и неудобны для дальнейшего анализа. Задачей статистического описания данных является получение та­кого их представления, которое позволяет наглядно выя­вить их вероятностные характеристики. Для этого приме­няются различные формы упорядочивания данных — по возрастанию, по совпадающим значениям, по интервалам и т.п. Обычно для решения проблемы наглядности и удоб­ства обработки изучаемой совокупности используют вари­ационные ряды.

Значения изучаемого признака или показателя, характе­ризующие некоторое явление, при переходе от одной еди­ницы объекта статистического наблюдения к другой в вы­борочной совокупности изменяются или варьируют, поэто­му в статистике различные значения признака называют вариантами. Например, если изучаемым признаком явля­ется успеваемость студентов, то вариантами показателя ус­певаемости будут оценки студентов: 2 (неудовлетворитель­но), 3 (удовлетворительно), 4 (хорошо) и 5 (отлично).

С целью упорядочивания и формализации задачи иссле­дования статистических данных их помещают в вариаци­онный ряд. Варианты обычно обозначаются малыми ла­тинскими буквами х, у, z.

Упорядоченный в порядке возраста­ния или убывания ряд значений признака (вариантов) с соответствующими им весами называется вариационным рядом (рядом распределения).

Порядковый номер варианта (значения признака) назы­вается его рангом: х1 — 1-й вариант (1-е значение призна­ка), х2 — 2-й вариант (2-е значение признака), хi — i-й ва­риант (i-е значение признака). Значения признака (вариан­ты) обычно обозначаются: х1, х2, х3,..., хп.

Весами вариантов называют соответствующие им часто­ты или частости.

Определение 12.2.

Под частотой варианта понимают величину mi, которая указывает, сколько раз встречается этот вариант (значение признака) в рассматриваемой ста­тистической совокупности.

Например, если 10 студентов имеют по экзамену оценку пять, то частота варианта х4= 5 будет иметь значение т 4 = 10.

Сумма частот всех вариантов рассматриваемого вариаци­онного ряда равна объему исследуемой совокупности:

(12.1)

где n — объем исследуемой выборочной совокупности;

k — количество значений признака (вариантов);

mi — частота варианта.

Определение 12.3.

Частостью или относительной часто­той называют величину ωi, которая показывает какая часть единиц совокупности имеет этот вариант.

Частость рассчитывается как отношение частоты вариан­та к сумме всех частот ряда:

(12.2)

Очевидно, что сумма всех частостей равна 1:

(12.3)

Различают дискретные и интервальные вариационные ряды.

Определение 12.4.

Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого призна­ка могут отличаться друг от друга не менее чем на неко­торою конечную величину. В дискретных вариационных рядах задаются точечные значения признака.

Общий вид дискретного вариационного ряда указан в таблице 12.1, где i = 1, 2,..., k.

Таблица 12.1

Значения признака (xi) x1 x2 xk
Частоты (mi) m1 m2 mk

Например, оценки, полученные на экзаменах студента­ми, могут принимать дискретные значения: 2, 3, 4, 5 и отли­чаться на один балл, поэтому ряд оценок будет дискрет­ным. Если же мы будем исследовать средний бал студента за все годы обучения, то изучаемый признак средняя оценка может принимать различные значения в интервале [2; 5]. Средний бал одного студента будет 4,562, а другого 4,569, то есть отличаться на очень малую величину. В этом случае для исследования признака используют интервальные ва­риационные ряды.

Графически дискретные вариационные ряды изобража­ются в виде полигона распределения частот или частостей. По оси абсцисс откладывают значения вариантов ряда, а по оси ординат — соответствующие частоты или частости. На пересечении значений признака и соответствующих им час­тот (частостей) откладываются точки, которые, в свою оче­редь, соединяются отрезками. Получающаяся таким обра­зом ломаная называется полигоном распределения частот (частостей).

Определение 12.5.

Интервальные вариационные ряды содержат не конкретные значения вариантов изучаемого признака, а интервалы, в которые попадают эти значе­ния, если они могут отличаться друг от друга на сколь угодно малую величину.


Общий вид интервального вариационного ряда показан в таблице 12.2, где i = 1,2,..., i.

Таблица 12.2

Значения признака a1 – a2 a2 – a3 a2 – a3
Частоты (mi) m1 m2 mi

В интервальных вариационных рядах в каждом интер­вале выделяют верхнюю и нижнюю границы интервала.

Определение 12.6.

Разность между верхней и нижней гра­ницами интервала называют интервальной разностью, или длиной (величиной) интервала.

В общем виде интервальная разность ki рассчитывается по формуле:

Если интервал включает в себя обе границы, то его на­зывают закрытым. Первый и последний интервалы могут быть открытыми, т.е. иметь только одну границу.

Например, имеются данные о средней заработной плате работников в области в тыс. руб., которые помещены в интервальный вариационный ряд в таблице 12.3:

Таблица 12.3

Заработная плата До 3 3-5 5-7 7-9 9-11 Более 11
Число работников            

В этом вариационном ряде первый и последний интер­валы открыты. В процессе обработки данных открытые интервалы приходится условно закрывать. Для этого обычно величину первого интервала принимают равной вели­чине второго, а величину последнего — величине предпос­леднего, то есть рядом стоящего. Закрыв интервалы, полу­чим следующий ряд, который будет равновеликим с интер­вальной разностью 2 тыс. руб. (таблица 12.4.):

Таблица 12.4

Заработная плата 1-3 3-5 5-7 7-9 9-11 11-13
Число работников            

Графически дискретные вариационные ряды изобража­ются в виде гистограммы, или столбчатой диаграммы рас­пределения частот или частостей. При построении гистог­раммы по оси абсцисс откладываются значения изучаемого признака (границы интервалов), а по оси у — соответствую­щие частоты или частости, в том случае, если интервалы одинаковой величины.

Построим гистограмму частот по данным таблицы 12.3, используя мастер диаграмм в MS Excel.

В интервальном вариационном ряде могут встречаются интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность),

их называют равновеликими, в противном случае — нерав­новеликими. Если интервалы имеют разную величину, то при построении гистограммы по оси ординат необходимо от­кладывать значения абсолютной или относительной плот­ности распределения.

Определение 12.7.

Абсолютная плотность i-го интерва­ла f(а)i определяется как отношение частоты интервала mi к его длине ki.

(12.4)

Определение 12.8.

Относительная плотность i-го интервала f(o)i определяется как отношение частости интерва­ла

(12.5)

В процессе построения интервального вариационного ряда необходимо определить оптимальную величину интервальной разности. Для этого используют формулу Стэрджесса:

(12.6)

где п — число единиц совокупности,

— наименьшее и наибольшее значения вариантов ряда.

Для характеристики вариационного ряда наряду с час­тотами и частостями используются накопленные частоты и частости.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: