Понятие о вариации и вариационном ряде

Тема 7. СТАТИСТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ

 

План:

1. Понятие о вариации и вариационном ряде.

2. Показатели вариации признака.

3. Закон сложения дисперсии.

4. Форма распределения признака и её показатели.

 

Понятие о вариации и вариационном ряде

Средняя величина даёт абстрактную обобщающую характеристику признака изучаемой статистической совокупности, но она не показывает строения совокупности, которое весьма существенно для её познания. Однако, только основываясь на средней, нельзя сказать ничего о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от неё. Так, в некоторых случаях отдельные значения весьма близки к средней, в этом случае значение средней хорошо характеризуют совокупность. В других случаях отдельные значения далеки от средней (выбросы), и тогда средняя не будет отражать всю совокупность. В связи с этим построение средней необходимо дополнять расчётом и анализом показателей вариации.

Термин «вариация» происходит от латинского слова variatio и обозначает «изменение, перемена, колеблемость, различие». При изучении статистической совокупности интересующий нас признак у различных единиц совокупности принимает различные значения, т. е. он имеет некоторую вариацию.

Вариация признака – это различие индивидуальных значений признака внутри изучаемой совокупности, т. е. колеблемость, многообразие, изменяемость величины признака у отдельных единиц совокупности. Однако не всякие различия принято называть вариацией. Под вариацией в статистике понимают такие количественные изменения величины исследуемого признака в пределах однородной совокупности, которые обусловлены перекрещивающимся влиянием действия различных факторов. Это изменение возникает в результате того, что индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются и воздействуют на совокупность целого.

Вариация имеет объективный характер и помогает познать сущность изучаемого явления. Если средняя величина сглаживает индивидуальные различия, то вариация, наоборот, их подчёркивает, устанавливая типичность или нетипичность найденной средней величины для конкретной статистической совокупности. Тем самым можно делать вывод о качественности подобранных статистических данных.

Анализ статистической совокупности позволяет оценить степень зависимости изучаемой совокупности и её признаков от тех или иных факторов. Различают вариацию признака случайную и систематическую. Случайная вариация обусловлена несущественными факторами, которые могут по-разному влиять на единицы совокупности. Все изменения носят хаотический характер, нет устойчивой связи факторов с единицами совокупности. Систематическая вариация порождается существенными факторами, когда наблюдается последовательное изменение значений признака в определённом направлении. Здесь имеет место причинно-следственная связь между признаками (один признак – факторный, другой – результирующий). Следовательно, общая вариация признака складывается из систематической и случайной вариаций.

Чтобы выявить характер распределения единиц совокупности по варьирующим признакам, определить закономерности в этом распределении, строят специальные ряды распределения единиц совокупностей по какому-либо варьирующему признаку.

Рядами распределения называются простые структурные группировки по одному признаку, упорядоченное расположение единиц статистической совокупности. Другими словами, это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку. Ряд распределения даёт общую характеристику структуры совокупности и позволяет получить информацию, во-первых, о возможных вариантах значения признака в данной совокупности, во-вторых, о том, как часто встречаются отдельные значения данного признака (их удельный вес в общем итоге).

Ряды распределения, построенные по качественному признаку, называются атрибутивными (распределения населения по полу, занятости, национальности, профессии и т. д.), а по количественному признаку – вариационными (распределения населения по возрасту, рабочих – по стажу работы, заработной плате и т. д.).

При анализе вариационных рядов в статистике решают следующие задачи:

1). Определение меры вариации, т. е. количественное измерение степени колеблемости признака. Это позволяет сравнивать различные совокупности между собой по степени рассеяния и отслеживать уровень вариации признака одной и той же совокупности в различные периоды.

2). Исследование свойств и закономерностей вариации в статистических совокупностях для изучения причин, вызывающих вариацию.

Вариационный ряд по своей конструкции имеет две характеристики:

1) варианты – числовые значения количественного признака в ряду распределения, они могут быть положительными и отрицательными, абсолютными и относительными: xi, i = 1, 2, …, n;

2) число повторения отдельных вариантов значений признаков или каждой группы вариационного ряда (k):

а) абсолютные – частоты: ni или fi,причём  ;

б) относительные – частости wi (относительные доли частот в общей сумме частот): .

Сумма всех частот составляет объём статистической совокупности и определяет число элементов всей совокупности. Если варианты расположены по возрастанию или убыванию значения признака, то ряд называется ранжированным. Тогда можно сказать, что вариационный ряд – это ранжированный (упорядоченный) в порядке возрастания или убывания ряд статистических частот (частостей).

Для характеристики величины признака в вариационном ряду используются ещё два вида частотных показателей:

1). Накопленная частота показывает, какое число единиц имеет величину варианты, не большую данной. Она определяется путём суммирования значения признака по данной группе со всеми частотами предшествующих групп.

2). Накопленная частость характеризует удельный вес единиц наблюдения, у которых значения признака не превосходят верхнюю границу данной группы. Она показывает удельный вес вариант в совокупности, имеющих значение не больше данного.

Вариационные ряды, отражающие динамику накопленных частот, называются кумулятивными рядами. С их помощью можно указать число единиц со значением признака до какого-либо предела.

Вариационные ряды в зависимости от характера вариации и способа построения подразделяются на дискретные и интервальные.

Дискретный вариационный ряд можно рассматривать как такое преобразование ранжированного ряда, при котором перечисляются отдельные значения признака и указывается их частота. Дискретно варьирующий признак всегда принимает строго определённые целочисленные значения (число работников предприятия, тарифный разряд, число детей в семье, успеваемость студентов).

Если число вариантов велико или признак имеет непрерывную вариацию (может принимать любые значения в рамках каких-либо границ – зарплата рабочих, размер среднедушевого денежного дохода семьи, стоимость основных фондов предприятия), то строится интервальный вариационный ряд, в котором отдельные варианты объединяются в интервалы (группы). Интервальные вариационные ряды могут быть построены как с равными, так и неравными интервалами. В последнем случае для характеристики распределения следует учитывать показатель абсолютной (относительной) плотности распределения, который представляет собой отношение частоты (частости) к длине интервала.

Простейшая форма представления вариационного ряда – таблица, состоящая из двух граф, в первой из которых указываются значения признака (варианты), а во второй фиксируется число единиц наблюдения, обладающих данным значением (частоты).

Наиболее наглядная форма представления вариационного ряда – графическая.

Дискретный ряд распределения графически представляется в виде полигона распределения, где фиксируются числовые значения вариант xi. Для его построения на оси ординат откладываются частоты (частости), а на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует частоте (частости) этих вариантов по принятому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Полученная ломаная линия считается оценкой плотности распределения признака.

Интервальный ряд графически изображается при помощи гистограммы. На оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади (высоты, т. к. ширина всех прямоугольников одинакова) которых пропорциональны частотам (или частостям) интервала. В рядах с неравными интервалами высота прямоугольника определяется посредством деления частоты (частости) каждого интервала на его длину. Оценкой плотности служит огибающая всех прямоугольников. Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединяются отрезками прямых.

В ряде случаев для изображения как дискретных, так и интервальных рядов используется кумулятивная кривая (кумулята). Для её построения надо откладывать по оси ординат накопленные частоты (или частости). Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение, и определяются последовательным суммированием частот интервалов.

Пример 1.1.

Построить графическое отображение вариационного ряда. Дано распределение рабочих механического цеха по тарифному разряду:

Тарифный разряд, хi 1 2 3 4 5 6 Сумма
Количество рабочих (частота), fi 2 3 6 25 9 5 50
Частость, wi = fi / n 0,04 0,06 0,12 0,5 0,18 0,1 1

Данный вариационный ряд является дискретным, его графическое отображение представлено в виде полигона распределения (рис. 1).

     
 

 


а) Дискретный вариационный ряд,              б) Интервальный вариационный ряд,

        (полигон распределения)                                  (гистограмма, полигон)

Рис. 1. Графическое отображение вариационных рядов

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: