Меры вариации

ВЫРАВНИВАНИЕ ВАРИАЦИОННЫХ РЯДОВ – ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ.

ПОКАЗАТЕЛИ ВАРИАЦИОННОГО РЯДА.

Тема 6.

Задача 4.3

Задача 4.2

Задача 4.1

Имеются следующие данные о производстве продукта А пятью рабочими бригады за смену:

Номер рабочего          
Произведено продукции А за смену, шт.,          

Определить среднюю выработку одного рабочего данной бригады.

Средняя выработка определяется как средняя арифметическая простая:

Имеется следующее распределение 60 рабочих по тарифному разряду (ряд дискретный):

Тарифный разряд          
Число рабочих          

Определить средний тарифный разряд рабочих.

Расчет производим по средней арифметической взвешенной:

Требуется определить среднемесячную заработную плату одно­го рабочего на предприятии по следующим данным (графы 1 и 2 таблицы):

Месячная заработная плата, руб. Число рабочих // Середина интервала х, Xifi
       
8000-8500      
8500-9000      
9000-9500      
9500-10000      
10000-10500      
10500-11000      
Итого   -  

Для интервальных рядов сначала находят центры (середины) интервалов, а затем последние умножают на веса, произведения суммируют и делят на сумму весов.

Среднее значение признака в каждом интервале дано в гра­фе 3. Результаты умножения вариантов навеса показаны в графе 4.

Отсюда средняя заработная плата одного рабочего

Когда весами у отдельных признаков служат показатели, явля­ющиеся произведением этих вариантов на количество единиц, то средняя из всех вариантов рассчитывается как средняя гармоничес­кая взвешенная, формула которой:

Например, Мi – выработка за смену в i-й бригаде;

хi – средняя выработка рабочих i-й бригады.

Если Мi равны между собой, то

Средняя геометрическая:

- простая:

- взвешенная:

Средняя квадратическая:

- простая:

- взвешенная:

Средняя хронологическая:

Все основные средние величины могут быть пред­ставлены в виде общей формулы:

где — средняя величина;

х — индивидуальное значение признака;

n — число единиц изучаемой совокупности;

k — показатель степени, определяющий вид средней.

Общее правило:


(ТЕОРИЯ СТАТИСТИКИ – ЗЕЛЕНЫЙ СТАРЫЙ)

Тема 6 коник

Средние величины, описанные выше, дают обобщенное пред­ставление об изучаемой совокупности, и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспор­но. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов. Поэтому, кроме рассмотрен­ных средних, в статистическом анализе целесообразно использо­вать величины конкретных вариантов, занимающие в упорядо­ченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употре­бительными являются структурные (или описательные) средние — мода (Мо) и медиана (Ме).

Мода — величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжи­рованного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой- либо товар. Она показывает размер признака, свойственный зна­чительной части совокупности, и определяется по формуле (для интервального ряда):

Медианой называется вариант, расположенный в центре ран­жированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое коли­чество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой — больше ее. Медиана используется при изучении элемен­та, значение которого больше или равно или одновременно мень­ше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ря­да решается просто. Если всем единицам ряда придать порядко­вые номера, то порядковый номер медианного варианта опреде­ляется как (n + 1) /2с нечетным числом членов n. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих по­рядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных ря­дах сначала определяется интервал, в котором она находится (ме­дианный интервал). Этот интервал характерен тем, что его накоплен­ная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда произ­водится по формуле:

Наряду с медианой для более полной характеристики структу­ры изучаемой совокупности применяют и другие значения ва­риантов, занимающих в ранжированном ряду вполне определен­ное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили — на десять равных частей. Квартилей насчитывается три, а децилей — девять.

Медиана и мода в отличие от средней арифметической не по­гашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важны­ми характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Осо­бенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирую­щего признака. Эти не очень характерные для совокупности зна­чения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

3. Показатели вариации

Целью статистического исследования является выявление ос­новных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистиче­ского наблюдения строят ряды распределения. Различают два типа рядов распределения — атрибутивные и вариационные — в зависи­мости от того, является ли признак, взятый за основу группиров­ки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности непостоянны, бо­лее или менее различаются между собой. Такое различие в вели­чине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характе­ра и степени вариации признаков у отдельных единиц совокупно­сти является важнейшим вопросом всякого статистического ис­следования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования являет­ся определение роли отдельных факторов или их групп в вариа­ции тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследо­вания вариации, основанные на использовании системы показа­телей, с помощью которых измеряется вариация. В практике ис­следователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распре- целении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений приз­нака в возрастающем или убывающем порядке. Этот процесс на­зывают ранжированием ряда. Ранжированный ряд сразу дает об­щее представление о значениях, которые принимает признак совокупности.

Недостаточность средней величины для исчерпывающей ха­рактеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает воз­можность сделать статистический анализ более полным и содер­жательным и тем самым глубже понять сущность изучаемых об­щественных явлений.

Самыми простыми признаками вариации являются минимум и максимум — это наименьшее и наибольшее значение признака из совокупности. Число повторений отдельных вариантов значе­ний признаков называют частотой повторения.

Частость — относительный показатель частоты, который мо­жет быть выражен в долях единицы или процентах, позволяет со­поставлять вариационные ряды с различным числом наблюде­ний. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показа­телям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между мак­симальным и минимальным значениями признака в изучаемой совокупности, формально имеем:

Этот показатель дает лишь самое общее представление о колебле­мости изучаемого признака, ибо показывает разницу только меж­ду предельными значениями вариантов. Он совершенно не свя­зан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость только от крайних значений признака может придавать ему неустойчивый, случайный харак­тер. Размах вариации не дает никакой информации об особенно­стях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних. Область применения этого по­казателя ограничена достаточно однородными совокупностями. Точнее характеризует вариацию признака показатель, основан­ный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно уметь обоб­щить отклонения всех этих значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариа­ции, как среднее линейное отклонение, дисперсия и среднее квадра­тическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

 

Среднее линейное отклонение (среднее арифметическое и среднее взвешенное) представляет собой среднюю арифметическую из абсолютных значений отклонений отдель­ных вариантов от их средней арифметической:

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая — в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариан­тов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений ва­риантов от средней с их последующим усреднением. При этом мы получаем новый показатель вариации — дисперсию.

Дисперсия () — средняя из квадратов отклонений вариан­тов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратиче­ского отклонения. Среднее квадратическое отклонение () пред­ставляет собой корень квадратный из дисперсии:

 

Среднее линейное и среднее квадратическое отклонения по­казывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же еди­ницах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной ко­леблемости признаков (среднее линейное и среднее квадратическое отклонение), конечно, непригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и ко­пейках.

При сравнении изменчивости различных признаков в сово­купности удобно применять относительные показатели вариа­ции. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане).

Исполь­зуя в качестве абсолютного показателя вариации размах вариа­ции, среднее линейное отклонение, среднее квадратическое от­клонение, получают относительные показатели колеблемости (вариативности):

- коэффициент осцилляции:

R – размах,

- средняя.

- относительное линейное отклонение:

- среднее линейное отклонение.

Коэффициент вариации — наиболее часто применяемый пока­затель относительной колеблемости, характеризующий однород­ность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: