ВЫРАВНИВАНИЕ ВАРИАЦИОННЫХ РЯДОВ – ТЕОРЕТИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ.
ПОКАЗАТЕЛИ ВАРИАЦИОННОГО РЯДА.
Тема 6.
Задача 4.3
Задача 4.2
Задача 4.1
Имеются следующие данные о производстве продукта А пятью рабочими бригады за смену:
Номер рабочего | |||||
Произведено продукции А за смену, шт., |
Определить среднюю выработку одного рабочего данной бригады.
Средняя выработка определяется как средняя арифметическая простая:
Имеется следующее распределение 60 рабочих по тарифному разряду (ряд дискретный):
Тарифный разряд | |||||
Число рабочих |
Определить средний тарифный разряд рабочих.
Расчет производим по средней арифметической взвешенной:
Требуется определить среднемесячную заработную плату одного рабочего на предприятии по следующим данным (графы 1 и 2 таблицы):
Месячная заработная плата, руб. | Число рабочих // | Середина интервала х, | Xifi |
8000-8500 | |||
8500-9000 | |||
9000-9500 | |||
9500-10000 | |||
10000-10500 | |||
10500-11000 | |||
Итого | - |
Для интервальных рядов сначала находят центры (середины) интервалов, а затем последние умножают на веса, произведения суммируют и делят на сумму весов.
|
|
Среднее значение признака в каждом интервале дано в графе 3. Результаты умножения вариантов навеса показаны в графе 4.
Отсюда средняя заработная плата одного рабочего
Когда весами у отдельных признаков служат показатели, являющиеся произведением этих вариантов на количество единиц, то средняя из всех вариантов рассчитывается как средняя гармоническая взвешенная, формула которой:
Например, Мi – выработка за смену в i-й бригаде;
хi – средняя выработка рабочих i-й бригады.
Если Мi равны между собой, то
Средняя геометрическая:
- простая:
- взвешенная:
Средняя квадратическая:
- простая:
- взвешенная:
Средняя хронологическая:
Все основные средние величины могут быть представлены в виде общей формулы:
где — средняя величина;
х — индивидуальное значение признака;
n — число единиц изучаемой совокупности;
k — показатель степени, определяющий вид средней.
Общее правило:
(ТЕОРИЯ СТАТИСТИКИ – ЗЕЛЕНЫЙ СТАРЫЙ)
Тема 6 коник
Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности, и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов. Поэтому, кроме рассмотренных средних, в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные (или описательные) средние — мода (Мо) и медиана (Ме).
|
|
Мода — величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой- либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле (для интервального ряда):
Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой — больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.
Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (n + 1) /2с нечетным числом членов n. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.
При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:
Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили — на десять равных частей. Квартилей насчитывается три, а децилей — девять.
Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.
3. Показатели вариации
Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения — атрибутивные и вариационные — в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.
|
|
Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности непостоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.
Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распре- целении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак совокупности.
Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.
|
|
Самыми простыми признаками вариации являются минимум и максимум — это наименьшее и наибольшее значение признака из совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения.
Частость — относительный показатель частоты, который может быть выражен в долях единицы или процентах, позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:
Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.
Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:
Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, ибо показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость только от крайних значений признака может придавать ему неустойчивый, случайный характер. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних. Область применения этого показателя ограничена достаточно однородными совокупностями. Точнее характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.
Для характеристики вариации признака нужно уметь обобщить отклонения всех этих значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.
Среднее линейное отклонение (среднее арифметическое и среднее взвешенное) представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:
Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая — в рядах с неравными частотами.
Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней с их последующим усреднением. При этом мы получаем новый показатель вариации — дисперсию.
Дисперсия () — средняя из квадратов отклонений вариантов значений признака от их средней величины:
Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).
В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение () представляет собой корень квадратный из дисперсии:
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.
В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков (среднее линейное и среднее квадратическое отклонение), конечно, непригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.
При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане).
Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости (вариативности):
- коэффициент осцилляции:
R – размах,
- средняя.
- относительное линейное отклонение:
- среднее линейное отклонение.
Коэффициент вариации — наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.