Методические указания по изучению темы

«Характеристики положения

(среднее арифметическое, мода, медиана и др.)»

В ходе изучения данной темы необходимо научится легко владеть ее основными понятиями: среднее арифметическое, медиана, мода, серединное положение, ранг, медианный и модальный ранг, медианная и модальная точка, медианный и модальный интервал группировки, модальная частота, дециль, метод разностей, бимодальность.

В рамках данной темы рассматриваются характеристики, определяющие положение центра эмпирического распределения. В описательной статистике, чаще всего, употребляются такие характеристики положения, как среднее арифметическое, медиана и мода. Определение этих характеристик может быть весьма результативным и в эмпирической социологии. Из предыдущих тем студенты должны были усвоить, что распределение частот количественных данных представляет собой результат большого числа наблюдений. По существу это ряд величин, расположенных на непрерывной шкале. Любая величина
в распределении может описывать всю совокупность, если известно ее относительное положение в распределении. Наиболее удобными для вычисления
и полезными для исследователя являются такие величины, как: 1) максимум, 2) минимум и 3) центральные или типичные величины, известные как средние.

Нужно понимать, что в некоторых случаях максимумы и минимумы не дают необходимой информации. Тогда и возникает необходимость обращения к более общим мерам положения, которыми являются средние. Явная тенденция многих статистических совокупностей концентрироваться вокруг центра часто называется «центральной тенденцией», а значение величины в этом центре – «мера центральной тенденции» – обычно называется средней.

Одной из основных характеристик выборки является среднее арифметическое. Это такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения). Студентам следует обратить внимание, что вычисление среднего необходимо для осуществления более сложных математических операций, связанных с анализом социологических данных, в чем можно будет убедиться на последующих занятиях.

Очень важно запомнить, что процедуры вычисления среднего для несгруппированных и сгруппированных данных несколько отличаются.

Для несгруппированных данных среднее вычисляется путем суммирования отдельных величин и последующего деления на . Формула вычисления имеет следующий вид: , где – среднее арифметическое, - сумма переменных, - переменная или величина, - сумма частот, или число событий, объем распределения.

Для сгруппированных данных переменные умножаются на свои частоты (), суммируются, а затем делятся на , что имеет вид следующей формулы: . В этой связи важно понимать, что если применить две разные формулы к одному и тому же распределению, значения среднего в обоих случаях отличаться не будут.

Студенты также должны усвоить процедуру вычисления среднего арифметического для интервальных рядов данных, которая несколько отличается от процедур, описанных выше. При этом необходимо помнить, что для интервальных непрерывных рядов каждая из рассматриваемых переменных находится в средней точке соответствующего интервала. Когда величина интервала больше единицы, сначала находятся границы интервалов и их средние точки по формуле: , а затем каждая средняя точка взвешивается (то есть перемножается на частоту интервала) и вычисляется среднее по формуле:

.

Необходимо запомнить основное свойство среднего арифметического, которое заключается в том, что оно представляет величины каждого события в распределении. В связи с этим оно подвержено влиянию как очень больших, так
и крайне малых величин, что особенно заметно в несимметричных распределениях. Необходимо всегда иметь в виду, что для таких распределений более информативными могут быть иные меры усреднения, такие как медиана и мода.

Медианой называется точка, которая рассекает таблицу на две равные части так, что одна половина событий точно находится ниже, а другая – выше этой точки. Опять-таки, важно помнить, что, по аналогии со средним арифметическим, существуют разные формулы вычисления медианы для несгруппированных и сгруппированных данных. Для несгруппированных данных придерживаются следующей формулы: - . Для сгруппированных – вычисления выглядят так: , где - нижняя граница медианного интервала, - ширина медианного интервала, - частота медианного интервала, - объем выборки, - частота, накопленная до медианного интервала.

Следует знать, что для большей точности можно разделить совокупность не на две равные части (как в случае с медианой), а на меньшие доли, то есть локализовать данные в меньшем интервале - верхней четверти, десятой или даже сотой. Для этого существуют другие меры. Речь идет о вычислении квартилей, децилей и центилей. Таким образом, первый квартиль в распределении будет равен: . Если потребуется выделить точку, ниже которой находятся 75% событий (или ), то производят следующую подстановку
в формулу: . 90-й центиль (или ) может быть найден по формуле: .

Медиана, квартили, квантили, децили и центили, которые, согласно своему определению, указывают на долю событий, расположенных ниже или выше данной величины, носят обобщенное название квантили.

Мода представляет собой наиболее часто повторяющуюся величину
в упорядоченном распределении; она характеризует то место распределения, где концентрация событий максимальна. Студентам необходимо усвоить формулу вычисления моды: , где - нижняя граница модального интервала, - ширина модального интервала, - частота модального интервала, - частота интервала, предшествующего модальному интервалу, - частота последующего интервала.

Следует знать, что некоторые распределения обнаруживают два максимума и поэтому называются бимодальными, в отличие от унимодальных распределений. Не менее важным является понимание того, что значения мер положения (, Ме и Мо) существенно отличаются в случае асимметричного распределения. Чем больше между ними разница – тем сильнее асимметрия.

Необходимо помнить о существовании трех основных критериев, помогающих решить вопрос о применимости того или иного типа среднего: 1) цель усреднения, 2) вид распределения данных, 3) различные технические соображения, главным образом, арифметического характера, которые ограничивают выбор типа усреднения.

В целом, для выработки практических навыков по данной теме, усвоения формул и доведения до автоматизма вычислительных процедур студентам предлагается целый ряд простейших таблиц (не менее 10), для которых они должны определить характеристики положения и сделать соответствующие выводы. Все вычислительные процедуры осуществляются в «ЕХСЕL», что существенно экономит время, позволяя сконцентрироваться не на процессе вычисления, а на его алгоритме, что, несомненно, является более важным для освоения материала.

Вопросы и задачи для самоконтроля

1. Определите следующие понятия: характеристики положения, среднее арифметическое, взвешивание.

2. Приведите несколько примеров, в которых уместно было бы применять арифметическое среднее, даже если разброс событий сильно асимметричен.

3. Покажите, что крайние величины в асимметричном распределении дают непропорциональный вклад в арифметическое среднее.

4. Опишите схематично процедуру нахождения среднего двух и более групп, когда даны только сумма частот и арифметическое среднее каждой группы. Выразите эту процедуру в символах.

5. Каково будет комбинированное среднее двух групп, если среднее из 100 событий первой будет равно 10, а среднее из 50 событий второй будет равно 15? Каково было бы комбинированное среднее, если бы каждая группа состояла из 50 событий? Из 100 событий?

6. Определите следующие понятия: медиана, серединное положение, ранг, медианный ранг, медианная точка, медианный интервал группировки, дециль, модальная частота, метод разностей, бимодальность.

7. Какое делается предположение относительно распределения событий в пределах медианного интервала, когда рассчитывается медиана сгруппированных данных?

8. Каково соотношение между модой, медианой и средним в распределении?

9. Изложите в общих чертах, как влияет правая асимметрия на три основных типа средних; то же самое - при левой асимметрии.

10. В каких случаях максимум наилучшим образом представляет распределение частот, а в каких – минимум?

11. Как видоизменились бы медианная и средняя оценки, если бы:

а) наихудшие студенты были удалены из класса?

б) наихудшие студенты стали лучше заниматься?

в) средние студенты стали лучше заниматься?

г) были облегчены экзамены?

12. В населенном пункте «А» модальная продолжительность жизни равна 55 годам, медианная равна 60 годам и средняя - 60. В населенном пункте «В» модальная продолжительность жизни составляет 70 лет, медианная - 65 лет,
а средняя – 60. Воспроизведите кривые частот по этой информации. В каком населенном пункте более здоровое население?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: