Описательная статистика

Описательная статистика - позволяет описывать, подытоживать и воспроизводить в виде таблиц и графиков данные того или иного распределения, вычислять среднее для данного распределения, его размах и дисперсию.

Распределением признака называется закономерность встречаемости разных его значений.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями. Закон распределения может быть задан в виде таблицы, графика или формулы.

Вариационный ряд – ряд данных представленных в порядке возрастания (убывания) признака.

Статистическим рядом называется ряд данных, расположенных в порядке возрастания или убывания с соответствующими им весами (частотами или частостями).

Вариационный и статистический ряды являются статистическими аналогами распределения признака (случайной величины Х).

Параметры распределения - это его числовые характеристики, указывающие, где в «среднем» располагаются значения признака, насколько эти значения изменчивы и наблюдается ли преимущественное появление определенных значений признака. Наиболее важными параметрами являются математическое ожидание, дисперсия, показатели асимметрии и эксцесса. В реальных психологических исследованиях мы оперируем не параметрами, а их приближенными значениями, так называемыми оценками параметров. Это объясняется ограниченностью обследованных выборок. Чем больше выборка, тем ближе может быть оценка параметра к его истинному значению.

Меры центральной тенденции – характеристики совокупности переменных (признаков) указывающие на наиболее типичный, репрезентативный для изучаемой выборки результат. К мерам центральной тенденции относятся среднее арифметическое, мода, медиана.

Мода (Мо) – наиболее часто встречаемое значение вариационного ряда.

Варианты определения моды:

1. Если в вариационном ряду лишь одно значение встречается наиболее часто, то мода равна этому значению (варианте).

2. Если два соседних значения имеют одинаковую частоту и эта частота больше частот других значений, то мода вычисляется как среднее арифметическое из этих двух значений.

3. Если два наиболее часто встречаемых значения находятся не рядом, между ними есть значение с меньшей частотой встречаемости, то распределение имеет две моды (бимодальное распределение).

Медиана (Ме) – значение вариационного ряда, делящее этот ряд на две равные части, так что количество значений справа от медианы, равно количеству значений слева от медианы.

Место, (порядковый номер) на котором находиться медиана, можно рассчитать по формуле: NMe = ,

где n – количество значений в вариационном ряду.

Если место, на котором должна находиться медиана, число целое, то медиана равна значению, которое находится на этом расчетном месте.

Если расчетное место (порядковый номер значения) на котором должна находиться медиана число дробное, то медианы вычисляется как среднее арифметическое из двух значений, находящихся справа и слева от вычисленного места медианы.

Пример №1. В вариационном ряду нечетное число значений, n=9.

Значение «Х»                  
Порядковый номер                  

Место, на котором располагается медиана, вычисляется:

NMe = = (9+1)/2=5.

На пятом месте в вариационном ряду располагается число «3». Таким образом, медиана равна трем, Me=3. Мы видим, что слева от медианы располагается четыре значения (1, 2, 2, 3) и справа от медианы также располагается четыре значения (4, 4, 4, 5).

Пример №2. В вариационном ряду четное число значений.

Значение «Х»                    
Порядковый номер                    

Место, на котором располагается медиана, вычисляется:

NMe=(10+1)/2=5,5.

Расчетное место, на котором должна находиться медиана, число дробное. Это место располагается между порядковыми номерами 5 и 6. В вариационном ряду на этом дробном месте нет значения. Поэтому, медиана рассчитывается как возможное значение переменной «Х», которое могло бы располагаться на этом расчетном месте. Медиана рассчитывается как среднее арифметическое из двух значений, которые располагаются слева и справа от расчетного места. На пятом месте располагается число три, на шестом месте число четыре, поэтому медиана Me=(3+4)/2=3,5. Таким образом, мы видим, что слева от медианы располагается пять значений (1, 2, 2, 3, 3) и справа от медианы также располагается пять значений (4, 4, 4, 5,6).

Среднее арифметическое является оценкой математического ожидания.

Среднее арифметическое:

где xi - каждое наблюдаемое значение признака;

i - индекс, указывающий на порядковый номер данного значения

признака;

n – объем выборки;

- знак суммирования.

Меры изменчивости статистические показатели вариации (разброса) признака (переменной) относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения. К мерам изменчивости относятся: вариационный размах, дисперсия, стандартное отклонение.

Вариационный размах: W = xmax - xmin характеризует ширину вариационного ряда.

Дисперсия (выборочная)(S2) Стандартное отклонение(s)

, n<30. , n<30.

Дисперсия (выборочная)(S2) Стандартное отклонение(s)

, n>30. , n>30.

Особенности эмпирического распределения описываются при помощи таких показателей как асимметрия и эксцесс. Асимметрия характеризует сдвиг эмпирического распределения относительно нормального теоретического распределения. Эксцесс характеризует островершинность распределения.

Показатель асимметрии (Аs) рассчитывается по формуле:

- среднее арифметическое

Графики распределения случайной величины «х», с различными показателями асимметрии представлены на рисунке 2.

Рис.1. Графики трех распределений признака, которые отличаются по показателю асимметрии.

На рисунке представлены три распределения, различающиеся по знаку асимметрии. Распределение 1 характеризуется положительной асимметрией (левосторонней), распределение 2 – отрицательной (правосторонней), распределение 3 – нормальное распределение. Для симметричных распределений (нормального распределения) показатель асимметрии равен нулю, Аs=0.

В случае, когда какие-либо причины способствуют преимущественному появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное.

Показатель эксцесса (Еs) рассчитывается по формуле:

Графики распределения случайной величины «х», с различными показателями эксцесса представлены на рисунке 2.

Рис.2. Виды распределений признака с различными показателями эксцесса.

На рисунке 2 представлены три различных распределения признака. Распределение 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, эксцесс данного распределения больше нуля Es>0. В распределении 1 чаще встречаются значения признака близкие к среднему. В распределении 2 чаще встречаются более высокие и более низкие, чем среднее значение признака, эксцесс данного распределения меньше нуля Es<0. Распределение 3 – нормальное распределение, эксцесс равен нулю.

Коэффициент вариации

Если коэффициент вариации высок, то, как правило, это свидетельствует о неоднородности значений признака.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: