Меры вариации

Всякая научная деятельность связана с понятием изменчивости. Когда есть много необъяснимых причин вариалбельности, прогнозы не будут очень точными. Зато когда объяснения причин различий людей и вещей представлены в виде некоторой модели, неопределенность можно уменьшить, а часть вариации устранить. Например, если было бы совсем не известно, почему люди различаются между собой по умственному развитию, то попытка прогнозировать интеллект наталкивалась бы на большую неопределенность; некоторые люди выглядели бы «смысшенными», а др-«глупыми», и никто не знал бы почему. Однако если известно, что наследственность и окр ср оказывают колличественное влияние на айкью, то информация о происхождении ребенка и его воспитании в раннем детстве позволила бы дать более точный прогноз его умственного развития в зрелости. Др словами, вариабельность айкью у лиц со сходной наследственностью и окр ср меньше, чем у людей вообще.

Вариация – различие в значениях количества признака у разных единиц данной совокупности в один и тот же период времени.

Показатели вариации:- дополняют средние величины, за кот скрывается индивидуальное значение признака, т.к.средние не показывают строение совокупности.-хар-т степень однородности совокупности по данному признаку. –хар-т границы вариации признака. – соотношение между показателями вариации хар-т взаимосвязь ВНУТРИ СОВОКУПНОСТИ между показателями.

1. Размах – амплитуда колебаний или разница между мин и макс значением признака.

R=Xmax-Xmin – исключающий размах.

Включающий размах – на ед. больше.

(Пр.: рост: 150,165…168. 150-168=18-искл размах. 168,5-149,5=19-включ размах).

2. Мерой изменчивости, тесно связанной с дисперсией, является стандартное отклонение, обозначаемое как S, определяется как положительное значение квадратного корня из дисперсии.

Ст отклонение часто является полезной мерой вариации, тк для многих распределений мы приблизительно знаем, какой процент данных лежит внутри одного, двух, трех и более стандартных отклонений среднего. Например, мы можем знать, что 70% значений лежит между Хср – станд отклонение и Хср +ст отклонение.

где S— стандарт, стандартное отклонение, несмещенная оценка среднеквадратического отклонения случайной величины X относительно её математического ожидания; сигма в кв— дисперсия; Хитое— i-й элемент выборки; Хср— среднее арифметическое выборки; Н— объём выборки.

Т.е. ед арифметич абс значения отклонения отд варианта от их средней. В тех же ед измерения что и вариант, дает абс меру вариации. (ср.мин. откл: - для несгруп.данных: сумму по модулю Х-Хср/н. – для сгрупп данных: сумму по модулю (Х-Хср)*частоту/суммарную частоту).

(ср.кв.откл.: корень из Джи квадрат. Показывает на сколько в среднем отклоняются конкретные варианты от их ср.знач.и явл-ся абс мерой колеблемости признака и выражаются в тех ед что и варианты).

3. Дисперсия (Джи кв.) – рассеивание.

- для негрупп: сумма(Х-Хср)2

- для сгрупп: сумма(Х-Хср.)2*частоту/суммарную частоту

Дисперсия – средний квадрат отклонения вариант от их средней величины. При расчете дисперсии не указываются ед измерения.

Св-ва дисперсии:

- если все значения признака уменьшить или увеличить на одну и туже пост величину А, то дисперсия от этого не изменится;

- если все значения признака уменьшить или увеличить в одно и тоже число И раз, то Д.соответсвенно уменьшиься или увеличется в И2 раз.

- *дисперсия совокупности, образованной объединением групп а и б, зависит как от дисперсий, так и от средних двух групп.

*Существует также коэффициент вариации: В=Джи/Хср и *100%. Если В меньше 33%, тозначит, что совокупность однородна, а средняя для нее типична.

*Существует дисперсия альтернативного признака. Признаки, которыми обладают одни ед совокупности и не обладают другие.

В SPSS: Чтобы получить описательную статистику числовых переменных, можно щелкнуть в диалоге Frequencies на кнопке Statistics... (Статистика). Откроется диалоговое окно Frequencies: Statistics (Частоты:Статистика). В группе Dispersion (Разброс) можно выбрать следующие меры разброса:

· Std. deviation (Стандартное отклонение): Стандартное отклонение — это мера разброса измеренных величин; оно равно квадратному корню из дисперсии. В интервале шириной, равной удвоенному стандартному отклонению, который отложен по обе стороны от среднего значения, располагается примерно 67% всех значений выборки, подчиняющейся нормальному распределению.

· Variance (Дисперсия): Дисперсия — это квадрат стандартного отклонения и, следовательно, эта характеристика также является мерой разброса измеренных величин. Она определяется как сумма квадратов отклонений всех измеренных значений от их среднеарифметического значения, деленная на количество измерений минус 1.

· Range (Размах): Размах — это разница между наибольшим значением (максимумом) и наименьшим значением (минимумом).

· Minimum (Минимум): Наименьшее значение.

· Maximum (Максимум): Наибольшее значение.

· S.E. mean (Стандартная ошибка): Это стандартная ошибка среднего значения. В интервале шириной, равной удвоенной стандартной ошибке, отложенному вокруг среднего значения, располагается среднее значение генеральной совокупности с вероятностью примерно 67 %. Стандартная ошибка определяется как стандартное отклонение, деленное на квадратный корень из объема выборки.

Обычно мерами разброса переменных, относящихся к интервальной шкале и подчиняющихся нормальному распределению, служат стандартное отклонение и стандартная ошибка. Как было сказано выше, стандартное отклонение позволяет задать диапазон разброса отдельных значений. По так называемому правилу кулака, в одном диапазоне стандартного отклонения (охватывающем ширину стандартного отклонения в обе стороны от среднего значения) располагается примерно 67 % значений, в диапазоне удвоенного стандартного отклонения — примерно 95 %, а в диапазоне утроенного стандартного отклонения — примерно 99 % значений.

С другой стороны, стандартная ошибка позволяет задать доверительный интервал для среднего значения. В диапазоне удвоенной стандартной ошибки по обе стороны от среднего значения с вероятностью примерно 95 % находится среднее значение генеральной совокупности. С вероятностью примерно 99 % она лежит в диапазоне утроенной стандартной ошибки. Часто указывают только одну из этих двух мер разброса, обычно — стандартную ошибку, так как ее значение меньше. Во всех случаях следует точно выяснить, какая из мер разброса имеется в виду.

14. Асимметрия и эксцесс

Одно из наиболее важных свойств распределения частот- степень асимметрии. Практически точно симметричные полигоны частот и гистограммы почти никогда не встречаются. Степень асимметрии распределения частот для выборки называется просто его асимметрией. Графически – легко опознать асимметрию. Однако это не всегда возможно и удобно, поэтому есть стат хар-ки, оценивающие вид и степень асимметрии группы наблюдений.

Асимметрия для группы= Σ(Хі – Хср.)3/n/Sx3, либо после преобразований, это будет Zср.3, и обозначается она как корень из бетта.Своим существованием она обязана К. Пирсону.

А – имеет положительную асимметрию по расчетам. В – отрицательную, т.к. вел зед в кубе отрицательна. А – более выражена на рис.

Формула нормального распределения: (розподіл Ґауса) — розподіл ймовірностейвипадкової величини, що характеризується густиною ймовірності

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ ² — дисперсия.

Особливість: Якщо дискретні випадкові величини мають нормальний розподіл імовірностей, то їх сума різниця також будуть нормально розподілені, а добуток величин не буде підпорядкований нормальному розподілу.

1. Эксцесс – «остроконечности» кривой (в дословном переводе). К. Пирсон предложил его как метод оценки.

На рис.изображены:островершинная, плоская, промежуточная кривая.

Необходимо подчеркнуть, что понятие «эксцесс» применимо лишь к унимодальным распределениям и относится к крутизне кривой в окрестности единственной моды. Если распределение имеет 2 моды, то принято говорить об эксцессе кривой в окрестности каждой моды.

Формула: Σ(Хі – Хср.)4/n/Sx4. Если величина 3 – то это В (рис.), нормальное распределение. Больше 3 – А, островершинное; если менее 3, то Б. Но не меньше нуля.

эксцесс замеряет "заостренность" кривой (положительный – заостренная кривая, отрицательный – "тупая").

Аддитивная шкала - англ. additive scale – шкала, для которой справедливо правило сложения, как для любых действительных чисел. Это означает, что субъективная величина ощущения в n единиц данной шкалы должна быть эквивалентна сумме субъективных ощущений любой суммарной комбинации единиц этой же шкалы, дающей равную ей сумму. Напр., излучение, характеризующееся на шкале светлот ощущением в 50 единиц, должно быть эквивалентно сумме ощущений в 30 единиц и 20 единиц, 25 и 25 единиц и т. д.

Выбросы. По определению, выбросы являются нетипичными, резко выделяющимися наблюдениями. Так как при построении прямой регрессии используется сумма квадратов расстояний наблюдаемых точек до прямой, то выбросы могут существенно повлиять на наклон прямой и, следовательно, на значение коэффициента корреляции. Поэтому единичный выброс (значение которого возводится в квадрат) способен существенно изменить наклон прямой и, следовательно, значение корреляции. Обычно считается, что выбросы представляют собой случайную ошибку, которую следует контролировать.

15. Нормальное распределение и его роль.

Нормальное распределение абсолютно симметрично, т.е. ассиметрия как и єксцесс при номральном распределении=0.

Формы распределения: ассиметрия и ексцес.

Асимметрия распределений а) положительная, левосторонняя, б) отрицательная, правосторонняя

В SPSS: Чтобы получить описательную статистику числовых переменных, можно щелкнуть в диалоге Frequencies на кнопке Statistics... (Статистика). Откроется диалоговое окно Frequencies: Statistics (Частоты:Статистика). В группе Distribution (Распределение) можно выбрать следующие меры несимметричности распределения:

· Skewness (Коэффициент асимметрии): Коэффициент асимметрии — это мера отклонения распределения частоты от симметричного распределения, то есть такого, у которого на одинаковом удалении от среднего значения по обе стороны выборки данных располагается одинаковое количество значений. Если наблюдения подчиняются нормальному распределению, то асимметрия равна нулю. Для проверки на нормальное распределение можно применять следующее правило: Если асимметрия значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть. Если вершина асимметричного распределения сдвинута к меньшим значениям, то говорят о положительной асимметрии, в противоположном случае — об отрицательной.

· Kurtosis (Коэффициент вариации или эксцесс): Коэффициент вариации указывает, является ли распределение пологим (при большом значении коэффициента) или крутым. Коэффициент вариации равен нулю, если наблюдения подчиняются нормальному распределению. Поэтому для проверки на нормальное распределение можно применять еще одно правило: Если коэффициент вариации значительно отличается от нуля, то гипотезу о том, что данные взяты из нормально распределенной генеральной совокупности, следует отвергнуть.

· Statistics – Summarize – Frequencies — Statistics – Skewness, Kurtosis

Распределением признака называется закономерность встречаемости разных его значений.

В психологических исследованиях чаще всего ссылаются на нормальное распределение.

Нормальное распределение характеризуется тем, что крайние значения признака в нем

встречаются достаточно редко, а значения, близкие к средней величине – достаточно часто.

Нормальным такое распределение называется потому, что оно очень часто встречалось в естественно-научных исследованиях и казалось "нормой" всякого

массового случайного проявления признаков. Форма на графике – форма колокола.

1. Форму ла нормального распределения: также называемое гауссовским распределением или распределением Гаусса — распределение вероятностей, которое задается функцией плотности распределения:

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ ² — дисперсия. П-отношение длины окружности к диаметру круга, приблизительно равное 3,142; е приблизительно равно 2,718. Первые 2 параметра определяют положение кривой относительно числовой оси и регулируют ее размах.

Особливість: Якщо дискретні випадкові величини мають нормальний розподіл імовірностей, то їх сума різниця також будуть нормально розподілені, а добуток величин не буде підпорядкований нормальному розподілу.

Мода=ср вел=медине.

Нормальное распределение абсолютно симметрично, т.е. ассиметрия как и єксцесс при номральном распределении=0.

Формы распределения: ассиметрия и ексцес.

Единичное нормальное распределение как стандарт;Для μ=0, t=1 график принимает вид:

Эта кривая при μ=0, t=1 получила статус стандарта, ее называют единичной нормальной кривой, то есть любые собранные данные стремятся преобразовать

так, чтобы кривая их распределения была максимально близка к этой стандартной кривой. Созданы статистические таблицы со значениями площади под единичной нормальной кривой влево от любой точки на оси z в (-3; 3). Общая площадь под кривой равна 1. И все остальные площади рассматривают как процент

от целого.

2.

3. Применение нормального распределения:

Психометрические тесты общин и специальных умственных способностей часто дают распределения оценок, удовлетворительно согласующиеся с НР(норм растр). Довольно хорошо известно, что значения айкаю интеллектуального теста Стенфорда-Бине распредеелены приблизительно нормально со средним 100 и стендарстным отклонением 16 для обычных людей. Тесты образовательной підготовки, строящиеся в соответствии с такими же психометрическими принципами, что и тесты способностей, обачно имеют полигоны частот, напоминающие норм кривую (колокол).

Нормальная кривая – это изобретение математика, давольно хорошо описывающее полігон частот измерений нескольких различных переменных.

дать, что значения переменной нормально распределены.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: