Анализ первичных статистик

Для определения способов математнко-статистической обработки, прежде всего- необходимо оценить характер распределения по всем ис­пользуемым параметрам Для параметров, имеющих нормальное распре­деление или близкое к нормальному, можно использовать методы пара­метрической статистики- которые во многих случаях являются более мощ­ными. чем методы непараметрической статистики. Достоинством послед­них является то, что он!1, позволяют проверять статистические гипотезы независимо от формы распределения.

Одним из важнейших в математической статистике является понятие нормального распределения. Нормальное распределение — модель варьи­рования некоторой случайной величины, значения которой определяются множеством одновременно действующих ке5ависимых факторов. Число ',:аких факторов велико, з эффект влияния каждого из них в отдельности очень мал Такой характер взаимовлияний весьма характерен для психиче­ских явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение Однако так бывает не всегда, поэто­му в каждом случае форма распределения должна быть проверена Важнейшими первичными статистиками являются, а) средняя арн4>метическая — это величина, сумма отрицательны»;

и положительных отклонений от которой равна нулю. В статистике ее обо­значают буквой М или х Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений


Если в ряду есть числа со 'таком "минус", то суммирование производят с учетом знаков.

б) среднее квадратичное отклонение (обозначаемое греческой бук­вой а- (сигма) и называемое также основным, или стандартным, отклоне­нием) - мера разнообразия входящих в группу объектов: она показывает, на сколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее ра'.-бросаны варианть; относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и рч^-мих — разность между наибольшим ч наименьшим значением в ряду Однако сигма полнее характеризует разброс значений относительно сред­ней арифметической.

в) коэффициент вариации - частное от деления сигмы на среднюю арифметическую, умноженное на J00%. Обозначается С\":

Сигма - величина именованная и зависит не только от степени варьи­рования. но и от единиц измерения. Поэтому по сигме можно сравнивать и>мен"ивость лишь одних и тех же показателей- а сопоставлять сигмы разных признаков по абсолютной величине нельзя Для того. чтобы срав­нить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать блиян|!я масштаба измере­ний средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по существу приведение к одинако­вому масштабу велич>гны ст

Для нормального распределения известны точные количественные за­висимости частот и значений, позволяющие прогнозировать появление новых вариант:!) слева и справа от средней арифметической лежит '.0" о вариант: 2} в интервале от М-!'-; до МЧсг -- h8.7°c вариант. 3) в интер­вал'.; от \'И %(- до \ТН °o(t Q^S вариант.

Таким образом, ориентируясь на эти характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения.

Г'ле.зл'ющи.\"и по важности являются такие первичные статистики, как коэффициент асимметрии и эксцесс Коэффициент асимметрии - локззя-тель скошенности распределения в левую или правую сторону по оси абс­цисс Если правая ветвь кривой длиннее левой - говорят о положительной асимметрии, в противоположном случае - об отрицательной. Эксцесс по­ка -йтель островершинности. Кривые, более высокие в своей средней части


- островершинные, называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины - с прогибом в сред­ней части.

Эти параметры позволяют составить первое приближенное представ­ление о характере распределения: у нормального распределения редко мо/кйо обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и ^-1).

Подчеркну, что это только приблизительная оценка. Точную и стро­гую оценку нормальности распределения можно получить используя один из существуют) г; методов проверки 'см например главы 2 и 5 kh!!i-!;

Г.В Суходол ьско) о "Основы математической статистики для психодогов" Л., 1972.)

Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант Большие величины эксцесса и асимметрии часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру для компьютерной обработки. Грубые промахи при введении данных в обра­ботку можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки

Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные - трижды), причем желательно разными способами, с вариацией последовательности обращения к число­вому массиву.

По части никогда не удается полностью охарактеризовать целое, все­гда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных, недостаточно точна, имеет некоторую боль­шую пли меньшую ошибку. Такие ошибки, представляющие собой oujhc.k!' обобщения, экстраполяции, связанные с перенесением результатов, полу­ченных при изучени;; выборки, на всю генеральную совокупность, назы­ваются ошибками репрезентатгвкоста. Репрезентативность - степень соответствия выборочных показателей генеральным параметрам.

Статистические ошибки репрезентатнвносги показывают, в каких пределах могут отклснягьсй от параметров генеральной совокупности (от математического ожидай!!» или истинных значений') наши частные опре­деления. полученные на основе конкретных выборок. Очевидно, величина "шибки;ем больше, чем больше варьирование признака и чем меньше выборка. 'Это и отражено в ^lop^'vnax для вычисления статистических ошибок, характеризующих варьирование выборочных показателей вокруг их генеральных параметров


В число первичных статистик входит статистическая ошибка сред­ней арифметической. Формула для ее вычисления такова

;де in^ ошибка средней, ст - сигма, п. - число значений признака. Это основные первичные статистики, которые позволяют оценить характер распределения данных в экспериментальном массиве.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: