Поняття і суть вибіркового методу, причини і умови його застосування

Нормативная выборка. В статистике различают выборку (группу, которая реально подверглась тестированию) и популяцию (более широкую группу, но имеющую тот же состав, что и выборка, на которую могут быть перенесены результаты тестирования). Для обеспечения стабильных значений выборка, на которой основываются нормы (которые в дальнейшем будут работать при практическом использовании опросника), должна быть достаточно большой. Ее величина проверяется по следующему критерию: другая выборка, отобранная из той же популяции, не должна приводить к нормам, отличных от полученных.

Для простого уменьшения значения стандартной погрешности адекватной будет нормативная выборка из 500 испытуемых.

Однако репрезентативность выборки не зависит от ее объема. Наиболее существенно, чтобы нормативная выборка была репрезентативна по отношению ко всей популяции.

Так, в универсальных психологических тестах (в отличие от тестов, которые разрабатываются для испытуемых с той или иной патологией) в идеале необходима выборка из генеральной совокупности испытуемых, т.е. из общей популяции (из всего населения страны), в которой встречаются все возможные показатели. И при получении нормы для общей популяции необходима выборка объемом около 10 000 испытуемых. Это связано с тем, что выборка, если речь идет об общей выборке, должна быть стратифицирована (социальное положение, возраст, пол); при этом в каждой группе должно быть как минимум 300 человек.

Но на ограниченных популяциях возможны меньшие размеры. Маленькая, но репрезентативная выборка будет предпочтительнее большой, но неравномерно представленной. При этом необходимо четкое определение спецификации популяции, к которой применимы полученные нормы.

Поэтому одним из наиболее правильных способов обеспечения репрезентативности выборки является ограничение популяции сообразно особенностям выборки: лучше сузить определение популяции, чем применять нормы к популяции, которая не была адекватно представлена в нормативной выборке. Часто используется составление подгрупповых норм. Также могут быть использованы локальные нормы, характерные, например, для работников конкретного предприятия.

Для получения адекватных норм для специфических групп необходимо стратифицировать выборку по основной переменной, влияющей на эти группы.

Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которой она вырабатывалась. Пользующийся тестом всегда должен знать способ,которым устанавливались нормы теста. Применительно к психологическим тестам они никоим образом не абсолютны, не универсальны и не постоянны. Они просто отражают выполнение теста испытуемыми извыборки стандартизации.

В SPSS: Типы статистических шкал

В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

Пол 1 = мужской
  2 = женский
Семейное положение 1 = холост/не замужем
  2 = женат/замужем
  3 = вдовец/вдова
  4 = разведен(а)
Курение 1 = некурящий
  2 = изредка курящий
  3 = интенсивно курящий
  4 = очень интенсивно курящий
Месячный доход 1 = до 3000 DM
  2 = 3001 - 5000 DM
Коэффициент интеллекта (I.Q.) 3 = более 5000 DM
Возраст, лет  

Рассмотрим сначала графу Пол. Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами

Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или:о мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале. В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название- дихотомическая.

Такая же ситуация и с переменной Семейное положение. Здесь также соответствие -:жду числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической — у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

В качестве следующего примера рассмотрим переменную Курение. Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий — больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале.

Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

К классическими примерами переменных с порядковой шкалой относятся также переменные, полученные в результате объединения величин в классы, как Месячный доход в нашем примере.

Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции.

Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами.

Рассмотрим теперь коэффициент интеллекта (IQ). Не только его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ганса IQ равен 80, у Фрица — 120 и у Отто — 160, можно сказать, что Фриц в сравнении с Гансом настолько же интеллектуальнее насколько Отто в сравнении с Фрицем (а именно — на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Ганса в два раза меньше, чем у Отто, исходя из определения IQ нельзя сделать вывод, что Отто вдвое умнее Ганса.

Такие переменные, у которых разность (интервал) между двумя значениями имеет эмпирическую значимость, относятся к интервальной шкале. Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

Наконец, мы достигли наивысшей статистической шкалы, на которой эмпирическую значимость приобретает и отношение двух значений. Примером переменной, относящейся к такой шкале является возраст: если Максу 30 лет, а Морицу 60, можно сказать, что Мориц вдвое старше Макса. Шкала, к которой относятся данные называется шкалой отношений. К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. Поэтому переменные относящиеся к интервальной шкале, как правило, имеют и шкалу отношений.

Подводя итоги, можно сказать, что существует четыре вида статистических шкал, на которых могут сравниваться численные значения:

Статистическая шкала Эмпирическая значимость
Номинальная Нет
Порядковая Порядок чисел
Интервальная Разность чисел
Шкала отношений Отношение чисел

На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. То есть в дальнейшем практически всегда речь будет идти о переменных, относящихся к интервальной шкале.

Пользователь SPSS должен четко разбираться в видах статистических шкал и при выборе метода обращать внимание на то, чтобы были определены надлежащие виды шкал.

Мы уже указывали, что переменные, относящиеся к номинальной шкале допускают весьма ограниченные возможности для проведения анализа. Исключение в некоторых ситуациях составляют дихотомические переменные. Для них можно, по крайней мере, определять ранговую корреляцию. Если, например, обнаруживается корреляция коэффициента интеллекта с полом, то положительный коэффициент корреляции означает, что женщины интеллектуальнее, чем мужчины. Однако если переменные, относящиеся к номинальной шкале не являются дихотомическими, вычисление коэффициентов ранговой корреляции не имеет смысла.

17. Сравнение среднихSPSS

Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.

При сравнении средних значений выборок предполагается, что обе выборки подчиняются нормальному распределению. Если это не так, то вычисляются медианы и для сравнения выборок используется непараметрический тест.

При сравнении средних значений выборок выделяют четыре различные тестовые ситуации*:

1. сравнение двух независимых выборок

2. сравнение двух зависимых (спаренных) выборок

3. сравнение более двух независимых выборок

4. сравнение более двух зависимых выборок

В этих ситуациях соответственно применяются следующие статистические тесты:

· t-тест для независимых выборок (тест Стьюдента)

· t-тест для зависимых выборок

· однофакторный дисперсионный анализ

· однофакторный дисперсионный анализ с повторными измерениями

Первые три из этих тестов вызываются с помощью меню Analyze (Анализ) Compare Means (Сравнение средних)

Чтобы провести однофакторный дисперсионный анализ с повторными измерениями (очень часто встречающаяся тестовая ситуация) надо вызвать команду меню Analyze (Анализ) General Linear Model (Общаялинейнаямодель) Repeated Measures... (Повторные измерения)

Сначала мы рассмотрим тесты, вызов которых происходит посредством пункта меню Compare Means. Для примера мы возьмем данные исследования гипертонии в файле hyper.sav.

· Загрузите файл hyper.sav (исходный файл, в кот работаешь).

· Выберите в меню команды Analyze (Анализ) Compare Means (Сравнение средних)

В подменю содержатся, в частности, t-тест для независимых выборок (Independent-Samples Т Test), t-тест для парных выборок (Paired-Samples Т Test) и однофакторный дисперсионный анализ (ANOVA) для сравнения нескольких независимых выборок (One-Way ANOVA).

Еще один тест, включенный в данное подменю, это t-тест случайной выборки, используемый для сравнения с заданным значением (One-Sample T Test). В подпункте меню Means... (Средние) вычисляются средние значения раздельно по категориям группирующей переменной; здесь также можно проверить существование значимого различия при помощи однофакторного дисперсионного анализа. В этом отношении данный подпункт предоставляет меньше возможностей, чем подпункт One-Way ANOVA..., и поэтому здесь не рассматривается.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: