Представление результатов распределения континуальных (непрерывных) признаков

Табулирование порядковых и интервальных величин, величин шкалы отношений не отличается от составления таблиц для уже рассмотренных номинативных дискретных величин. Однако, графическое отображение здесь осуществляется по-иному, тем более, когда первичные результаты группируются в классы и разряды.

Например, в эксперименте определялся цвет последователь­ного образа восприятия насыщенного красного цвета у 96 испытуемых. Каждый из них в течение минуты рассматривал окрашенный в красный цвет образец, а потом переносил взгляд на белый экран. Рядом с экраном помещен цветовой круг, на котором испытуемый должен выбрать тот цвет, который соответствует цвету возникшего у него последовательного образа. При этом испытуемый называет не цвет, а его номер в цветовом круге. Цветовой круг как раз и представляет собой интервальную шкалу, т.к. соседние цвета отличаются друг от друга на одинаково замечаемую величину. В эксперименте испытуемые определяли свой последовательный образ в диапазоне от № 16 до № 23. Результаты были сведены в таблицу:

Последовательный образ (X) Частота называния (f)
   
f  

Первичные результаты можно отразить в виде ступенчатой диаграммы – гистограммы.

От гистограммы можно перейти к построению частотного полигона распределения. Частотный полигон (лат. poligonum – многоугольник) строят, соединяя прямыми линиями верхние точки центральных осей всех участков ступенчатой диаграммы. Если точки полигона соединить не прямыми отрезками, а плавной непрерывной линией, то получится кривая распределения первичных результатов. Эта кривая позволяет путем интерполяции (лат. interpolatio – изменение, искажение) находить по ряду данных значений функции её промежуточные значения, которые в опыте не были получены.

Полученный эмпирический материал, имеющийся в виде выборки, должен быть сначала упорядочен, т.е. сведен в некоторую удобную для обозрения и дальнейшего осмысления форму.

Упорядочиваниепроцедура первоначальной обработки, состоящая в расположении вариант выборки в определенной последовательности.

Например, в эксперименте по запоминанию ряда из десяти двузначных чисел результаты составили для 35 испытуемых следующие величины: 5, 3, 5, 5, 4, 3, 3, 4, 1, 4, 5, 4, 4, 3, 4, 5, 3, 3, 4, 5, 4, 2, 3, 2, 4, 2, 4, 3, 4, 3, 3, 4, 2, 4, 5. Упорядочив варианты по степени их возрастания, мы получим статистический ряд: 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5.

Вслед за упорядочиванием вариант {варианта – единичное выражение признака) нередко производят их группировку. Для случаев континуальной переменной, т.е. такой единицы измерения, которая может иметь дробные значения (в отличие от дискретной переменной), группировка – это объединение вариант в интервалы, границы которых устанавливаются произвольно и обязательно указываются.

Внимание! Здесь пользуются правилом:

При числе данных, значительно превышающем 25, их целесообразно группировать не менее, чем в 10 и не более, чем в 20 классов. При этом в качестве величин,! характеризующих ширину класса группировки, используют величины 1,2,3,5, 10,20.

Например, массив данных, характеризующих все правильные ответы испытуемых (N = 50) на некоторый психологический тест, представлен величинами:

25, 33, 35, 37, 55, 27, 40, 33, 39, 28,
34, 29, 44, 36, 22, 51, 29, 21, 28, 29,
33, 42, 15, 36, 41, 20, 25, 38, 47, 32,
23, 27, 27, 33, 46, 10, 16, 34, 18, 14,
46, 21, 19, 26, 23, 17, 24, 21, 27, 16.

Для группировки в этом массиве данных сначала нужно найти максимальное и минимальное числа (подчеркиваем), а на основе их разности определить размах распределения (55 – 10 = 45). Для получения не менее, чем 10 классов группировки, ширина класса должна быть не меньше 5. Затем, нужно установить границы классов группировки, причем так, чтобы и максимальное и минимальное числа попали в верхний и нижний классы. Для этого строим таблицу:

Классы группи­ровки Границы классов Точные границы классов Центры классов (Xi) Первичные распределения Частота встречаемости (f)
  55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 54.5 – 59.5 49.5 – 54.5 44.5-49.5 39.5-44.5 34.5-39.5 29.5-34.5 24.5-29.5 19.5-24.5 14.5-19.5 9.5-14.5   / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / /  
∑f=50

В первой графе указывают число классов группировки. Здесь 1-й класс – минимум, а 10-й класс – максимум величины массива. Во второй графе указывают границы классов на основе величины 5, т.е.
1-й класс – 10, 11, 12, 13, 14; 2-й класс – 15, 16, 17, 18, 19, и т.д. В данном случае мы рассматриваем непрерывно распределенные величины, поэтому необходимо ликвидировать разрывы между ними. Для этого мы определяем точные границы классов (3-я графа). Так как величины в интервале между высокими и низкими классами группировки распределены равномерно, то каждая точная граница классов может быть основой для определения средней арифметической величины (4-я графа). Средняя арифметическая каждого класса в условиях равномерного распределения величин соответствует центральным значениям класса (Xi). Сравнивая теперь верхнюю границу предыдущего класса и нижнюю границу последующего класса мы можем убедиться, что дискретность в ряду ликвидирована, а ряд величин стал непрерывным. Рассмотренные графы дают основание для группировки первичных результатов. Характер распределения первичных результатов фиксируется в 5-й графе, а частота встречаемости (f) – в 6-й графе.

Теперь можно строить гистограмму, полигон частот и кривую распределения:

На основе табличного и графического представления первич­ных результатов может быть произведен расчет статистических показателей. Цель расчетов состоит в том, чтобы с помощью простых показателей дать математическую оценку результатов экспериментов или наблюдений.

Наиболее часто используемыми статистическими показателями распределения являются меры центральной тенденции и меры рассеивания, о которых говорится в следующей теме.

Контрольные вопросы

1. Что называется частотой? Сформулируйте определение.

2. Какие варианты распределения первичных результатов Вы знаете?

3. Какими параметрами определяется нормальное (гауссово) распределение?

4. Назовите меры центральной тенденции. Что такое медиана?

5. Дайте определение моды.

6. Что такое выборка?

7. Как представляются результаты распределения дискретных признаков?

8. Каковы особенности представления результатов распределения континуальных признаков, отличающие их от дискретных?

9. Что такое упорядочивание? Смысл этой процедуры.

10. Что такое группировка? Каким правилом здесь пользуются?

11. Дайте представление о гистограмме, полигоне частот и кривой распределения.

12. Каковы особенности представления результатов распределения дискретных признаков, отличающие их от континуальных?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: