Методы первичного описания данных

Тема 3 Первичное описание исходных данных

Задания для самостоятельной работы.

1. Чему равны мода, медиана и среднее арифметическое следующих массивов?

- {8, 11, 12, 10, 11, 12, 15, 17,19}

- {7, 8, 9, 11, 12, 13, 19}

- {12, 21, 10, 15, 16, 19, 9, 10, 15, 14, 17}

2. Чему равны размах, дисперсия и стандартное отклонение (с точностью до одного нуля после запятой) следующих массивов данных?

- {5, 4, 2, 4, 4, 4, 4, 5, 5, 9, 8, 9, 4, 5, 6}

- {11, 12, 11, 15, 5, 6, 14, 7, 12, 13, 11, 11, 12}

3. В каком случае невозможно определить моду у выборки с известными данными?

4. Определить размах у показателей субтестов «осведомленность» и «скрытые фигуры» (Таблица I Приложения).

5. Определить средний показатель роста студентов вашей группы и соответствующее стандартное отклонение. Какова должна быть высота дверного проема, чтобы быть уверенным, что сквозь него не нагибаясь смогут пройти 95 % студентов группы?

6. Проверить нормальность распределения показателей любого субтеста из Таблицы данных Приложения. Использовать все 46 случаев.

7. Для показателей субтестов из Таблицы данных при помощи программы Excel вычислены точные показатели среднего арифметического и стандартного отклонения. Необходимо проверить степень совпадения этих показателей с аналогичными, вычисленными при помощи формул приближенных значений.

    осведомленность скрытые фигуры пропущенные слова арифметика понятливость исключение изображений аналогии числовые ряды умозаключения геометрическое сложение заучивание слов средний IQ экстраверсия-интроверсия нейротизм средняя отметка
Рассчитано на компьютере М 10,8 9,8 10,2 11,2 10,1 9,8 10,9 9,9 12,0 11,1 9,7 10,5 13,1 11,9 4,1
s 2,2 2,7 2,6 2,1 1,9 2,4 2,9 2,3   2,6 2,2 1,4 3,3 3,9 0,4
При помощи формул приближенного вычисления М                              
s                              

Для первичного описания исходных данных чаще всего используются таблицы, вариационные ряды и графики. Частным случаем таблицы является таблица кросс-табуляции. Таблицы кросс-табуляции используются для анализа номинативных данных и указывают частоту встречаемости явления. Например, приведенная ниже таблица 2 х 2 демонстрирует наличие или отсутствие интереса к математике у студентов факультета психологии СПбАА обоих полов.

  М Ж
Наличие интереса    
Отсутствие интереса    
Всего:    

Можно ли сказать, что у студентов-юношей интерес к математике выражен меньше, чем у студентов-девушек? Для ответа на данный вопрос следует использовать специальные статистические методы, например, критерий χ2 (читается «хи–квадрат»). Работе с указанным критерием будет посвящен специальный раздел пособия.

Вариационый ряд – упорядоченное отражение распределение значений признака, представляющий двойной ряд чисел и состоящий из обозначения классов и соответствующих частот. В строке признаков можно использовать не только градации (степень выраженности), но и метрические данные, и диапазоны метрических данных.

Степень экстра- версии        
Частота (кол-во случаев)        

Графики (называются также диаграммами) – это чертежи, которые можно использовать для наглядности распределения количественно выраженной величины в выборке. При этом по оси ординат всегда откладывается частота. Ниже дан пример одного из видов графиков, называемого полигоном (представляет собой ломаную линию), демонстрирующего распределение показателей экстраверсии.

Среди графиков также часто используются гистограммы распределения. Они представляют собой столбиковые диаграммы, при этом каждый столбец опирается на значение признака (интервал значения) переменной. Высота столбца соответствует частоте встречаемости этого значения. Ниже приведен пример гистограммы (значения те же).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: