1. Группировка данных (построение рядов распределения), т.е. упорядочивание значений в определённой последовательности.
Этапы группировки:
1. Предварительный анализ полученных данных;
2. Формирование таблицы: 3 столбца (изучаемый признак, частота повторений значений признака, доля значений признака в общей совокупности);
3. Определяются интервалы группировки данных;
4. Производится подсчёт количества значений признака и заполнение таблицы.
Пример: рассмотрим данные о возрасте студентов первого курса одной из групп 15 человек. Получена следующая информация:
16, 17, 17, 17, 17, 18, 17, 16, 17, 18, 16, 18, 17, 17, 17.
| Возраст студента | Количество студентов | Доля, % |
| 16 | 3 | 20 |
| 17 | 9 | 60 |
| 18 | 3 | 20 |
| ИТОГО: | 15 | 100 |
В некоторых случаях, когда значения признака изменяются в широких пределах, для упрощения интерпретации данные группируются в интервалы. Для этого сначала определяется количество групп:
- самостоятельно исследователи, исходя из смыслового содержания изучаемого явления;
- по формуле Стерджеса:
,
где
- количество единиц в исходной совокупности,
- количество групп
| ||||||
| 15-24 | 25-44 | 45-89 | 90-179 | 18-359 | 360-719 |
- определяется ширина интервала группы:
,
где
- наибольшее и наименьшее значение признака.
- определяются интервальные границы, начиная с первого, путем прибавления к нижней границе каждого интервала рассчитанной ширины интервала i: Хmin – X min+i;
- строится ряд распределения.
Пример:
Имеются данные о стаже работника бригады, состоящей из 22 человек:
2,4,5,5,6,6,5,6,6,7,7,8,8,9,10,11,4,3,3,4,4,5.
года
| Стаж | Число работников | Доля, % |
| 2-3 | 3 | 14 |
| 4-5 | 8 | 36 |
| 6-7 | 6 | 27 |
| 8-9 | 3 | 14 |
| 10-11 | 2 | 9 |
| ИТОГО: | 22 | 100 |
Перекрестная группировка - группировка по двум и более признакам используется для выявления наличия (или отсутствия) взаимосвязи между признаками.
Наиболее часто применяемой является таблица размерностью 2*2, общая форма которой представлена ниже.
| Признак X / Признак | Y1 | Y2 | Итого: |
| X1 | a | b | a+b |
| X2 | c | d | c+d |
| Итого: | a+c | b+d | a+b+c+d |
Примеры:
1. Кто покупает современные детективы российских и зарубежных авторов: мужчины или женщины? В данном примере совмещаются 2 признака: авторство детективов (российский или зарубежный) и пол покупателя (мужской или женский). В опросе приняло участие 200 человек (100 мужчин и 100 женщин).
| Признаки покупателей | Российские детективы | Зарубежные детективы | Общее число |
| Мужчины | 70 чел | 30 чел | 100 чел |
| Женщины | 50 чел | 50 чел | 100 чел |
| Итого | 120 чел | 80 чел | 200 чел |
2. Участие работников акционерного общества в предложении инноваций на предприятии (1000 чел.):
| Категория работников | Участвую в инновациях | Не учувствую в инновациях | Итого: |
| Рабочие | 250 | 455 | 705 |
| ИТР | 140 | 120 | 260 |
| Руководство | 10 | 25 | 35 |
| Итого: | 400 | 600 | 1000 |
Способом количественной оценки взаимосвязи двух признаком является коэффициент Юла:

Коэффициент изменяется в пределах от -1 до+1. Абсолютное значение коэффициента показывает степень связи для изучаемых пар величин. Чем ближе его модулю к значение 1, тем сильнее связаны измеряемые характеристики. При положительном значении связь прямая, при отрицательном - обратная относительно изучаемым признакам.






