Алгебра
Класс
Урок 19 – 21
Лекция
Сбор и группировка статистических данных
Ознакомление со статистикой и ее необходимостью
Статистика имеет дело с огромными массивами исходной информации. Как, например, определить среднюю продолжительность жизни мужчин или женщин по стране? Нужны миллионы первоначальных замеров. Но большие размеры исходных данных не наглядны и не удобны для анализа. Их нужно предварительно обработать, представить в удобном виде, для дальнейшего анализа и дальнейшей обработки.
Ознакомление с представлением данных в табличном виде
Пусть первоначальные замеры – это время на дорогу от дома до спецшколы у пятидесяти ее учеников. Данные опросов округлили до десяти минут и получили исходную таблицу данных: 50 чисел.
20 | 100 | 20 | 30 | 40 | 50 | 30 | 80 | 90 | 40 |
30 | 50 | 20 | 50 | 30 | 30 | 50 | 60 | 60 | 50 |
30 | 40 | 60 | 50 | 100 | 60 | 90 | 10 | 20 | 50 |
90 | 80 | 20 | 40 | 50 | 10 | 50 | 40 | 30 | 40 |
60 | 120 | 30 | 40 | 60 | 20 | 60 | 10 | 50 | 60 |
И что видно из этой таблицы? Много учеников живет далеко от школы? Даже на такой вопрос ответ неясен. Действительно, необходима предварительная обработка информации, ее дизайн. Обработка начинается с группировки информации. Информация группируется в пределах 10–180 минут, так как менее 10 минут никто из учеников не заявил, более 3 часов в один конец никто не ездит. Вывод: при измерении могли получиться следующие числа в минутах.
|
|
Измерение | Общий ряд данных |
Время проезда (мин) | 10, 20, 30, …, 170, 180 |
Получили так называемый общий ряд данных – это возможные результаты измерений. Среди общего числа, в нашем примере встретились числа: 10, 20, 30, 40, 50, 60, 80, 90, 100, 120. Не встретились числа: 70, 110, 170.
Определение: варианта измерения – это один из результатов этого измерения. Фактически, числа, встретившиеся в нашем примере, и есть варианта измерений.
Если варианты перечислить по порядку и без повторений, то получим ряд данных измерения.
Измерение | Общий ряд данных | Ряд данных измерения |
Время проезда (мин) | 10, 20, 30, …, 170, 180 | 10, 20, 30, 40, 50, 60, 80, 90, 100, 120 |
Если варианта встретилась в измерении раз, то число называется кратностью этой варианты. Например: кратность варианта 60 минут равна восьми, а варианты 120 равна единице.
В таблице представлены варианты для всех десятков минут из нашего примера.
| Варианта, дес. мин | Сумма | |||||||||
1 | 2 | 3 | 4 | 5 | 6 | 8 | 9 | 10 | 12 | ||
Кратность | 3 | 6 | 8 | 7 | 10 | 8 | 2 | 3 | 2 | 1 | 50 |
Варианта и ее кратность – основа табличного представления информации.
В данной таблице представлены в верхнем ряду все варианты – все измерения, которые случились, и их кратности, в нижнем ряду. Для краткости измерения представлены в десятках минут.
|
|
Теперь становится ясно, что одна пятая всех учеников, а именно 10 учеников из 50, едет в школу 50 минут. Сумма кратностей – это объем измерений. Через объем кратность варианты переводится в частоту варианты: .
Кратность варианты может быть представлена через частоту варианты или в процентах: .
На основании этих формул получим следующую таблицу измерений.
| Варианта, дес. мин | Сумма | |||||||||
1 | 2 | 3 | 4 | 5 | 6 | 8 | 9 | 10 | 12 | ||
Кратность | 3 | 6 | 8 | 7 | 10 | 8 | 2 | 3 | 2 | 1 | 50 |
Частота | 0,06 | 0,12 | 0,16 | 0,14 | 0,2 | 0,16 | 0,04 | 0,06 | 0,04 | 0,02 | 1 |
Частота,% | 6 | 12 | 16 | 14 | 20 | 16 | 4 | 6 | 4 | 2 | 100 |
Верхний ряд данной таблицы содержит все варианты, далее идет ряд с кратностями каждой варианты, после этого – частота и в завершении – частота в процентах. Заметим, что сумма всех частот равна единице, а сумма частот в процентах равна сотне. Из таблицы предельно ясно, что 20% учеников добираются до школы 50 минут.
На данном этапе информация сгруппирована и составлена таблица распределения данных – теперь информация приобрела наглядность. Теперь разберемся с графическим представлением информации.