Ознакомление с представлением данных в табличном виде

Алгебра

Класс

Урок 19 – 21

Лекция

Сбор и группировка статистических данных

Ознакомление со статистикой и ее необходимостью

Статистика имеет дело с огромными массивами исходной информации. Как, например, определить среднюю продолжительность жизни мужчин или женщин по стране? Нужны миллионы первоначальных замеров. Но большие размеры исходных данных не наглядны и не удобны для анализа. Их нужно предварительно обработать, представить в удобном виде, для дальнейшего анализа и дальнейшей обработки.

Ознакомление с представлением данных в табличном виде

Пусть первоначальные замеры – это время на дорогу от дома до спецшколы у пятидесяти ее учеников. Данные опросов округлили до десяти минут и получили исходную таблицу данных: 50 чисел.

20 100 20 30 40 50 30 80 90 40
30 50 20 50 30 30 50 60 60 50
30 40 60 50 100 60 90 10 20 50
90 80 20 40 50 10 50 40 30 40
60 120 30 40 60 20 60 10 50 60

И что видно из этой таблицы? Много учеников живет далеко от школы? Даже на такой вопрос ответ неясен. Действительно, необходима предварительная обработка информации, ее дизайн. Обработка начинается с группировки информации. Информация группируется в пределах 10–180 минут, так как менее 10 минут никто из учеников не заявил, более 3 часов в один конец никто не ездит. Вывод: при измерении могли получиться следующие числа в минутах.

Измерение Общий ряд данных
Время проезда (мин) 10, 20, 30, …, 170, 180

Получили так называемый общий ряд данных – это возможные результаты измерений. Среди общего числа, в нашем примере встретились числа: 10, 20, 30, 40, 50, 60, 80, 90, 100, 120. Не встретились числа: 70, 110, 170.

Определение: варианта измерения – это один из результатов этого измерения. Фактически, числа, встретившиеся в нашем примере, и есть варианта измерений.

Если варианты перечислить по порядку и без повторений, то получим ряд данных измерения.

Измерение Общий ряд данных Ряд данных измерения
Время проезда (мин) 10, 20, 30, …, 170, 180 10, 20, 30, 40, 50, 60, 80, 90, 100, 120

Если варианта встретилась в измерении раз, то число называется кратностью этой варианты. Например: кратность варианта 60 минут равна восьми, а варианты 120 равна единице.

В таблице представлены варианты для всех десятков минут из нашего примера.

 

Варианта, дес. мин

Сумма

1 2 3 4 5 6 8 9 10 12
Кратность 3 6 8 7 10 8 2 3 2 1 50

Варианта и ее кратность – основа табличного представления информации.

В данной таблице представлены в верхнем ряду все варианты – все измерения, которые случились, и их кратности, в нижнем ряду. Для краткости измерения представлены в десятках минут.

Теперь становится ясно, что одна пятая всех учеников, а именно 10 учеников из 50, едет в школу 50 минут. Сумма кратностей – это объем измерений. Через объем кратность варианты переводится в частоту варианты: .

Кратность варианты может быть представлена через частоту варианты или в процентах: .

На основании этих формул получим следующую таблицу измерений.

 

Варианта, дес. мин

Сумма

1 2 3 4 5 6 8 9 10 12
Кратность 3 6 8 7 10 8 2 3 2 1 50
Частота 0,06 0,12 0,16 0,14 0,2 0,16 0,04 0,06 0,04 0,02 1
Частота,% 6 12 16 14 20 16 4 6 4 2 100

Верхний ряд данной таблицы содержит все варианты, далее идет ряд с кратностями каждой варианты, после этого – частота и в завершении – частота в процентах. Заметим, что сумма всех частот равна единице, а сумма частот в процентах равна сотне. Из таблицы предельно ясно, что 20% учеников добираются до школы 50 минут.

На данном этапе информация сгруппирована и составлена таблица распределения данных – теперь информация приобрела наглядность. Теперь разберемся с графическим представлением информации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: