Способы представления результатов наблюдений

Экспериментальные данные обычно представляют собой результаты подсчета (измерения) некоторых характеристик (признаков) объектов (число ответов на данный вопрос, количество баллов в результате данного теста, оценки контрольной работы, время усвоения материала и т.д.), выбранных из большой совокупности объектов. Наблюдаемые в выборке значения x ₁, x ₂, …, x_n случайной величины X (результаты измерений) называют вариантами. Если в выборке объема n элемент x_i встречается n_i раз, то число n_i называется частотой элемента x_i. Очевидно, что n_i = n.

Выборка может быть записана в виде вариационного ряда или в виде статистического ряда.

■ Вариационный ряд выборки x ₁, x ₂, x ₃,..., x_n - способ ее записи (ранжирование), при котором элементы (варианты) упорядочиваются по величине, т.е. записываются в виде последовательности x ₁', x ₂', x ₃',..., x_n ', где x ₁'£ x ₂'£ x ₃£... £ x_n '.

■ Статистический ряд выборки – последовательность пар (x_i,n_i). Обычно статистический ряд записывается в виде таблицы, первая строка которой содержит элементы x_i, а вторая - их частоты n_i.

Пример 3.3. Записать в виде вариационного и статистического ряда выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.

Решение. Объем выборки n = 15. Упорядочив элементы выборки по величине, получим вариационный ряд: 2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10. Статистический ряд в виде таблицы показан на рис. 3.4.

x_i
n_i

Рис. 3.4

При большом объеме выборки ее элементы объединяют в группы (разряды), представляя результаты измерений (наблюдений) в виде сгруппированного статистического ряда. Для этого интервал, содержащий все элементы выборки, разбивается на k частичных непересекающихся интервалов. Число интервалов группировки k находят по формуле Стерджеса: k = 1+3,32·lg n. Вычисления значительно упрощаются, если частичные интервалы имеют одинаковую ширину h = w / k. Нижняя граница первого интервала [ a ₁; a ₂) определяется по формуле a ₁ = x_min – 0,5 h, верхняя граница первого интервала a ₂ = a ₁ + h. Нижняя граница второго интервала [ a ₂; a ₃) совпадает с верхней границей первого, верхняя граница второго интервала a ₃ = a ₂ + h и т.д. После того как частичные интервалы выбраны, определяют частоты - количество n_i элементов выборки, попавших в i -й интервал (элемент, совпадающий с верхней границей интервала, относится к последующему интервалу).

Пример 3.4. В таблице 3.1 приведены экспериментальные данные, представляющие собой результаты тестирования (ТЕСТ №1), полученные группой школьников 2-х классов (50 человек). Представьте данную выборку в виде сгруппированного статистического ряда.

Решение. Объем выборки n = 50, размах выборки w = x_max – x_min = = 178 – 128 = 50. Число интервалов группировки k возьмем равным 7 (k» 1+3,32·lg50» 6,64). Тогда ширина интервалов h = w / k = 50/7» 7,14 (балла). Исходные данные определены с точностью 1 балл, поэтому округлим (обычно это делается в сторону увеличения) найденное значение h с учетом требуемой точности: возьмем h = 8 баллов. Найдем границы интервалов. Нижняя граница первого интервала [ a ₁; a ₂) a ₁ = x_min – 0,5 h = 128 – 0,5·8 = 124, значит, верхняя граница первого интервала a ₂ = a ₁ + h = 124+8 = 132. Нижняя граница каждого следующего интервала совпадает с верхней границей предыдущего.