Выборка и способы ее представления

Всю совокупность экспериментальных данных будем называть генеральной совокупностью.

Однако, получение экспериментальных данных достаточно трудоемкий, дорогой процесс, а в некоторых случаях и просто невозможный. Поэтому из всей генеральной совокупности приходится выбирать только определенную часть объектов, которую называют выборочной совокупностью или выборкой объема n.

Предположим, что над случайной величиной Х производится ряд независимых опытов (наблюдений). В каждом из этих опытов случайная величина Х принимает определенное значение: x ₁, x ₂, …, x_n. Совокупность этих значений рассматривается как простая выборка.

Наблюдаемое значение x_i называют вариантой, а их последовательность, записанную в возрастающем порядке, - вариационным рядом. Для каждой варианты можно указать частоту ее появления, которую обозначают . Также может быть найдена относительная частота появления определенной варианты, как отношение частоты к объему выборки:

Сумма всех относительных частот должна быть равна единице.

Не трудно заметить, что относительная частота имеет смысл статистическойвероятности.

Статистическим распределением или статистическим рядом называют соответствие вариант и их частот (табл.2.1.1) или относительных частот (табл.2.1.2).

Таблица 2.1.1

X	x ₁	x ₂	...	x_k
			...

Или

Таблица 2.1.2

X	x ₁	x ₂	...	x _k
			...

Пример 1. Записать в виде вариационного ряда выборку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4. Представить статистическое распределение выборки.

Решение. Объем выборки n =15. Упорядочив элементы выборки по величине, получим вариационный ряд 2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10. Различными в заданной выборке являются элементы х ₁=2, х ₂=3, х ₃=4, х ₄=5, х ₅=7, х ₆=10; их частоты соответственно равны =3, =1, =2, =3, =4, =2. Следовательно, статистическое распределение исходной выборки можно записать в виде следующей таблицы:

Таблица 2.1.3

x_i

Для контроля правильности записи находим

Для каждого значения варианты можно найти также относительные частоты. В этом случае таблица для статистического ряда принимает следующий вид (табл. 2.1.4):

Таблица 2.1.4

Х

При большом числе наблюдений статистический ряд перестает быть удобной формой записи статистического материала – он становится громоздким и мало наглядным. Для придания ему большей компактности и наглядности строится так называемый интервальный статистический ряд. В этом случае весь диапазон наблюдаемых значений Х разделяется на интервалы и подсчитывается количество значений , приходящееся на каждый интервал (табл. 2.1.5).

Таблица 2.1.5

Границы интервалов	x ₁; x ₂	x _2; x ₃	...	x_k; x_k₊ ₁
			...

Длину интервала – h –проще выбирать одинаковой. Практика показывает, что число интервалов рационально выбирать порядка 7-20. Для нахождения длины интервала можно воспользоваться формулой:

(2.1.1)

Если в результате вычисления по формуле (2.1.1) длина интервала получится дробным числом, от выбирают либо близкое целое число, либо близкую простую дробью.

Пример 2. Представить выборку в виде интервального статистического ряда:

38 60 41 51 33 42 45 21 53 60

68 52 47 46 49 49 14 57 54 59

77 47 28 48 58 32 42 58 61 30

61 35 47 72 41 45 44 55 30 40

67 65 39 48 43 60 54 42 59 50.

Решение. Объем выборки n= 50. Наибольшая варианта – 77, наименьшая – 14. Найдем длину интервала по формуле (2.1.1):

Выбираем длину интервала 9. Интервальный статистический ряд принимает вид (табл. 2.1.6).

Таблица 2.1.6

Границы интервалов	[14;23)	[23;32)	[32;41)	[41;50)	[50;59)	[59;68)	[68;77]

	0,04	0,06	0,12	0,34	0,2	0,18	0,06

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

18 19 20 21 22 23 24

Подборка статей по вашей теме: