Основное требование к выборке

Математическая статистика

Методы математической статистики позволяют решать задачи, которые возникают на практике, к такому числу относятся:

1. Изучение большой совокупности объектов по небольшому числу случайно отобранных объектов;

2. Нахождение приближенных значений параметров, которыми определяется распределение вероятностей изучаемого признака;

3. Установление формы и силы связи между случайными величинами.

Исходные статистические данные и понятия выборки.

Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака.

Генеральной совокупностью называют совокупность объектов, их которых производится выборка.

Выборочной совокупностью(выборкой) называют совокупность случайно отобранных объектов. Объемом совокупности называют число объектов этой совокупности, при составлении выборки можно поступать двояко. Объект может быть возвращен или не возвращен в генеральную совокупность. Поэтому выборки подразделяются на повторные и бесповторные. Повторной называют выборку, при которой отобранный объект возвращается в генеральную совокупность. Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается. В силу больших чисел можно утверждать, что выборка будет представительной, если ее осуществить случайно. Каждый объект выборки отобран случайно из генеральной совокупности и все объекты имеют одинаковую вероятность попасть в выборку.

Основное требование к выборке.

Элементы выборки должны быть случайными, объем выборки достаточно большой. Предположим, что мы произвели n -независимых наблюдений случайной величины x и получили набор чисел x 1, x 2xn. Эти наблюдения можно рассматривать как однократное наблюдение многомерной случайной величины и имеют одинаковый закон распределения.

Выборкой объема n называется многомерная случайная величина, а набор чисел называется наблюдаемым значением или реализацией.

Пример 1: Монета подбрасывается 40 раз. Обозначим выпадение герба за1, а выпадение цифры за 0. В результате опыта получим:

,

Полученный вектор является наблюдаемым значением или реализацией выборки .

Пример2: Измеряют рост студентов, их 90 человек, с точностью до 0,1 см, причем максимальный рост был бы 188,8 см, а минимальный -153см.

Определение:

Величина d, где от максимального значения xi отнимается минимальное значение xi, называется размахом выборки.

d =188,8-153=35,8,

d=xmax-xmiт

Исходные данные представляют в более компактном виде, которые называют сгруппированными данными. Для дискретных случайных величин указываются наблюдаемые значения и соответствующие частоты, т.е. сколько раз встретилось в выборке данное значение.

zi    
ni    

Для непрерывных случайных величин весь диапозон выборки разбивается точками yi, так чтобы минимальное xi равнялось бы x0, а последнее максимальному значению , , тогда интервал называют y -классом. Обычно классы имеют одинаковую длину, , где m-число классов(его подбирают оптимально). Число рекомендуется выбирать по формуле , середину класса обозначают ;

Определим число классов для 2-го примера

n =90; классов;

d =35,8;

Тогда получаем:

  154,2   156,6   159,0   161,4   163,8   166,2   168,6   171,0
ni                
  173,4   175,8   178,2   180,6   183,0   185,4   187,8  
ni                

y 0=153,0

y 1= y 0+2,4=155,4

Определение:

Любая функция выборки называется статистикой. Статистика является случайной величиной, т.к. на различных реализациях выборки она получает различные наблюдаемые значения. Т.е. частоты, границы классов, они тоже являются статистикой. Любая функция от статистики также является статистикой, поэтому статистика-это любая функция от сгруппированных данных. Статистики служат для оценки любых характеристик, изучаемой случайной величины, вероятности случайных событий, связанных с изучаемой величиной, ее числовых характеристик, параметров закона распределения и т.д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: