Понятие выборки

Понятие выборки и способов её получения есть одно из центральных понятий математической статистики. Говорят, что каждая третья студентка Гарвардского университета выходит замуж за одного из своих преподавателей. На самом же деле в 1901 году в университете обучались только З девушки, одна из которых вышла замуж за своего профессора. Ясно, что в данном случае недостаточен объём выборки. Но не так просто сказать, какойобъём выборки достаточен.

Рассмотрим ещё пример. Пусть имеется партия из 10000 номинально идентичных изделий. Известно, что некоторые из этих изделий дефектны: их критические размеры лежат вне допустимых границ. Требуется оценить долю (скажем, В) дефектных изделий в партии на основе результатов точного измерения размеров, проведенного на выборке из 20 изделий, взятых из партии. Рассмотрим процедуру формирования выборки. Предположим, что она организована следующим образом: 20 изделий должны быть выбраны «случайно», т. е. таким образом, чтобы при каждом акте выбора все изделия в партии имели бы одинаковый шанс быть отобранными. Так как в нашем случае партия очень велика по сравнению с объемом выборки, доля дефектных изделий в ней после извлечения выборки не будет существенно отличаться от исходной, доли В.Такой выбор называется репрезентативным.

Однако, конкретизация представления о том, что такое случайный выбор, даже в теории вероятностей очень не просто, что можно проиллюстрировать известным парадоксом Бертрана.

Получение разных результатов кажется парадоксальным, так как было убеждение, что слова «случайный выбор» однозначно определяют искомую вероятность. Парадокс показывает, что возможны различные способы выбора случайным образом, причем каждый способ выглядит по-своему «естественным». Фактически это означает, что в зависимости от того, что именно мы понимаем под словами «Случайным образом (равномерно)», вероятности могут быть выбраны многими различными способами.

Наконец, выборка должна быть статистически устойчива. Пусть в серии из опытов случайное событие А осуществлялось раз. Тогда отношение называют относительной частотой события А в этой серии испытаний. Если при условии независимости исходов отдельных опытов различные серии испытаний (по n испытаний каждая) дают весьма близкие значения относительной частоты, то говорят, что относительная частота события обнаруживает при больших n свойство стабильности или статистической устойчивости. Статистической вероятностью события А в данном испытании называется число Р(А), около которого группируются значения относительной частоты при больших n. . Кроме того, в статистике в статистическую устойчивость включается ещё и требование отсутствия статистических взаимосвязей между явлениями. Что это такое показывает знаменитый парадокс Джиффена. В конце XIX века английский статистик Джиффен установил, что при повышении цены на дешевый, но необходимый товар (например, хлеб) спрос на него увеличивается, а не уменьшается, хотя как будто бы является очевидным, что с повышением цены на товар спрос на него должен падать.

Только в 1915 г. Е. Е. Слуцкий дал объяснение этого парадокса. Повышение цены на товар должно повлечь за собой понижение покупательной способности, однако если товар насущно необходим (каковым и является хлеб), то спрос на него не может сократиться, как бы ни менялась цена в пределах бюджета покупателя. Поэтому спрос на хлеб не уменьшился, а уменьшились возможности покупки других более дорогостоящих продуктов (мясо, масло и т. д.). Значит, вместо этих продуктов приходится покупать более дешевый продукт, т. е. хлеб.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: