Одна из целей выборки состоит в том, чтобы получить оценки различных параметров, такие, как средняя, стандартное отклонение или доля определенных единиц. Для оценки неизвестных значений этих параметров используются выборочные статистики. Нам нужно знать, как статистики могут быть использованы наилучшим образом для оценивания и какова надежность оценок, полученных таким образом.
Предположим, что выборка, полученная как простая случайная выборка, произведена много раз. Хотя каждый раз производится случайный отбор, конкретные результаты различаются. Большое значение имеют вероятностные распределения выборочных статистики, которые мы используем. Эти распределения могут быть сконструированы в принципе так, как было описано выше.
Мы произвели выборку объема а единиц из совокупности объема N. Для этой выборки мы определим значение статистики, соответствующее тому параметру, в оценке которого мы заинтересованы.
Произведем вторую выборку того же размера и определим ту же статистику, что и прежде. Скорее всего численные значения статистики в двух выборках будут различными. Если мы затем произведем третью и четвертую выборки того же размера, то получим еще одни значения статистики. Однако если мы будем продолжать производить дальнейшие выборки, то некоторые значения статистики будут повторяться. Продолжая производить все возможные выборки размером п единиц из нашей совокупности, в результате мы сможем построить частотное распределение для полученных значений статистики. Соответствующее относительное частотное распределение является вероятностным распределением статис-
120 Ч. 2. Анализ данных как составная часть принятия решений
тики. Это частотное распределение выборочной статистики называется выборочным распределением.
Например, если мы произведем все возможные выборки размером п = 5 единиц из совокупности 50 единиц, то будем иметь 2118760 различных выборок. (Это вычисляется как число комбинаций, потому что нас не интересует порядок, в котором производится отбор).
5сз=5пк=2118760-
Для каждой выборки в 5 единиц мы вычисляем выборочную среднюю и выборочное стандартное отклонение. Частотное распределение всех 2118760 выборочных средних представляет выборочное распределение средних выборок по 5 единиц из этой совокупности. Точно также получение всех выборочных стандартных отклонений дает выборочное распределение выборочных стандартных отклонений для выборок размером 5 единиц из совокупности. Если 50 единиц могут быть разделены, например, на хорошие и плохие, тогда можно вычислить долю хороших единиц в каждой выборке из 5 единиц и получить графики выборочного распределения выборочных долей хороших единиц. Каждое из этих распределений будет отличным. Формы будут зависеть от совокупности, размера выборки и от статистики, которую мы измеряем. Пример, приведенный ниже, иллюстрирует сказанное для совсем малой совокупности.
О Пример 4.1. Имеется конечная совокупность, состоящая из 6 чисел: 4, 8, 12, 16, 20, 24... Построим выборочное распределение на основе выборок по два числа, вычисляя по каждой из них выборочную среднюю в качестве статистики, получим:
С2 = 15 различных выборок.
Решение
Таблица 4.1. Выборочные средние, п-2
Возможные выборки размера п = 2 | Выборочная средняя х х = (х, +xJ/2 | Возможные выборки размера п = 2 | Выборочная средняя х х = (xt +xJ/2 |
4, 8 | 8,24 | ||
4, 12 | 12, 16 | ||
4, 16 | 12,20 | ||
4, 20 | 12,24 | ||
4, 24 | 16,20 | ||
8, 12 | 16,24 | ||
8, 16 | 20, 24 | ||
8,20 |
Гл. 4. Выборка и выборочные распределения
Получаем выборочное распределение средних этих выборок:
Таблица 4.2. Выборочное распределение
Выборочная средняя, х размер выборки п = 2 | Частота, f |
Итого |
Хотя выборочное распределение могло бы быть построено для любой статистики, ниже будет показано, что два из них наиболее полезны — выборочно^ распределение выборочных средних и выборочное распределение выборочных дисперсий.
Статистическая процедура, которая рассматривается в следующих главах, направлена на установление связей между выборочным распределен**ем и генеральной совокупностью. В этой книге мы не пытаемся дать полное теоретическое обоснование этих соотношений, однако, выборка позволяет сделать те заключения, которые нам необходимо использовать. Как только соотношение между выборочным распределением и генеральной совокупностью установлено в целом, м*»1 можем взять одну единственную выборку и использовать выведенное соотношение для того, чтобы сделать заключение о неизвестной генеральной совокупности, из которой эта выборка была взята. Во всех случаях мы предполагаем, что генеральная совокупность является нормальной или приблизительно нормальной и что требуемые выборочные статистики известны. Таким образом мы можем, например, определить, что генеральная средняя ц вероятно равна какому-то значению или то, что она лежит в определенных пределах, которые мы ожидаем с учетом ее дисперсии о~ -