В 4.4.1 стандартная ошибка'выборочного распределения выборочных средних при больших совокупностях определялась как:
SE;
Л^.
Чтобы получить стандартную ошибку из этого выражения, мы должны знать генеральную дисперсию сг. Если нам неизвестна ее величина, то можно использовать в качестве ее оценки выражение:
л2 n s
а ш.
(п-1)
Следовательно, наилучшей оценкой стандартной ошибки является:
^_VE35.>czz. где г-%£^-
(п-1) (п-1) п
Или
Л л/в7 а Л2 Х(*-*)2
SE5=\ — --f=, где в*т— -------------- —— •
п V п (п-1)
Гл. 4. Выборка и выборочные распределения 129
4.4.4. Стандартные выборочные распределения — z, t, %2, F
Имеются четыре стандартных распределения, к которым мы будем часто обращаться в последующих главах. Это нормальное распределение (z), t, x и F распределения. В этом разделе будут рассмотрены основные особенности каждого из этих распределений в связи с их использованием для проведения статистического вывода.
СТАНДАРТНОЕ НОРМАЛЬНОЕ (z) РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНЫХ СРЕДНИХ
В разделе 2.7 мы рассматривали нормальное распределение. Было показано, как можно преобразовать любое нормальное распределение в стандартное нормальное распределение, для которого среднее значение д = 0 и дисперсия а = 1. Значения переменной для такого стандартного нормального распределения обозначаются z и определяются как:
|
|
а
Рассчитанные таким образом значения z используются для нахождения требуемых вероятностей по таблице стандартного нормального распределения.
Выборочное распределение выборочных средних является нормальным распределением, если выборки получены как простые случайные из нормальной совокупности. Такое распределение описывается теми же характеристиками, что и любое нормальное наблюдение, только лить следует иметь в виду, что z в этом случае:
z = ^
ввиду того, что выборочное распределение выборочных средних является распределением значений х (а не х), для которых средняя есть ц, а стандартное' отклонение или стандартная ошибка обозначается как SEj. Значение z измеряется
числом стандартных ошибок, которые отделяют выборочную среднюю от генеральной средней.
Ввиду того, что SEj = o/V~n для больших совокупностей, z может быть выражено как:
а/^Гп
Чтобы использовать это равенство, мы должны знать генеральную дисперсию (а). Если мы не знаем <г, то мы оцениваем ее, используя ее выборочную дисперсию:
л2 ns2 а ' (п - 1)"
130 Ч. 2. Анализ данных как составная часть принятия решений
Стандартизованная переменная в этом случае запишется как:
X - Ц
Z * *А.
O/ViT
но ее распределение не всегда нормально. Стандартное нормальное (z) распределение может заменяться t-распределением.
|
|
t-РАСПРЕДЕЛЕНИЕ ДЛЯ ВЫБОРОЧНЫХ СРЕДНИХ
Если простая случайная выборка произведена из нормальной совокупности, дисперсия которой неизвестка, стандартное распределение выборочных средних — t-распределение, где:
t * -£, *~И
»/ V(n - 1) о/ <п
t-распределение является симметричным относительно генеральной средней ц, но в отличие от нормального t-распределения форма t-распределения зависит от п, т.е. от объема выборки. Когда п мало, t-распределение является более пологим по сравнению с z-распределением. По мере того, как возрастает объем выборки, t-распределение приближается к стандартному нормальному распределению; следовательно, нормальное распределение можно использовать в качестве приближения t-распределения для выборки большого объема. Размер выборки считается большим, если п £ 30.
Зависимость t-распределения от объема выборки не является однозначной. В действительности t-распределение варьирует с изменением числа степеней свободы для каждого конкретного случая. Например, если мы имеем дело со средней единственной выборки размером п, число степеней свободы будет равно (и - 1), но если мы рассматриваем средние двух выборок, которые имеют размеры nt и nj, то число степеней свободы будет равно (nj + nj - 2).
Понятие числа степеней свободы может быть проиллюстрировано с помощью следующего простого примера. Если мы вычисляем среднюю из пяти чисел, то при этом мы свободны в выборе четырех из них, но значение пятого числа предопределено величиной данной средней. Например, если средняя из пяти чисел равна 6, мы можем выбрать 2, 7, 9 и 3 в качестве первых четырех чисел. Пятое число у является определенным, потому что средняя равна: 6 = (2+ 7 + 9 + 3 + у/5) = (21 + у/5), т.е. у должно быть равно 9. У нас нет свободы выбора последнего значения и поэтому мы имеем четыре степени свободы.
Если значения величины t рассчитаны, то могут использоваться стандартные выроятностные таблицы (t-таблицы), которые используются так же, как таблицы стандартного нормального распределения. Однако поскольку таблицы t-распределения должны содержать значения числа степеней свободы так же, как и различные значения t, то необходимо соединить всю необходимую информацию. Фактически эти таблицы организованы обычно таким образом, чтобы значения t были связаны с конкретными вероятностями для различных степеней свободы. (см. таблицу в Приложении 2). Использование таких таблиц будет более детально поясняться в гл. 5.