Оценка стандартной ошибки выборочного распределения выборочных средних

В 4.4.1 стандартная ошибка'выборочного распределения выборочных средних при больших совокупностях определялась как:


SE;


Л^.


Чтобы получить стандартную ошибку из этого выражения, мы должны знать генеральную дисперсию сг. Если нам неизвестна ее величина, то можно использо­вать в качестве ее оценки выражение:

л2 n s

а ш.

(п-1)

Следовательно, наилучшей оценкой стандартной ошибки является:

^_VE35.>czz. где г-%£^-

(п-1) (п-1) п

Или

Л л/в7 а Л2 Х(*-*)2

SE5=\ — --f=, где в*т— -------------- —— •

п V п (п-1)


Гл. 4. Выборка и выборочные распределения 129

4.4.4. Стандартные выборочные распределения — z, t, %2, F

Имеются четыре стандартных распределения, к которым мы будем часто обра­щаться в последующих главах. Это нормальное распределение (z), t, x и F распределения. В этом разделе будут рассмотрены основные особенности каждого из этих распределений в связи с их использованием для проведения статистичес­кого вывода.

СТАНДАРТНОЕ НОРМАЛЬНОЕ (z) РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНЫХ СРЕДНИХ

В разделе 2.7 мы рассматривали нормальное распределение. Было показано, как можно преобразовать любое нормальное распределение в стандартное нормальное распределение, для которого среднее значение д = 0 и дисперсия а = 1. Значения переменной для такого стандартного нормального распределения обозначаются z и определяются как:

а

Рассчитанные таким образом значения z используются для нахождения требу­емых вероятностей по таблице стандартного нормального распределения.

Выборочное распределение выборочных средних является нормальным распреде­лением, если выборки получены как простые случайные из нормальной совокуп­ности. Такое распределение описывается теми же характеристиками, что и любое нормальное наблюдение, только лить следует иметь в виду, что z в этом случае:

z = ^

ввиду того, что выборочное распределение выборочных средних является распре­делением значений х (а не х), для которых средняя есть ц, а стандартное' отклонение или стандартная ошибка обозначается как SEj. Значение z измеряется

числом стандартных ошибок, которые отделяют выборочную среднюю от гене­ральной средней.

Ввиду того, что SEj = o/V~n для больших совокупностей, z может быть выражено как:

а/^Гп

Чтобы использовать это равенство, мы должны знать генеральную дисперсию (а). Если мы не знаем <г, то мы оцениваем ее, используя ее выборочную дисперсию:

л2 ns2 а ' (п - 1)"


130 Ч. 2. Анализ данных как составная часть принятия решений

Стандартизованная переменная в этом случае запишется как:

X - Ц

Z * *А.

O/ViT

но ее распределение не всегда нормально. Стандартное нормальное (z) распреде­ление может заменяться t-распределением.

t-РАСПРЕДЕЛЕНИЕ ДЛЯ ВЫБОРОЧНЫХ СРЕДНИХ

Если простая случайная выборка произведена из нормальной совокупности, дис­персия которой неизвестка, стандартное распределение выборочных средних — t-распределение, где:

t * , *~И

»/ V(n - 1) о/ <п

t-распределение является симметричным относительно генеральной средней ц, но в отличие от нормального t-распределения форма t-распределения зависит от п, т.е. от объема выборки. Когда п мало, t-распределение является более пологим по сравнению с z-распределением. По мере того, как возрастает объем выборки, t-распределение приближается к стандартному нормальному распределению; сле­довательно, нормальное распределение можно использовать в качестве приближе­ния t-распределения для выборки большого объема. Размер выборки считается большим, если п £ 30.

Зависимость t-распределения от объема выборки не является однозначной. В действительности t-распределение варьирует с изменением числа степеней свободы для каждого конкретного случая. Например, если мы имеем дело со средней единственной выборки размером п, число степеней свободы будет равно (и - 1), но если мы рассматриваем средние двух выборок, которые имеют размеры nt и nj, то число степеней свободы будет равно (nj + nj - 2).

Понятие числа степеней свободы может быть проиллюстрировано с помощью следующего простого примера. Если мы вычисляем среднюю из пяти чисел, то при этом мы свободны в выборе четырех из них, но значение пятого числа предопре­делено величиной данной средней. Например, если средняя из пяти чисел равна 6, мы можем выбрать 2, 7, 9 и 3 в качестве первых четырех чисел. Пятое число у является определенным, потому что средняя равна: 6 = (2+ 7 + 9 + 3 + у/5) = (21 + у/5), т.е. у должно быть равно 9. У нас нет свободы выбора последнего значения и поэтому мы имеем четыре степени свободы.

Если значения величины t рассчитаны, то могут использоваться стандартные выроятностные таблицы (t-таблицы), которые используются так же, как таблицы стандартного нормального распределения. Однако поскольку таблицы t-распреде­ления должны содержать значения числа степеней свободы так же, как и различные значения t, то необходимо соединить всю необходимую информацию. Фактически эти таблицы организованы обычно таким образом, чтобы значения t были связаны с конкретными вероятностями для различных степеней свободы. (см. таблицу в Приложении 2). Использование таких таблиц будет более детально поясняться в гл. 5.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: