Обычно мы проводим всего одну выборку из генеральной совокупности; рассчитываем среднее значение выборки х и используем его для вывода о среднем


138 Ч. 2. Анализ данных как составная часть принятия решений

значении генеральной совокупности ц, из которой была взята выборка. На 95% мы уверены, что наше единственное значение х лежит между Xj и х2 • Если х действительно попадает в интервал между х\ и х2, то тогда ц должно находиться где-нибудь в пределе:

x±t,96SEj.

Мы можем сказать, что уверены в этом на 95%. Следовательно, х ± 1,96 • SE^ является доверительным интервалом для среднего значения генеральной совокуп­ности с вероятностью 95%. Если, например, х точно равно х\, то ц находится правее точки х\. Если х меньше xt, то ц не лежит в доверительном интервале. В этом случае мы выбрали одну из 5% выборочных совокупностей, для которой вывод, сделанный выше, неверен. Мы ограничились 95% выборочного распределе­ния. Это был совершенно субъективный выбор. Может быть использован любой размер интервала и любая степень уверенности, что мы в нее попадем в зависимос­ти от того, насколько мы хотим быть уверены, что среднее значение генеральной совокупности лежит внутри указанного интервала. Типичными являются 90%, 95% или 99%-ный доверительные интервалы. Какую бы величину мы не выбрали, построение доверительного интервала остается тем же. Единственная разница возникает в значении стандартизованной нормальной переменной г. Следователь­но, общая формула доверительного интервала для генеральной средней имеет вид:

х ± ^ж /2 * SEx >

где za /2 — величина стандартизованной нормальной переменной, выше которой

лежит (а/2)100% значений. Это дает (1 - а)100% доверительный интервал.

Например, если нам требуется найти доверительный интервал с вероятностью 95%, то тогда a = 0,05 и доверительный интервал может быть записан как:

* * *0.025 ' SEx •

Если известно стандартное отклонение генеральной совокупности то, тогда стандартная ошибка распределения выборочных средних находится по формуле:

S Е; = O/Vn,

и (1 - a)100% доверительный интервал для генеральной средней может быть записан как:

a Пример 5.1. Импортер упаковывает чай в пакеты по 125 г. Известно, что наполняющая машина работает со стандартным отклонением а, равным 10 г. Выборка 50 пакетов п показала средний вес х = 128,5 г.


Гл. 5. Статистический вывод 1



Найти доверительный интервал для среднего веса а в генеральной совокупности с вероятностью 95%. Предположим, что пакеты чая распределены по весу.

Решение.

Доверительный интервал с вероятностью 95% для среднего значения генеральной совокупности находится по формуле:

х±1,96 JL,

где 1,96 является числом стандартных ошибок выше и ниже среднего значения для интервала, включающего 95% нормального распределения. Следовательно, дове­рительный интервал для генеральной средней находится как:

128,5 ± 1,96 х ^ - 128,5 ± 2,77 г.

Мы на 95% уверены, что средний вес пачки чая в генеральной совокупности ц находится между двумя значениями: 125,73 г. и 131,27 г. Интервал в ± 2,77 г составляет примерно ± 2% среднего веса пачки чая в выборке, который равен 128,5 г. Это не очень большое отклонение для данного примера. Следовательно, среднее значение выборки может считаться надежной оценкой среднего значения генеральной совокупности. Однако необходимо помнить, что в 5% случаев мы можем ошибиться и получить значение вне доверительного интервала.

О Пример 5.2. Машина, которая упаковывает сахар, долгое время обеспечивала нормальное распределение веса в наполняемых пакетах. Стандартное отклонение веса а равнялось ± 2,5 г. Был установлен новый размер упаковок. Для контроля была проведена случайная выборка 20 новых пакетов. Средний вес пакетов в выборке х ш 1002 г. Предполагая, что переход на новую упаковку не повлиял на колебаемость наполняемости пакетов, найдем доверительный интервал для среднего веса упаковки в генеральной совокупности с вероятностью 99%.

Решение

Доверительный интервал для генеральной средней с вероятностью 99% находится следующим образом:

х ± 2,576 -т-,

где 2,576 - г — число стандартных ошибок выше и ниже среднего значения соответствует интервалу, который включает 99% нормального распределения. Тогда доверительный интервал с вероятностью 99% составит:

1002 ± 2,576 х т*= - 1002 ± 1,44 г.

Мы на 99% уверены, что средний вес упаковки сахара ц генеральной совокуп­ности находится в пределах от 1000,56 г до 1003,44 г. Размах в ±1,44 г составляет примерно ±0,1% среднего значения наполняемости в выборке (1002). 0,1% колеб­лемости в весе упаковки невелико, следовательно, среднее значение выборки


140 Ч. 2. Анализ данных как составная часть принятия решений

может считаться точной оценкой среднего значения генеральной совокупности. Следовательно, мы можем ошибиться в одном из 100 случаев и ц может оказаться вне доверительного интервала.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: