138 Ч. 2. Анализ данных как составная часть принятия решений
значении генеральной совокупности ц, из которой была взята выборка. На 95% мы уверены, что наше единственное значение х лежит между Xj и х2 • Если х действительно попадает в интервал между х\ и х2, то тогда ц должно находиться где-нибудь в пределе:
x±t,96SEj.
Мы можем сказать, что уверены в этом на 95%. Следовательно, х ± 1,96 • SE^ является доверительным интервалом для среднего значения генеральной совокупности с вероятностью 95%. Если, например, х точно равно х\, то ц находится правее точки х\. Если х меньше xt, то ц не лежит в доверительном интервале. В этом случае мы выбрали одну из 5% выборочных совокупностей, для которой вывод, сделанный выше, неверен. Мы ограничились 95% выборочного распределения. Это был совершенно субъективный выбор. Может быть использован любой размер интервала и любая степень уверенности, что мы в нее попадем в зависимости от того, насколько мы хотим быть уверены, что среднее значение генеральной совокупности лежит внутри указанного интервала. Типичными являются 90%, 95% или 99%-ный доверительные интервалы. Какую бы величину мы не выбрали, построение доверительного интервала остается тем же. Единственная разница возникает в значении стандартизованной нормальной переменной г. Следовательно, общая формула доверительного интервала для генеральной средней имеет вид:
х ± ^ж /2 * SEx >
где za /2 — величина стандартизованной нормальной переменной, выше которой
лежит (а/2)100% значений. Это дает (1 - а)100% доверительный интервал.
Например, если нам требуется найти доверительный интервал с вероятностью 95%, то тогда a = 0,05 и доверительный интервал может быть записан как:
* * *0.025 ' SEx •
Если известно стандартное отклонение генеральной совокупности то, тогда стандартная ошибка распределения выборочных средних находится по формуле:
S Е; = O/Vn,
и (1 - a)100% доверительный интервал для генеральной средней может быть записан как:
a Пример 5.1. Импортер упаковывает чай в пакеты по 125 г. Известно, что наполняющая машина работает со стандартным отклонением а, равным 10 г. Выборка 50 пакетов п показала средний вес х = 128,5 г.
Гл. 5. Статистический вывод 1
Найти доверительный интервал для среднего веса а в генеральной совокупности с вероятностью 95%. Предположим, что пакеты чая распределены по весу.
Решение.
Доверительный интервал с вероятностью 95% для среднего значения генеральной совокупности находится по формуле:
х±1,96 JL,
где 1,96 является числом стандартных ошибок выше и ниже среднего значения для интервала, включающего 95% нормального распределения. Следовательно, доверительный интервал для генеральной средней находится как:
128,5 ± 1,96 х ^ - 128,5 ± 2,77 г.
Мы на 95% уверены, что средний вес пачки чая в генеральной совокупности ц находится между двумя значениями: 125,73 г. и 131,27 г. Интервал в ± 2,77 г составляет примерно ± 2% среднего веса пачки чая в выборке, который равен 128,5 г. Это не очень большое отклонение для данного примера. Следовательно, среднее значение выборки может считаться надежной оценкой среднего значения генеральной совокупности. Однако необходимо помнить, что в 5% случаев мы можем ошибиться и получить значение вне доверительного интервала.
О Пример 5.2. Машина, которая упаковывает сахар, долгое время обеспечивала нормальное распределение веса в наполняемых пакетах. Стандартное отклонение веса а равнялось ± 2,5 г. Был установлен новый размер упаковок. Для контроля была проведена случайная выборка 20 новых пакетов. Средний вес пакетов в выборке х ш 1002 г. Предполагая, что переход на новую упаковку не повлиял на колебаемость наполняемости пакетов, найдем доверительный интервал для среднего веса упаковки в генеральной совокупности с вероятностью 99%.
Решение
Доверительный интервал для генеральной средней с вероятностью 99% находится следующим образом:
х ± 2,576 -т-,
где 2,576 - г — число стандартных ошибок выше и ниже среднего значения соответствует интервалу, который включает 99% нормального распределения. Тогда доверительный интервал с вероятностью 99% составит:
1002 ± 2,576 х т*= - 1002 ± 1,44 г.
Мы на 99% уверены, что средний вес упаковки сахара ц генеральной совокупности находится в пределах от 1000,56 г до 1003,44 г. Размах в ±1,44 г составляет примерно ±0,1% среднего значения наполняемости в выборке (1002). 0,1% колеблемости в весе упаковки невелико, следовательно, среднее значение выборки
140 Ч. 2. Анализ данных как составная часть принятия решений
может считаться точной оценкой среднего значения генеральной совокупности. Следовательно, мы можем ошибиться в одном из 100 случаев и ц может оказаться вне доверительного интервала.