Схема Бернулли

Опыты называются независимыми, если вероятность того или иного исхода каждого опыта не зависит от того, какие исходы имели другие опыты.

Замечание. Независимые опыты могут производиться как в одинаковых условиях, так и в различных. В первом случае вероятность появления какого-то события А во всех опытах одна и та же, во втором случае она меняется от опыта к опыту.

Пусть теперь производится n независимых опытов, в каждом из которых с одной и той же вероятностью p может наступить некоторое событие А. Требуется найти вероятность Рn(к) того, что в n опытах событие А наступит ровно к раз (событие В).

Описанная схема называется схемой независимых испытаний, или схемой Бернулли, по имени швейцарского математика конца XVII и начала XVIII века Якоба Бернулли, изучавшего её.

Найдем вероятность Рn(к). Событие В можно представить в виде суммы ряда элементарных событий – вариантов события А. Каждый вариант события А можно записать в виде строки длиной n (число опытов), в которой к компонент соответствуют событию А, а остальные n-к компонент событию . Например, один из возможных вариантов есть

(успех и 1,2,…, k -м опытах и неудача в остальных).

Число всех вариантов равно (числу сочетаний из n элементов по к), а вероятность каждого варианта в виду независимости опытов равна ркqn (где q =1- р). Отсюда вероятность события В будет равна

. (1)

Формула (1) носит название формулы Бернулли.

Отсюда следует, что вероятность, хотя бы одного появления события А при n независимых испытаниях (опытах) в одинаковых условиях равна

(2)

Пример 1. Монета бросается 5 раз. Какова вероятность того, что герб выпадет при этом 3 раза?

Решение. В данном случае событием А считается выпадение герба, вероятность p этого события в каждом опыте равна . Отсюда

P = .

Для наглядности условимся каждое наступление события А рассматривать как успех. Если зафиксировать n, то, Рn(к). есть функция аргумента к, принимающая значения . Выясним, при каком значении к функция Рn(к) принимает наибольшее значение, т.е., какое число успехов к 0 является наиболее вероятным при данном числе опытов n. Оказывается что число к=к 0 можно определить из двойного неравенства.

(3)

Разность граничных значений в этом двойном неравенстве равна 1. Если np+p не является целым числом, то двойное неравенство определяет лишь одно наивероятнейшее значение к 0.Если же np+p – целое число, то имеются два наивероятнейших значения: и .

Пример 2. Игральную кость бросают 20 раз. Каково наиболее вероятное число выпадений грани «6»?

Решение. В данном случае n = 20, откуда . Поскольку nр + р не целое число, то наибольшим среди чисел Р 20(0), Р 20(1),…, Р 20(20) будет число Р 20(3). Следовательно, наиболее вероятное число выпадений грани «6» будет 3. Найдём, чему равна вероятность такого числа выпадений. По формуле Бернулли имеет:

.

Из формулы (3) видно, что одно из двух ближайших к целых чисел является наиболее вероятным числом успехов.

Оказывается, число допускает и другую интерпретацию. А именно: можно рассматривать, в определенном смысле, как среднее число успехов в n опытах. Будем исходить из частотного истолкования вероятности. Назовем (для краткости) n - кратное повторение данного опыта серией. Пусть мы произвели N серий. Пусть в первой серии было получено к 1 успехов, во второй – к 2, ….., в N -ой – кN. Составим среднее арифметическое этих чисел

. (4)

Равенство (4) - есть среднее число успехов в N сериях. Оказывается, что с увеличением N указанное среднее арифметическое приближается к некоторому постоянному значению, а именно к числу np.

Действительно запишем (4) в виде:

. (5)

Поскольку каждая серия состоит из n опытов, то производя N серий мы осуществляем данный опыт раз.

Написанная дробь (5) со знаменателем Nn есть нечто иное как отношение общего числа успехов в этих опытах к числу всех опытов. С увеличением N (а значит, и Nn) эта дробь будет приближаться к числу р - вероятности успеха. Следовательно, число (4) будет приближаться к рn, что и требовалось получить.

Пример 3. Станок штампует изделия. Вероятность р брака одного изделия равна 0,05. Чему равно среднее число бракованных изделий на сотню?

Решение. Искомое число бракованных изделий равно: .

Замечание 1. Можно рассмотреть более общую схему независимых испытаний. Рассмотрим n независимых испытаний (в различных условиях), причём вероятность события А («успеха») в i -ом опыте равна pi, a qi =1- pi – вероятность неуспеха в i -м испытании (i =1,2,…, n). Тогда можно показать, что вероятность Pn(к) того, что событие А появится в этих n опытах ровно к раз, равна коэффициенту при zk в разложении по степеням z функции

. (6)

Такую схему независимых испытаний называют схемой Пуассона. Схема Пуассона при pi=p превращается в схему Бернулли. Вероятности Pn(к) в схеме Пуассона не записываются в компактном виде аналогичной формуле(1). Из (6), например, следует:

Замечание 2. Схемы Бернулли и Пуассона допускают обобщение на тот случай, когда в результате каждого опыта возможные не два исхода (А или ), а несколько исходов.

Если производится n независимых опытов (схема Бернулли) причём каждый опыт может иметь к исключающих друг друга исходов , с вероятностями , то вероятность того, что в m 1 опытах появится событие А 1, в m 2 опытах событие А 2 и т.д., в mk опытах событие Ак выражается формулой

(7)

Если условия опыта различны (схема Пуассона), т.е.

в i- омопыте событие Aj имеет вероятность pji (i =1,2,…, n; j =1,2,…, k), то вероятность вычисляется как коэффициент при члене в разложении по степеням функции:

(8)

Пример 4. Завод изготавливает изделия, каждое из которых подвергается четырём видам испытаний. Первое испытание изделия проходит благополучно с вероятностью 0,9; второе с вероятностью 0,95; третье-0,8 и четвертое-0,85. Найти вероятность того, что изделие пройдет благополучно:

A- все четыре испытания

B- ровно два испытания (из четырех)

C- не менее двух испытании (из четырех)

Решение. В условиях задачи проводятся четыре независимых опыта (испытания) в различных условиях. Вероятность события. А – испытание прошло благополучно, в каждом опыте разное. Искомые вероятности находим из формулы (6)

Отсюда получаем:

§12. Вероятности Pn(к) при больших значениях n. Приближённые формулы Лапласа и Пуассона.

В приложениях часто возникает необходимость в вычислении вероятностей Рn(к) для весьма больших значений n и k. Рассмотрим, например, такую задачу.

Задача. На некотором предприятии вероятность брака, равна 0,02. Обследуются 500 изделий готовой продукции. Найти вероятность того, что среди них окажется ровно 10 бракованных.

Рассматривая обследование каждого изделия как отдельный опыт, можно сказать, что производиться 500 независимых опытов, причем в каждом их них событие А (изделие оказалось бракованным) наступает с вероятностью 0,02, тогда по формуле Бернулли получаем

.

Непосредственный подсчет этого выражения представляется сложным. Ещё большую трудность пришлось бы испытать, если бы мы искали вероятность того, что число бракованных изделий среди 500 окажется в пределах, скажем, от 10 до 20. В этом случае потребовалось бы вычислить сумму , что является более сложным делом.

Задачи подобного рода встречаются в приложениях весьма часто. Поэтому возникает необходимость в отыскании приближённых формул для вероятностей Рn(к), а также для сумм вида

(1)

при больших n.

1. Приближённые формулы Лапласа. Их используют при больших n (порядка сотен или тысяч), вероятностей p или q не слишком близким к 0 или 1 (порядка сотых долей). Обычно условием применения этих приближений является условие npq >9.

а) Локальная приближённая формула Лапласа. При больших n справедливо равенство.

, (2)

где , а φ (х) обозначает следующую функцию: .

Заметим, что функция φ(х) табулирована, т.е. для нее составлена таблица её значений.

Вторая приближённая формула Лапласа даёт приближённые значения для величины -вероятности того, что число наступлений события А в n опытах (число «успехов») окажется заключенным между заданными границами к 1 и к 2.

б) Интегральная приближённая формула Лапласа. При больших n справедливо приближённое равенство

, (3)

где Φ(х) обозначает следующую функцию

. (4)

Функция Φ(х) обладает следующими полезными для вычисления свойствами:

1. Φ(х) – нечётная функция: ,

2. при возрастании х от 0 до ∞ функция Φ(х) растет от 0

до 0,5, причем уже при х = 5 значение функции Φ(х)

отличается от 0,5 меньше чем на (т.е. при функция Ф(x) практически равна 0,5).

Пример 1. Монету бросают 100 раз. Какова вероятность того, что герб выпадет ровно 50 раз?

Решение. Имеем: npq = 100· · = 25>9. Воспользовавшись приближённой формулой (2), получим. . Из таблицы для функции φ(x) найдем, что φ(0) = 0,3989…. Отсюда получаем .

Пример 2. Доведём до конца решение задачи, приведённой в начале этого параграфа. В ней требовалось найти , а также вероятность P 500(10≤ к ≤20).

Решение. В данном случае npq = 500·0,02·0,98=9,8. Воспользовавшись приближёнными формулами (2) и (3), получим: ,

Замечание. Если мы осуществляем опыт n раз и k - число наступлений события А при этом, то, вообще говоря, дробь -относительная частота наступления события

А – будет близка к р (вероятности события А). Однако сколь тесной окажется эта близость, предугадать невозможно.

Интегральная теорема Лапласа позволяет оценить вероятность неравенства при достаточно больших n и значениях р не слишком близких к 0 или 1, т.е. определить вероятность того, что отклонение частоты случайного события от его вероятности р по абсолютной величине не превосходит некоторого . Имеем

Таким образом, получаем

(5)

Вероятность в этом случае называют надёжностью оценки , а сама оценка доверительной оценкой частоты с надёжностью .

На практике надёжность оценки задаётся заранее. Тогда по заданной надёжности можно найти соответствующее значение из уравнения с помощью таблиц функции Лапласа. В этом случае доверительная оценка с заданной надёжностью примет вид

, где (6)

( найдено из уравнения смотри (5)).

Это неравенство означает, что частота с заданной надёжностью должна лежать в интервале (p-ε, p+ε). Этот интервал называется доверительным интервалом.

Пример 3. Какова вероятность того, что в 10 000 независимых испытаниях частота наступления события будет иметь отклонение от его вероятности p =0,36 не более чем на 0,01?

Решение. Искомая вероятность вычисляется по формуле (5). Здесь n =10000, р=0,36, q =0,64, ε=0,01, тогда

.

Отсюда получаем:

.

Пример 4. Вероятность приёма некоторого сигнала равна р = 0,72. Определить, какое должно быть общее количество принятых сигналов, чтобы частота приёма этого сигнала отличалась от вероятности его приёма не более чем на ε =0,1 с надежностью = 0,95.

Решение: Воспользуемся формулой(5).

У нас р =0,72, q =0,28, По таблице для

находим, что Значит t=1,96. Тогда из выражения находим n: ,

откуда n ≈76,8. Так как n должно быть целым, то общее количество принятых сигналов равно 77.

2. Приближённые формулы Пуассона. Точность приближённых формул Лапласа понижается по мере приближения одного из чисел р или q к нулю, поэтому, в этом случае используют приближённые формулы Пуассона. При больших n (порядка тысяч, десятков тысяч и больше) и малых р (порядка тысячных долей и меньше) справедливы приближённые равенства. Обычно условием применения этих приближений является условие npq <9.

, (7).

, (8)

где λ =np.

Особенностью формул (7) и (8) является то, что для того, чтобы найти вероятность того или иного числа успехов, вовсе не требуется знать n и р. Всё определяется числом λ= np, которое является (см. §11) средним числом успехов.

Для выражения , рассматриваемого как функция двух переменных к и λ, составлены таблицы значений.

Пример 5. Прядильщица обслуживает 1000 веретён. Вероятность обрыва нити на одном веретене в течение одной минуты равна 0,004. Найти вероятность того, что в течение одной минуты обрыв произойдет в пяти веретенах.

Решение. Формула Бернулли приведёт к громоздким вычислениям, поэтому воспользуемся формулой Пуассона (7). Здесь к = 5, р =0.004, n = 1000, тогда λ = np = 4.

Отсюда: .

Пример 6. Книга в 1000 страниц имеет 100 опечаток. Какова вероятность того, что на случайно выбранной странице будет не менее четырёх опечаток (событие В).

Решение: Среднее количество опечаток на одну страницу есть . В данном случае следует применить формулу Пуассона. Тогда вероятность pк иметь к опечаток на одной странице будет равна .

Сумма р = p0+p1+p2+p3 есть вероятность того, что на странице окажется не более трёх опечаток. Пользуясь таблицами (или калькулятором) получаем р = 0,999996 (в данном случае мы пользовались калькулятором, таблицы дадут р =0,9048+0,0905+0,0045+0,0002=1). Вероятность того, что на случайно выбранной странице будет не менее четырёх опечаток, равна 1- р =1-0,999996=0,0000004 (таблицы дадут 1- р =1-1=0). Отсюда можно сделать вывод, что событие В практически невозможно.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: