Матрица переходов и граф состояний

Таким образом, плотность распределения удалось представить в виде произведения двух функций, одна из которых зависит только от х, а другая – только от у. Т.е. случайные величины Х и Y независимы. Разумеется, они также будут и некоррелированы.

3.6 Линейная корреляция

Если две случайные величины Х и Y имеют в отношении друг друга линейные функции регрессии, то говорят, что величины Х и Y связаны линейной корреляционной зависимостью.

Теорема. Если двумерная случайная величина (X, Y) распределена нормально, то Х и Y связаны линейной корреляционной зависимостью.

4 Предельные теоремы теории вероятностей

4.1 Закон больших чисел.

(Чебышев Пафнутий Львович (1821 – 1824) – русский математик)

На практике сложно сказать какое конкретное значение примет случайная величина, однако, при воздействии большого числа различных факторов поведение большого числа случайных величин практически утрачивает случайный характер и становится закономерным.

Этот факт очень важен на практике, т.к. позволяет предвидеть результат опыта при воздействии большого числа случайных факторов.

Однако, это возможно только при выполнении некоторых условий, которые определяются законом больших чисел. К законам больших чисел относятся теоремы Чебышева (наиболее общий случай) и теорема Бернулли (простейший случай), которые будут рассмотрены далее.

Рассмотрим дискретную случайную величину Х (хотя все сказанное ниже будет справедливо и для непрерывных случайных величин), заданную таблицей распределения:

X x1 x2 xn
p p1 p2 pn

Требуется определить вероятность того, что отклонение значения случайной величины от ее математического ожидания будет не больше, чем заданное число e.

Теорема. (Неравенство Чебышева) Вероятность того, что отклонение случайной величины Х от ее математического ожидания по абсолютной величине меньше положительного числа e, не меньше чем .

Доказательство этой теоремы приводить не будем, оно имеется в литературе.

4.2 Теорема Чебышева

Теорема. Если Х1, Х2, …, Хn- попарно независимые случайные величины, причем дисперсии их равномерно ограничены (не превышаю постоянного числа С), то, как бы мало не было положительное число e, вероятность неравенства

будет сколь угодно близка к единице, если число случайных величин достаточно велико.

Т.е. можно записать:

Часто бывает, что случайные величины имеют одно и то же математическое ожидание. В этом случае теорема Чебышева несколько упрощается:

Дробь, входящая в записанное выше выражение есть не что иное как среднее арифметическое возможных значений случайной величины.

Теорема утверждает, что хотя каждое отдельное значение случайной величины может достаточно сильно отличаться от своего математического ожидания, но среднее арифметическое этих значений будет неограниченно приближаться к среднему арифметическому математических ожиданий.

Отклоняясь от математического ожидания как в положительную так и в отрицательную сторону, от своего математического ожидания, в среднем арифметическом отклонения взаимно сокращаются.

Таким образом, величина среднего арифметического значений случайной величины уже теряет характер случайности.

4.3 Теорема Бернулли

Пусть производится п независимых испытаний, в каждом из которых вероятность появления события А равно р.

Возможно определить примерно относительную частоту появления события А.

Теорема. Если в каждом из п независимых испытаний вероятность р появления события А постоянно, то сколь угодно близка к единице вероятность того, что отклонение относительной частоты от вероятности р по абсолютной величине будет сколь угодно малым, если число испытаний р достаточно велико.

Здесь т – число появлений события А. Из всего сказанного выше не следует, что с увеличением число испытаний относительная частота неуклонно стремится к вероятности р, т.е. . В теореме имеется в виду только вероятность приближения относительной частоты к вероятности появления события А в каждом испытании.

В случае, если вероятности появления события А в каждом опыте различны, то справедлива следующая теорема, известная как теорема Пуассона.

Теорема. Если производится п независимых опытов и вероятность появления события А в каждом опыте равна рi, то при увеличении п частота события А сходится по вероятности к среднему арифметическому вероятностей рi.

4.4 Характеристические функции

При доказательстве этой теоремы Ляпуновым использовались так называемые характеристические функции.

Определение. Характеристической функцией случайной величины Х называется функция

эта функция представляет собой математическое ожидание некоторой комплексной случайной величины , являющейся функцией от случайной величины Х. При решении многих задач удобнее пользоваться характеристическими функциями, а не законами распределения.

Зная закон распределения, можно найти характеристическую функцию по формуле (для непрерывных случайных величин):

Как видим, данная формула представляет собой не что иное, как преобразование Фурье для функции плотности распределения. Очевидно, что с помощью обратного преобразования Фурье можно по характеристической функции найти закон распределения.

Введение характеристических функций позволяет упростить операции с числовыми характеристиками случайных величин.

В случае нормального распределения характеристическая функция имеет вид:

Сформулируем некоторые свойства характеристических функций:

1) Если случайные величины Х и Y связаны соотношением

где а – неслучайный множитель, то

2) Характеристическая функция суммы независимых случайных величин равна произведению характеристических функций слагаемых.

Случайные величины Xi, рассмотренные в центральной предельной теореме, могут обладать произвольными распределениями вероятностей.

Если все эти случайные величины одинаково распределены, дискретны и принимают только два возможных значения 0 или 1, то получается простейший случай центральной предельной теоремы, известный как теорема Муавра – Лапласа.

Теорема. (Теорема Муавра – Лапласа) Если производится п независимых опытов, в каждом из которых событие А появляется с вероятностью р, то для любого интервала (a, b) справедливо соотношение:

где Y – число появлений события А в п опытах, q = 1 – p, Ф(х) – функция Лапласа, - нормированная функция Лапласа.

Теорема Муавра – Лапласа описывает поведение биноминального распределения при больших значениях п.

Данная теорема позволяет существенно упростить вычисление по формуле биноминального распределения.

Расчет вероятности попадания значения случайной величины в заданный интервал при больших значениях п крайне затруднителен. Гораздо проще воспользоваться формулой:

Теорема Муавра – Лапласа очень широко применяется при решении практических задач.

Пример. Вероятность наступления события А в каждом испытании равна 0,3. Используя неравенство Чебышева, оценить вероятность того, что в 10000 испытаниях отклонение относительной частоты появления события А от его вероятности не превзойдет по абсолютной величине 0,01.

В соответствии с неравенством Чебышева вероятность того, что отклонение случайной величины от ее математического ожидания будет меньше некоторого числа e, ограничена в соответствии с неравенством .

Надо определить математическое ожидание и дисперсию числа появления события А при одном опыте. Для события А случайная величина может принимать одно из двух значений: 1- событие появилось, 0- событие не появилось. При этом вероятность значения 1 равна вероятности р =0,3, а вероятность значения 0- равна вероятности ненаступления события А

q=1 – p =0,7.

По определению математического ожидания имеем:

Дисперсия:

В случае п независимых испытаний получаем Эти формулы уже упоминались выше.

В нашем случае получаем:

Вероятность отклонения относительной частоты появления события А в п испытаниях от вероятности на величину, не превышающую e=0,01 равна:

Выражение полученное в результате этих простых преобразований представляет собой не что иное, как вероятность отклонения числа т появления события А от математического ожидания на величину не большую, чем d=100.

В соответствии с неравенством Чебышева эта вероятность будет не меньше, чем величина

Пример. Сколько следует проверить деталей, чтобы с вероятностью, не меньшей 0,96, можно было ожидать, что абсолютная величина отклонения относительной частоты годных деталей от вероятности детали быть годной, равной 0,98, не превысит 0,02.

Условие задачи фактически означает, что выполняется неравенство:

Здесь п - число годных деталей, т - число проверенных деталей. Для применения неравенства Чебышева преобразуем полученное выражение:

После домножения выражения, стоящего в скобках, на т получаем вероятность отклонения по модулю количества годных деталей от своего математического ожидания, следовательно, можно применить неравенство Чебышева, т.е. эта вероятность должна быть не меньше, чем величина , а по условию задачи еще и не меньше, чем 0,96.

Таким образом, получаем неравенство . Как уже говорилось в предыдущей задаче, дисперсия может быть найдена по формуле .

Итого, получаем:

Т.е. для выполнения требуемых условий необходимо не менее 1225 деталей.

Пример. Суточная потребность электроэнергии в населенном пункте является случайной величиной, математическое ожидание которой равно 3000 кВт/час, а дисперсия составляет 2500. Оценить вероятность того, что в ближайшие сутки расход электроэнергии в этом населенном пункте будет от 2500 до 3500 кВт/час.

Требуется найти вероятность попадания случайной величины в заданный интервал:

Крайние значения интервала отклоняются от математического ожидания на одну и ту же величину, а именно – на 500. Тогда можно записать с учетом неравенства Чебышева:

Отсюда получаем:

Т.е. искомая вероятность будет не меньше, чем 0,99.

Пример. Среднее квадратическое отклонение каждой из 2500 независимых случайных величин не превосходит 3. Оценить вероятность того, что абсолютная величина отклонения среднего арифметического этих случайных величин от среднего арифметического их математических ожиданий не превосходит 0,3.

Требуется найти вероятность

Неравенство Чебышева в случае суммы случайных величин имеет вид:

Если среднее квадратическое отклонение не превосходит 3, то, очевидно, дисперсия не превосходит 9. Величина e по условию задачи равна 0,3.

Тогда . Отсюда получаем при n= 2500:

Пример. Выборочным путем требуется определить среднюю длину изготавливаемых деталей. Сколько нужно исследовать деталей, чтобы с вероятностью, большей чем 0,9, можно было утверждать, что средняя длина отобранных изделий будет отличаться от математического ожидания этого среднего (средняя длина деталей всей партии) не более, чем на 0,001 см.? Установлено, что среднее квадратическое отклонение длины детали не превышает 0,04 см.

По условию если среднее квадратическое отклонение не превышает 0,04, то дисперсия, очевидно, не превышает (0,04)2. Также по условию задано, что

Если преобразовать соотношение, стоящее в скобках и после этого применить неравенство Чебышева, получаем:

Т.е. для достижения требуемой вероятности необходимо отобрать более 16000 деталей.

Описанный подход, как видно, позволяет решить множество чисто практических задач.

Пример. Вероятность того, что наудачу выбранная деталь окажется бракованной, при каждой проверке одна и та же и равна 0,2. Определить вероятность того, что среди 50 наугад выбранных деталей бракованных окажется не менее 6.

Для того, чтобы воспользоваться теоремой Муавра – Лапласа найдем математическое ожидание и дисперсию количества бракованных деталей в 50 – ти отобранных:

Фактически в задаче требуется определить вероятность того, что бракованных деталей будет не менее шести, но и, очевидно, не более 50- ти.

Значения функции Лапласа находятся по таблице. Конечно, значения функции Лапласа Ф(10) в таблице нет, но т.к. в таблицах указано, что Ф(3)=1,0000, то все значения от величин, превышающих 3 также равны 1. Дополнительно см. Функция Лапласа.

Пример. Известно, что 60% всего числа изготавливаемых заводом изделий являются изделиями первого сорта. Приемщик берет первые попавшиеся 200 изделий. Чему равна вероятность того, что среди них окажется из от 120 до 150 изделий первого сорта?

Вероятность того, что деталь окажется первого сорта, равна, очевидно, 0,6.

Математическое ожидание числа изделий первого сорта равно:

По теореме Муавра – Лапласа получаем:

Пример. Проверкой установлено, что 96% изделий служат не меньше гарантируемого срока. Наугад выбирают 15000 изделий. Найти вероятность того, что со сроком службы менее гарантируемого будет от 570 до 630 изделий.

Вероятность того, что срок службы изделия будет менее гарантированного равна:

1 – 0,96 = 0,04

Математическое ожидание числа таких изделий равно

По теореме Муавра – Лапласа получаем:

4.5 Цепи Маркова

(Андрей Андреевич Марков (1856-1922) – русский математик, академик)

Определение. Процесс, протекающий в физической системе, называется Марковским, если в любой момент времени вероятность любого состояния системы в будущем зависит только от состояния системы в текущий момент и не зависит от того, каким образом система пришла в это состояние.

Определение. Цепью Маркова называется последовательность испытаний, в каждом из которых появляется только одно из k несовместных событий Ai из полной группы. При этом условная вероятность pij(s) того, что в s –м испытании наступит событие Aj при условии, что в (s – 1) – м испытании наступило событие Ai, не зависит от результатов предшествующих испытаний.

Независимые испытания являются частным случаем цепи Маркова. События называются состояниями системы, а испытания – изменениями состояний системы.

По характеру изменений состояний цепи Маркова можно разделить на две группы.

Определение. Цепью Маркова с дискретным временем называется цепь, изменение состояний которой происходит в определенные фиксированные моменты времени. Цепью Маркова с непрерывным временем называется цепь, изменение состояний которой возможно в любые случайные моменты времени.

Определение. Однородной называется цепь Маркова, если условная вероятность pij перехода системы из состояния I в состояние j не зависит от номера испытания. Вероятность pij называется переходной вероятностью.

Допустим, число состояний конечно и равно k.

Тогда матрица, составленная из условных вероятностей перехода будет иметь вид:

Эта матрица называется матрицей перехода системы.

Т.к. в каждой строке содержаться вероятности событий, которые образуют полную группу, то, очевидно, что сумма элементов каждой строки матрицы равна единице.

Пусть Pij(n) – вероятность того, что в результате n испытаний система перейдет из состояния I в состояние j, r – некоторое промежуточное состояние между состояниями I и j. Вероятности перехода из одного состояния в другое pij(1) = pij.

Тогда вероятность Pij(n) может быть найдена по формуле, называемой равенством Маркова:

Здесь т – число шагов (испытаний), за которое система перешла из состояния I в состояние r.

В принципе, равенство Маркова есть ни что иное как несколько видоизменная формула полной вероятности.

Зная переходные вероятности (т.е. зная матрицу перехода Р1), можно найти вероятности перехода из состояния в состояние за два шага Pij(2), т.е. матрицу Р2, зная ее – найти матрицу Р3, и т.д.

Непосредственное применений полученной выше формулы не очень удобно, поэтому, можно воспользоваться приемами матричного исчисления (ведь эта формула по сути – не что иное как формула перемножения двух матриц).

Тогда в общем виде можно записать:

Вообще то этот факт обычно формулируется в виде теоремы, однако, ее доказательство достаточно простое, поэтому приводить его не буду.

Пример. Задана матрица переходов Р1. Найти матрицу Р3.

Определение. Матрицы, суммы элементов всех строк которых равны единице, называются стохастическими. Если при некотором п все элементы матрицы Рп не равны нулю, то такая матрица переходов называется регулярной.

Другими словами, регулярные матрицы переходов задают цепь Маркова, в которой каждое состояние может быть достигнуто через п шагов из любого состояния. Такие цепи Маркова также называются регулярными.

Теорема. (теорема о предельных вероятностях) Пусть дана регулярная цепь Маркова с п состояниями и Р – ее матрица вероятностей перехода. Тогда существует предел и матрица Р(¥) имеет вид:

Т.е. матрица состоит из одинаковых строк.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: