Свойства нормального распределения

Приведенное уравнение определяет ход кривой линии, имеющей характерную колоколообразную форму, и позволяет вычислить ординаты нормальной кривой, или «плотность вероятности» (p). Вероятность (статистическая, или частость) – численная мера возможного, определяется как отношение числа вариант (исходов испытаний) определенного вида к общему числу вариант (опытов). Поскольку нормальное распределение характерно для непрерывных случайных величин, говорят не о вероятности какого-то определенного значения варианты, но о «плотности вероятности», отражая тем самым плавность изменения вероятности значений для разных значений t, чем ближе к центру распределения, тем плотность вероятности выше.

С помощью представленного выше уравнения можно рассчитать вероятность появления нового значения случайной величины t в интервале той или иной ширины и дать статистическую оценкунайти интервал значений признака, в котором с той или иной вероятностью заключено значение генерального параметра. Формула количественно выражает вполне определенные свойства поведения случайной величины, из которых можно назвать следующие практически важные следствия:

1. Все варианты лежат в интервале плюс-минус беско­нечность. Иными словами, с вероятностью P = 1 (P = 100%) мы вправе ожидать появление новой варианты в пределах от −∞ до +∞. Слева и справа от средней арифметической лежит по 50% вариант (свойство симметрии нормального распределения), т. е. с вероятностью P = 0.5 (50%) можно предска­зать появление новой варианты в интервалах M − ∞ и M + ∞.

2. Между M − 1.96 S и М + 1.96 S лежит 95% вариант. Это позволяет с 95%-ной вероятностью предполагать, что новая варианта окажется в интервале М ± 1.96 S (округленно М ± 2 S – так называемое правило двух стандартных отклонений).

3. С вероятностью P = 0.99 значение новой варианты бу­дет заключено в пределах М ± 2.58S и с вероятностью P = 0.999 – в интервале М ± 3.3 S.

Исходя из сказанного можно оценить вероятность появле­ния новых значений признака. В отношении непрерывных слу­чайных величин (метрических признаков) эта процедура сво­дится к так называемой интервальной оценке. Для полученных ранее характеристик, массы бурозубок, средней M = 9.26 и стандартного отклонения S = 0.79 (г), находим прогнозный интервал: M ± 1.96 S = 9.26 ± 1.53. Новое значение признака с вероятностью P = 0.95 меж­ду 7.68 и 10.82 г. Предсказание веса землероек, конечно, не имеет большого практического значения. Гораздо важнее может быть прогноз численности ценных промысловых видов, сельскохозяйственных вредителей, вспышек болезней, урожая культур­ных растений и т. п.

Важнейшее значение для практического применения имеет «соглашение о 95%». В соответствии с ним совокупности, состоящей из 95% особей (объектов), мы доверяем так же, как и 100%-й. Термин «доверительная вероятность P = 0.95» означает, что, согласно принятому допущению, 95% вариант достаточно полно характеризуют изучаемое явление (в данном случае изменчивость веса землероек), что позволяет ограни­читься рассмотрением вариант в области М ± 1.96 S, охватываю­щей эту 95%-ю совокупность. Так, мы принимаем, что нормальный вес землероек данного вида может изменяться в пределах 7.7–10.8 г, не больше и не меньше. За этими пределами мы обнаруживаем животных иного вида или статуса.

При этом в биометрии обычно довольствуются доверительной вероятностью P = 0.95 (уровень значимости α = 0.05), хотя в наиболее ответственных исследованиях принимают и более строгие уровни – P = 0.99 и P = 0.999. Однако это имеет смысл лишь при очень больших выборках исходных данных, точно описывающих закономерности изменчивости признаков. Обычно же выборки не очень велики, что позволяет ограничиться меньшей степенью доверительной вероятности Р = 0.95.

Уровень значимости – понятие, альтернативное довери­тельной вероятности и, соответственно, его величина составляет разность между единицей и значением доверительной вероятности (α = 1 − P). Для доверительной вероятности 0.95 уро­вень значимости составляет 0.05, а для 0.99 и 0.999 – соответ­ственно 0.01 и 0.001. Уровень значимости, равный 0.05 (5%), можно интерпретировать так: имеется всего 5% шансов, что полученная величина не будет соответствовать изучаемой со­вокупности. Уровень значимости – это тот теоретический про­цент значений нормального распределения, который можно от­бросить, не учитывать, дабы с меньшими усилиями получить основную информацию об изучаемом явлении. Можно целую жизнь положить на попытки отловить обыкновенную землеройку-бурозубку весом 2.5 г, но так и не собрать выборку, доста­точную по объему, чтобы это реализовать (миллионы особей). Для практического понимания достаточно знать, что уровень значимости – это приблизительная вероятность ожидаемой ошибки наших вы­водов. И с этой позиции 5% – достаточно мало. Использование доверительной вероятности и уровня значимости можно назвать теоретической базой разумного ограничения времени и масштабов ис­следования, позволяющей получить достоверную общую ин­формацию за счет исключения ничтожной доли частной.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: